Проект Wikiverse: визуализация информационной вселенной Википедии

Проект Wikiverse: визуализация информационной вселенной Википедии

Википедия — огромный информационный ресурс, где есть ответы на очень многие вопросы. Здесь можно начать с поиска ответа на вопрос о способах колонизации Марса и закончить изучением статьи о головоногих моллюсках Мексиканского залива. Статьи связаны друг с другом, определение того либо иного незнакомого термина, встретившегося в статье, можно найти, просто кликнув по самому термину. В большинстве случаев имена собственные, термины, названия видов животных и растений залинкованы со статьями, где рассказывается, что это такое.

Авторы проекта Wikiverse решили наглядно показать связи между разделами, подразделами и отдельными статьями Википедии. Для этого была создана визуальная модель информационной вселенной Википедии. Вся онлайн-энциклопедия (англоязычная версия) представлена в виде шара, внутри которого размещаются созвездия и кластеры созвездий — статьи схожей тематики. Это могут быть материалы об определенном времени истории человечества, изобразительном искусстве, сфере технологий или любых других темах.

Автором проекта является французский программист Оуэн Корнек (Owen Cornec). Он начал формирование «Вики-вселенной» с 50 тысяч статей, постепенно доведя их количество до 250000. Корнек говорит о своем проекте следующее: «В этой вселенной статьи связаны физически при помощи программной симуляции. Миллионы залинкованных друг на друга страниц, созданные тысячами редакторов ресурса, формируют „созвездия“. Статьи схожих тематик показываются в виде кластеров». Например, вокруг «звезды» Уильяма Шекспира располагаются статьи о его работах, жизни, театре «Глобус». Рядом располагается и материал о сериале MTV «Фальсификация». Чем сильнее залинкованы отдельные статьи, тем ближе они находятся друг к другу.

Просчет трехмерной сферы, построенной на основе всех материалов Википедии занял бы слишком много времени. Поэтому создатель проекта ограничился 5% информации, которая содержится в англоязычной Вики. Кроме этой модели выбрать можно и менее сложные — маленькую (1% всех статей) и среднюю (2%). Wikiverse, по задумке ее создателя, может использоваться не только в качестве развлечения, но и как аналитический инструмент.

В комментариях на Reddit некоторые пользователи упомянули о собственных попытках проследить связи между разными статьями Википедии. Правда, у такого отслеживания не научная, а игровая цель. Задача проста — нужно найти материал о том либо ином человеке, начав с любой случайной статьи онлайн-энциклопедии за минимальное количество шагов. Как оказалось, всего за 4-5 кликов можно дойти от статьи о пирожных или тортах до материала о Христе или Гитлере.

Источник

анализ данных, википедия, онлайн-экнциклопедия, связи

Читайте также