На этот раз мы расскажем о событиях далекого прошлого.
А именно про Mundaneum – работающий бумажный интернет Поля Отле. 100 лет назад он уже обрабатывал 1500 поисковых запросов в год со всего мира. Это было за 55 лет до того, как Тед Нельсон представил гипертекст, за 79 лет до рождения Всемирной паутины и на 84 года раньше появления W3Catalog.
Прочитайте несколько принципов работы поисковой системы Поля Отле. Знакомо?
-
Книга – надёжный, но неудобный источник информации, поскольку требует длительного поиска ответа на конкретный вопрос.
-
Документы, содержащие ответы на вопросы пользователей, должны быть небольшими, удобного универсального формата.
-
Документы должны ссылаться друг на друга, раскрывая информацию и дополняя её.
-
Нужно индексировать разные источники. Не только книги и справочники, но и фотографии, прессу и даже открытки. Соответственно, в результатах поиска могут быть не только текстовые документы, но и медийные.
-
Запрос пользователя должен быть вначале обработан до универсального, в виде ключевых слов – а по ним уже должен идти поиск.
В соответствии с ними и работал Mundaneum. Это проект, опередивший своё время по всем фронтам – и морально, и технологически. Тем удивительнее, что это была не просто идея, а работающая система. Причём проект действовал с разной мощностью целых 29 лет – с 1910 по 1939-й.
Самое обидное, что его нельзя назвать дедушкой интернета и поисковых систем. Mundaneum был заброшен к началу Второй мировой войны, вскоре умер его создатель, а большинство идей не получили дальнейшей жизни и разрабатывались независимо от него другими учеными. Впрочем, обо всём – по порядку.
Кто такой Поль Отле
Утомлять биографическими подробностями не будем, но кое-что важно упомянуть для понимания. Поль родился в 1868 году в Брюсселе. Он не получал классического школьного образования, рос среди книг и учился на дому. Соответственно, и классических установок о границах возможного ему тоже не дали. Впоследствии он выучился на юриста в Брюссельском свободном университете, но работа по специальности была недолгой.
В 24 года Поль написал свою первую значимую научную работу. В виде эссе он высказал критику в адрес библиотечной системы и выдвинул тезис о том, что книга в её классическом виде должна перестать быть основным источником знания.
В эти же годы он познакомился с другим юристом, будущим лауреатом Нобелевской премии мира, Анри Лафонтеном. Он также посвятил жизнь не столько юриспруденции, сколько вопросам систематизации больших данных.
С чего началась работа по созданию поисковой системы
Вместе ученые основали первый в мире Международный институт библиографии (Repertoire Bibliographique Universel). Работа в нём еще раз подтвердила правильность выводов, изложенных в эссе: правильная система классификации данных – залог их успешного использования.
В частности, Отле и Лафонтен разработали систему категоризации, которая и сейчас используется во многих библиотеках – Универсальную десятичную классификацию (УДК). Она не была полностью их разработкой – что-то было позаимствовано из чужих научных работ. В частности, десятичная классификация была взята у американца Мелвила Дьюи, а фасетная – у индийца Ш.Р. Ранганатана. Однако они были первыми, кто собрал это в единую систему и реализовал её на практике.
Система основана на десятичных кодах и специальных знаках для уточнения области знания. Например, вот так выглядит часть оглавления верхнего порядка:
Есть также синтаксис запросов, который включает более 20 символов. Например, 1+2 – это объединение: «Философия, психология, религия и теология».
А если углубляться в один из разделов, классификация будет выглядеть вот так:
004 – Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем
004.4 – Программные средства
004.43 – Языки программирования
004.436 – Дескриптивные языки
004.436.2 – Языки описания аппаратных средств
Какую проблему предстояло решить
Введение карточек упростило и ускорило поиск нужной книги в библиотеке, но главный проект был впереди. Предстояло выйти за границы книг и сделать информацию доступной по конкретному запросу.
Отле поставил непомерно амбициозную для своего времени задачу. Она звучала так: наладить быстрый (в рамках существующих технологий) доступ к любой информации для любого жителя планеты. Очевидно, что для этого требовалось изрядное финансирование, и удача улыбнулась учёным в 1910 году.
Идея показалась брюссельскому правительству перспективной, был выделен бюджет и достаточно большое помещение под рабочие офисы и картотеку. В 1910 году Отле и Лафонтен представили миру Mundaneum – архив для хранения уже не книг, а информационных карточек.
Как выглядела реализация
Mundaneum был разделен на 2 части. Самая большая – архив, в котором хранились десятки тонн бумажных носителей в виде карточек. Одна карточка содержала сжатую информацию на одну узкую тему. Для быстрого поиска по всем материалам как раз применялась УДК. В архив регулярно поступала свежая информация – не только для пополнения карточек, но и для хранения справочников, газет, фотографий и даже плакатов.
Вновь пришедшие материалы обрабатывались сотрудниками Mundaneum, на их основе создавались новые карточки и дополнялись старые, а также создавались связи между ними с помощью синтаксиса УДК. К 1920 году в архиве было 12 залов, 12 млн карточек и больше 200 тысяч других материалов.
Запросы от клиентов приходили по почте. Каждый запрос обрабатывали вручную. Его переводили на французский, сокращали до ключевых слов, необходимых для поиска, и передавали для поиска ответа. Далее сотрудники, используя картотеку, находили нужные карточки, копировали их, переводили на язык оригинала запроса и отправляли обратно.
Спрашивать можно было о чем угодно – от рецепта пирога до истории правящей испанской династии. Уже в 1912 году Mundaneum обрабатывал около 1500 запросов в год. Вероятно, Отле был бы искренне удивлён, если бы узнал, что ему удалось на минимальной технологической базе создать все элементы поисковой системы.
Пока запросов было немного, система надежно работала. Первые сбои стали появляться с ростом их числа. И неудивительно – вся работа Mundaneum была основана на ручном труде. УДК помогала работе и упрощала её, но не более того. Не сильно помогло даже расширение штата. Проблемы вызывало еще и то, что количество ежегодно поступающей новой информации увеличивалось, и сотрудникам приходилось заниматься не только обработкой запросов, но и пополнением архива.
Исходя из этого, Отле пришёл к выводу, что бумажные носители информации, как и связь посредством почты, устарели. После чего он приступил к разработке улучшенной системы на базе телекоммуникационных технологий. В 1934 году вышли две его работы: «Monde» («Мир») и «Traité de documentation» («Характеристика документации»).
Стимпанк-версия интернета
Прежде чем читать этот текст, напомним и подчеркнем: это 1934 год. 88 лет назад. До появления первой программируемой цифровой машины Z1 – 4 года. 12 лет до изобретения транзистора.
Всё во вселенной будет описано и задокументировано. В этом виде мы зафиксируем меняющуюся картину мира, настоящее отражение его памяти. Любой человек сможет удаленно, в виде проекции на экране, читать только тот текст, который соответствует его интересам. Из своего кресла каждый сможет видеть весь мир целиком и отдельные его части.
Закон упорядочивания информации, изложенный в «Traité de documentation», говорил о том, что документы нельзя понимать в отдельности от других – его смысл становится понятным только через влияние на другие документы.
В «Monde» была описана сеть для обмена данных. «Телефонокниги» описывались как персональные устройства, соединенные через телефонную сеть. Через неё пользователи могли бы получать доступ к данным Mundaneum, просматривать текст и изображения, создавать и распространять собственные документы, а также общаться друг с другом.
В книгах были описаны также прообразы сканеров, планшетов и даже виртуальной реальности. Однако блестящие задумки не смогли спасти Mundaneum. По мере увеличения числа запросов система все чаще стала давать сбои. Все идеи Отле, изложенные в его научных трудах, могли бы решить эти проблемы, но для них в мире не было соответствующей материально-технической базы.
Эти сложности, а также растущее напряжение между странами Европы привели к тому, что в 1934 году правительство решило прекратить финансирование Mundaneum. До 1939 года система продолжала работать в меру финансовых возможностей ее создателей – и окончательно остановилась после того, как немцы вошли в Брюссель.
Как сейчас выглядит Mundaneum
После смерти Отле в 1944 году остатки Mundaneum несколько лет перемещали из одного помещения в другое, пока они не остались лежать невостребованными в старом здании Свободного университета.
Только в начале 90-х начались работы по восстановлению оригинальной системы. Профессор Рейвард из университета Чикаго, который защищал диссертацию по работе Поля Отле, решил возродить проект в виде музея.
Задумка удалась – незадолго до конца ХХ века он был открыт. А в 2012 году в знак заслуг Отле Google объявил о сотрудничестве с возрожденным Mundaneum.