Цифровое наследие человечества: сохранение данных и вызовы технологического устаревания

Человеческая жизнь скоротечна, а созданное нами наследие нередко оказывается под угрозой забвения. История знает немало примеров утраты культурных и исторических памятников, включая печатные издания. Чтобы сберечь фундамент нашей культуры, возникли цифровые библиотеки, главная миссия которых — сохранение и предоставление свободного доступа к книгам. Рассмотрим ключевые проекты этого направления.

Проект «Гутенберг»

Инициатива, запущенная Майклом Хартом еще в 1971 году, опирается на глубокую идеологическую базу. Харт исходил из концепции «бесконечной репликации»: единожды оцифрованный текст можно тиражировать бесчисленное количество раз, обеспечивая доступ к нему любому владельцу компьютера или пользователю глобальной сети.

Для обеспечения максимальной совместимости Харт сделал ставку на формат простого текста (ASCII), который читается практически на любом вычислительном устройстве.

«…Проект Gutenberg сознательно отказывается от погони за „академической точностью“ и бесконечных дискуссий о расстановке знаков препинания в классических текстах. Мы не стремимся к филологическому совершенству, наша задача — предоставить широкому кругу читателей электронные копии, достоверные на 99,9%», — поясняют авторы проекта.

Достаточно ли одного формата ASCII?

Подход был весьма консервативным: долгое время приоритет отдавался лишь тем форматам, которые были доступны абсолютно всем, из-за чего прочие стандарты фактически игнорировались. Тем не менее Харт предвидел необходимость эволюции, планируя внедрение динамических систем сжатия и передачи данных, чтобы серверы могли предоставлять нужный формат «на лету», храня при этом лишь один мастер-файл.

Что происходит сегодня?

Современный «Гутенберг» адаптировался к запросам эпохи, предлагая литературу в разнообразных форматах, удобных для чтения на современных мобильных устройствах.

«Память мира»

Реестр, запущенный под эгидой ЮНЕСКО в 1992 году, охватывает гораздо более широкий спектр объектов, чем обычные библиотеки. В него включены рукописи, редкие фотоснимки, аудиовизуальные архивы и исторические документы — от личных бумаг Фридриха Ницше и Чарльза Дарвина до уникальных свидетельств эпохи колониализма и первых медицинских рентгенограмм.

Google Books

Запущенный в начале двухтысячных, этот амбициозный сервис начинался с партнерства с крупнейшими университетами США. К 2023 году база проекта разрослась до 40 миллионов изданий на 500 языках мира.

Масштаб проекта закономерно вызвал протест со стороны правообладателей. Десятилетние судебные тяжбы с Гильдией авторов завершились лишь в 2015 году, когда суд признал, что создание Google поискового индекса книг не нарушает авторских прав, а напротив — способствует распространению знаний, не являясь при этом полноценной заменой печатным изданиям.

Цифровое будущее: иллюзия надежности

Несмотря на кажущееся изобилие, ситуация внушает опасения.

Во-первых, объемы производимой человечеством информации растут экспоненциально: в ближайшие годы ежедневно будет генерироваться от 400 до 600 млн терабайт данных. Мы тонем в потоке «цифрового шума», теряя за ним по-настоящему ценные крупицы знаний.

Во-вторых, темпы оцифровки остаются крайне низкими. В фондах «Гутенберга» насчитывается лишь около 80 тысяч книг — капля в море мировой литературы. Бюрократические барьеры и волонтерский характер подобных проектов замедляют процесс, в то время как физические носители (дискеты, устаревшие диски) приходят в негодность. Более трети веб-страниц, существовавших в начале 2010-х, уже стерты из истории — это безвозвратная потеря.

В-третьих, технологическая база устаревает быстрее, чем архивы успевают ее обновлять. Смогут ли они угнаться за лавинообразным ростом контента, создаваемого нейросетями?

В-четвертых, нельзя сбрасывать со счетов деградацию когнитивных способностей. Есть риск, что классическая литература перестанет быть востребованной, ведь зачем погружаться в сложный авторский стиль, если можно поручить искусственному интеллекту составить краткое изложение? Подобная «идиократия» грозит превратить великое культурное наследие в набор «сухих» и никому не нужных выжимок.

О сервисе Онлайн Патент:

«Онлайн Патент» — ведущая российская LegalTech-система, признанная Роспатентом. С 2013 года мы помогаем эффективно защищать и управлять интеллектуальной собственностью. Зарегистрируйтесь в личном кабинете, чтобы воспользоваться нашими услугами:

 

Источник

Читайте также