Где только не применяют нейросети — от интернета вещей до распознавания текстов, в том числе древних рукописей. В этот раз машинное обучение помогло разобраться в свитках из Иудейской пустыни.
Почему такой интерес к рукописям? Долгое время богословы и историки спорили об авторстве Великого свитка пророка Исайи, датируемом вторым веком до нашей эры. Это один из самых древних в мире сохранившихся текстов (ему больше 2 тыс. лет) из книг Ветхого Завета. Нейросеть помогла ученым идентифицировать двух составителей.
Сложность идентификации
Изучением древних библейских рукописей занимается палеография — наука об эволюции графических форм букв. Одна из центральных проблем этой науки — персонализация личности писателя с помощью характерных для его письма «маркеров». Почему это сложно? В античности стиль письма у всех авторов был слишком похожим, все стремились к единообразию. Проблему стали плотно изучать ученые из Нидерландов в рамках проекта «The Hands that Wrote the Bible» (дословно — «Руки, которые написали библию»).
Ученые из Гронингенского университета занимались идентификацией писцов с помощью нейросети. Они планировали узнать, сколько людей составляли Великий свиток Исайи.
С помощью нейросети выделили стилевые признаки авторов, отделив чернила от пергамента. Затем начертательные элементы преобразовали в графические векторы букв. С помощью нейронной сети отследили переходы стиля написания букв в разных столбцах.
Образцы символов сравнили с рандомными знаками из рукописи и соседними буквами. На следующем этапе подключили визуальный анализ — для этого создали тепловые карты для распознавания образов.
В результате исследования получили две группы однородных элементов с зафиксированными отличиями в стиле письма. Причем буквы не были разбросаны хаотично по тексту, а концентрировались в его начале и конце. Ученые говорят, что изменения происходят примерно на 27 столбце, то есть почти на половине текста. После 27 столбца рукопись прерывается, идут три пустые строки. Потом она продолжается. И вот есть доказательства — продолжает ее другой автор.
Также ученые выяснили, что второй писец создавал текст менее «чисто», допускал больше вариаций написания букв. Но пока это все, что известно об авторах. Что их связывает и почему они создавали текст сообща — неизвестно.
Провести подобную диагностику без машинного обучения было почти нереально. Стиль письма во всей рукописи однородный, отличия на глаз не видны. Так, представьте, буква «алеф» א встречается в рукописи 5 тыс. раз. Человеческий глаз не способен отличить минимальные отклонения в ее написании и выявить закономерности.
Что представляет собой список?
В середине прошлого века на Западном берегу Мертвого моря были обнаружены древние еврейские рукописи. Древние заметки находили пастухи-бедуины в различного рода пещерах. Великий свиток пророка Исайи найден среди семи первых в 1947 году в пещере под номером 1Q.
Вход в пещеру, где обнаружены рукописи
Основные характеристики списка:
- 734 см — длина пергамента свитка;
- 27 см — ширина пергамента свитка;
- 54 колонки текста содержит документ;
- 66 глав Книги пророка Исайи (The Book of Isaiah) содержит документ;
- 125 г. до н.э. — предполагаемая дата составления рукописи.
Почему важно знать авторство?
Культура подписи не была закреплена в античности, потому многие найденные раритеты того времени обезличены. Так же вышло с Великим свитком Исайи. Однако сведения о текстах того времени приоткрыли бы завесы тайны над культурой, правилами, техникой создания литературных произведений. Кроме того, многие книги превратились в библейские, однако принцип и каноны религиозных текстов также не до конца изучены.
Возможно, в дальнейшем технологии позволят изучить многие древние письмена на микроуровне, чтобы определить место обучения писцов, а потом их происхождение и личности.