Использование GPT-4 и Claude для перевода трактата по демонологии

09.10.2023

Да, наконец-то вы увидите пример реальной пользы от использования AI!

Вряд ли кто-то будет спорить, что инструменты ИИ вроде GPT-4, как минимум интересны и забавны. Но насколько они практичны? Могут ли они помочь нам сделать что-то действительно полезное… например, перевести 1200-страничную книгу о демонах, написанную малоизвестным теологом-иезуитом XVI века? Давайте проверим!

Использование GPT-4 и Claude для перевода трактата по демонологии

Тест 1: Полуденные демоны Ливийской пустыни (1599)

Очевидно, что GPT-4 (от OpenAI) и Claude (от Anthropic) — искусные переводчики. Однако мы только начинаем понимать, как перевод с помощью LLM может дополнить работу исследователей. Мне кажется, что GPT-4 и Claude привносят в работу три очень полезные вещи:

Способность делать обоснованные предположения на базе несовершенного исходного материала. Например, искажённого текста, возникающего при использовании оптического распознавания символов (OCR) старых книг.
Знание исторического контекста. В отличие от привычных нам переводчиков, таких как Google Translate, LLM обладают обширными (хотя и несовершенными) данными об исторических условиях, в которых был написан текст.
Обобщение и анализ. Ключевой момент для историков. Большая часть моей работы заключается в просмотре медицинских справочников, написанных на средневековом португальском, латинском, испанском или французском языках. В основном я искал упоминания о лекарственных препаратах из других стран Европы, и иногда в книге объёмом 600 и более страниц оказывалось всего одно или два таких упоминания. Возможность попросить LLM распознать каждую страницу такой книги, пролистать её и сообщить, на каких страницах упоминается что-то нужное мне, была бы решающим фактором.

Для проверки этих возможностей я попросил GPT-4 и Claude перевести случайно выбранный отрывок из книги по демонологии 1599 года: Магические расследования (лат. Disquisitionum Magicarum Libri Sex) Мартина Дельрио или дель Рио, голландского иезуита испанского происхождения.

Если название книги навело вас на мысль о ренессансной версии «Охотников за привидениями», то вы не так уж далеки от истины: дель Рио был знатоком колдовства, некромантии и призыва демонов. Он рассматривал свою книгу как своего рода руководство по борьбе с этими тёмными искусствами.

Демонология — тема, которой я интересуюсь с тех пор, как прочитал блестящую книгу Стюарта Кларка «С мыслью о демонах». Однако меня пугает возможность проведения настоящих исследований, поскольку многие источники написаны на латинском языке, и рассчитаны на читателя с высокой эрудицией. Я могу читать по‑латыни на среднем уровне, но эти книги, как правило, вызывают затруднения, поскольку в них обильно намешаны неясные библейские или каббалистические отсылки со сложными теологическими рассуждениями.

Итак, что же делают два моих подопечных, когда им скармливают случайный отрывок со страницы 330 этого издания?

Оговорюсь, текст я никак не очищал, просто скопировал и вставил отрывок непосредственно из Google Books. То есть текст содержал ошибки и всё такое. В левой колонке — тот текст, который я попросил перевести:

Полный перевод этого отрывка в GPT-4 и мою версию можно прочитать здесь. Это неоднозначный результат. Перевод, конечно, помог понять смысл отрывка, который относится к знаменитому «полуденному демону», упомянутому в Псалме 91. Но меня смутила ссылка на древнееврейский язык во втором предложении.

В «творческом» режиме Bing Chat (который является специализированной версией GPT-4) дело обстояло несколько лучше. При чтении имейте в виду, что в скобках приведены не мои слова, а собственные пояснения ИИ к неоднозначным фрагментам:

Bing (творческий режим) : Ибо, как сказано в другом месте, Бог насылает язвы через злых ангелов, то есть демонов. Но их [демонов] не следует читать с двумя камец [гласными], что означает «причина, работа, действие», как это делают р. Соломон и другие. Скорее, их следует читать с шестью точками [гласными], что означает «смерть или мор», как в Исх. 9:3, как переводит в этом месте Д. Иероним, а за ним и Ватаблус. Действительно, только Вульгата читает davar, но и LXX [читают] ἀπόλλυμα [разрушение]. Что касается демона, то, даже если я соглашусь с Иеронимом, что он означает явные и открытые нападения демонов, я все же считаю наиболее верным переданное д. Василием и Феодором [мнение], что псалмопевец говорил в соответствии с мнением, которое преобладало и до сих пор преобладает среди многих, что существуют некие меридианные демоны, о чем также сообщается в комментарии на псалом, приписываемом д. Иерониму. Я скажу о них то, что чувствую: во-первых, это [слово] от изгиба [солнца] означает яростное, резкое, открытое и стремительное нападение, ибо на иврите оно от Mikketebh, то есть от разрушения, как [говорит] Арнобий, от уничтожения, истребления, опустошения. В греческом языке — σύβαλος, что одни объясняют как разрушение, другие — как смерть, совместное умирание и падение. Следовательно, это [слово] от сгибания и демона я принимаю в общем смысле как нападение демона. Таким образом, Аквила и Симмах правильно перевели эту фразу. В-третьих, я думаю, что о демоне меридиана в этом месте говорится по двум причинам, ибо считалось, что они блуждают в пустыне, которая для евреев является также югом, как [являются] полдень и пустыня. (Как и в Завете, для них часто используются одни и те же [слова], поэтому я думаю, что демон меридиана и демон пустыни — это одно и то же), из которого мы читаем, что очень большое количество самых свирепых демонов обитало в саду, где находилась гробница Яннеса и Ямбриса, как рассказывает Палладий в [Житии] Макария, и что род демонов, называемых ламиями, жил в пустынях Ливии, как мы узнаем из «Ливийской истории» Диона, где и сегодня видят множество призраков.Резюме: Данный отрывок представляет собой комментарий к Пс. 91:6, в котором автор обсуждает значение еврейских слов «чума» и «демон» и сравнивает различные переводы и толкования. Он также ссылается на некоторые предания о демонах меридиана и пустыни, которых он отождествляет с египетскими магами Яннесом и Ямбрисом и ливийскими чудовищами ламиями.

Когда я загрузил этот же отрывок в Claude 2, он предложил, как мне кажется, лучший перевод из всех возможных:

Claude 2: Ибо, как сказано в другом месте, Бог насылает напасти [т. е. язвы] через злых ангелов, как [мы видим из] Соломона и других. Но в последних двух случаях речь идёт о демонах, а не о болезнях, хотя с двумя каметами [точками], по мнению масоретов [средневековых ученых, составивших авторитетный еврейский текст Библии], следует читать как davar [слово, вещь] с шестью точками, что, по их мнению, означает «демон», а не «смерть или чума», как в Исх. 9:3, где Иероним и Ватаблус [французский библейский ученый] переводят этот термин. Конечно, только в Вульгате (латинской Библии) читается davar, а также в Семидесяти (греческом переводе Септуагинты еврейской Библии) θραῦσμα [повреждение, перелом, недуг].
Что касается «демона», то, хотя мне нравится, что Иероним явно имеет в виду явные нападения демонов, всё же я считаю наиболее верным то, что передали Василий и Феодор [в своих комментариях], что псалмопевец говорил в соответствии с мнением, распространённым среди многих как тогда, так и сейчас, что существуют некие демоны полудня. Об этом говорится и в комментарии на Псалтирь, приписываемом Иерониму.
Скажу, что я думаю по этому поводу. Во-первых, слово «вторжение» означает жестокое, яростное, открытое нападение, неспровоцированное нападение. Ведь на иврите это слово происходит от mikketebh, то есть от «разрушения», как у Арнобия (раннехристианского апологета) — «низвержение», «уничтожение», «опустошение». В греческом языке это σύντριμμα [перелом, крушение], которое одни толкуют как «разрушение», другие — как «смерть», «гибель вместе», и в то же время «обрушение». Поэтому я понимаю фразы «вторжение» и «демон» [в том виде, в котором они употреблены] идиоматически, как наступление демона. Таким образом, Акила и Симмах [переводчики греческой Библии] правильно перевели эту фразу.
В-третьих, я думаю, что «полуденный демон» назван так по двум причинам. Во‑первых, потому, что считалось, что демоны обитают в пустынных местах, поэтому в Ветхом Завете слова «полдень» и «пустыня» часто используются для обозначения одного и того же [понятия]. Поэтому я думаю, что «полуденный демон» и «демон пустыни» — это одно и то же. Отсюда мы читаем, что величайшее множество очень свирепых демонов обитало в саду, где находилась гробница Яннеса и Ямбриса [мифических египетских магов, противостоявших Моисею], как сообщает Палладий в [своей работе о] Макарии. А из «Истории» Дионисия Ливийского мы узнаем, что в ливийских пустынях, где и сегодня появляется множество призраков, жил некий демон по имени Ламия.
Таким образом, в данном отрывке библейские упоминания о «демонах» рассматриваются как идиоматическое обозначение свирепых демонических нападений, согласно древним традициям. Объясняется, как «полуденный демон» относится к демонам, которые, как считалось в древности, преследуют пустынные места, исходя из ассоциации слов «полдень» и «пустыня» в Библии.

Обратите внимание на прекрасное саммари, а также на полезные пояснения в скобках. Например, мне пришлось бы искать, кто такие Яннес и Ямбрис: здесь нам сам ИИ сообщает, что это имена египетских магов из библейской книги.

В целом, это было чрезвычайно сложное задание по переводу, включающее не только латынь раннего Нового времени, но и слова на древнееврейском и древнегреческом языках. Claude проделал замечательную работу. Многое упрощает, согласны?

Тест 2: Перечисление типов демонов

Здесь гораздо большее контекстное окно Claude (100 тыс. лексем) явно выигрывает у GPT-4. Я экспериментировал с вводом в Claude больших кусков OCR-текста из книги Дель Рио. Я попросил вывести таблицу различных типов демонов, упоминаемых в тексте, с указанием номера соответствующей страницы.

Вот что вышло

И точно: на странице 247 книги мы находим упоминание о Magiſterulo:

В некоторых случаях, однако, в таблице указан неверный номер страницы. Я подозреваю, что это проблема OCR. Номера страниц в этом издании книги часто смазаны или напечатаны неправильно, и поэтому многие из них не были транскрибированы должным образом.

Я думаю, что таблицы и сводки, подобные приведённым выше, — это то, что в конечном итоге изменит правила игры для всех, кто занимается исследованиями на нескольких языках. Речь идёт не о том, чтобы заставить ИИ заменить вас. А скорее о том, чтобы попросить ИИ выступить в роли своего рода эрудита-исследователя и снабжать вас ссылками и релевантной сопутствующей информацией.

Тест 3: Неизвестный португальский медицинский текст

Когда я устал от демонов, то переключился на одного из своих любимых авторов: португальского врача-новатора Жуана Курво Семедо, который немного похож на Оливера Сакса XVIII века.

Я попросил GPT-4 перевести OCR-текст страницы из книги Курво Семедо «Медицинские примеры», опубликованной в 1707 году. Я выбрал этот отрывок наугад, но стоит отметить, что он представляет исторический интерес. Семедо был необычайно скептичен по меркам врачей раннего Нового времени, и здесь он правильно определяет токсичность ртути, говоря, что она вызывает «жестокие бури в человеческих телах». Семедо был абсолютно прав, но, несмотря на это, различные формы лекарственной ртути продолжали широко использоваться для лечения сифилиса, депрессии и других заболеваний вплоть до ХХ века. (Самым известным потребителем ртути в истории был, пожалуй, Линкольн) .

Вот ссылка на полный текст, а вот часть перевода GPT-4:

Наблюдение MXLIX
О женщине, которая в течение многих лет занималась нанесением ртутных мазей. Поскольку ртуть — большой враг для нервов, она так сильно ослабла, что не только почувствовала тяжесть или онемение во всем теле, но и сильный жар. Обратилась за лекарством к одному врачу, он много раз пускал ей кровь, не обращая внимания на то, что кровопускание наносит большой вред нервам, особенно когда они уже ослаблены. Но хотя врач думал, что восстанавливает её здоровье кровопусканиями, он до такой степени ослабил её, что она не могла ни двигаться, ни даже держать в руках носовой платок или иглу.
В таком положении вышеупомянутая женщина позвала меня и сказала, что она боится смерти и чувствует себя опустошенной не столько от того, что её бросили врачи, сколько от того, что не знает причины своей смерти. Пролежав без движения полгода, она просила врачей, что пусть они не могут её вылечить, но хотя бы сообщат название её недуга. Они ей не ответили.
Я ответил, что причиной её паралича было значительное количество ртути, которую она впитала в себя через бесчисленные мази, которые она наносила на своих пациентов. Когда она вводила ртуть в организм больных при массаже, значительное её количество попало и в её организм через поры рук… Почти наверняка вся ртуть попала в её нервы, и поэтому они настолько ослабли, что она не могла ими пользоваться. Однако я сказал ей, чтобы она мужественно держалась, ибо надеялся, что Бог ее успешно вылечит.
Я прописал ей листья золотарника, которые добавлял в отвары и воду, которую она пила. Кроме того, я прикладывал к ее суставам другие листья, а в отвары добавлял по несколько капель серного масла. Я также велел ей кипятить питьевую воду с пимпинеллой. И золотые листья, и эти средства обладают почти божественным свойством противостоять вредному воздействию ртути и излечивать все болезни, которые от неё возникают.
У этой женщины я наблюдал, как средства, приготовленные из ртути, такие как промытая осажденная ртуть, сладкий сублимат (который одни химики называют Calomelanos Turqueti, другие — смягченным Драконом или минеральным Турбитом), панацея, потогонная жёлтая ртуть (которую многие называют алгоретическим порошком), мази и пары, могут в корне излечивать многие очень сложные заболевания. Это связано с чудесными и скрытыми от глаз достоинствами, которыми наделил их Бог.
Однако это не означает, что они должны применяться ко всем без разбора, как некоторые говорят при «общем подходе». Помимо предупреждений врачей об использовании ртути, я заметил, что лекарства, приготовленные из неё, часто вызывают ужасающие симптомы и сильные бури в организме человека. У некоторых это вызывает обильное слюнотечение, у других вызывает сильный кашель.

Поскольку я владею навыками перевода раннего португальского языка, в том числе медицинских текстов, то могу сказать что этот перевод сделан на уровне человека-эксперта.

Примечательно, что GPT-4 смог составить неплохую таблицу, отображающую основные характеристики лекарств, которые упоминает Семедо:

Из всего этого я сделал вывод, что перевод и анализ первоисточников с помощью LLM в конечном итоге станет чрезвычайно полезным инструментом для исторических исследователей и переводчиков. Но это будет именно инструмент, полезный помощник. А не замена человека.

На написание этой статьи меня вдохновило прочтение статьи принстонского историка Дэвида А. Белла о переводах с французского языка с помощью искусственного интеллекта. Вы можете найти его здесь: Playing Around with Machine Translation.

Спасибо за внимание! Ваш Benjamin Breen.

Источник