GPT-4.5 обошел людей в упрощенном тесте Тьюринга

В ходе недавнего исследования, проведенного Калифорнийским университетом в Сан-Диего, нейросеть GPT-4.5 продемонстрировала поразительную способность имитировать живое человеческое общение. В рамках модифицированного теста Тьюринга модель настолько эффективно воспроизводила манеру переписки, что наблюдатели чаще принимали ее за реального человека, нежели самих людей-участников.

Методология эксперимента базировалась на трехстороннем взаимодействии: судьи вели диалоги одновременно с живым человеком и с ИИ, не имея никаких подсказок относительно личности собеседника, кроме самого текста сообщений. Задача заключалась в том, чтобы на основе качества и характера ответов вычислить, кто из них является человеком.

Результаты оказались показательными: при использовании заданного «персонажа» GPT-4.5 была идентифицирована как человек в 73% случаев. Модель LLaMa-3.1-405B* также продемонстрировала высокие показатели, убедив собеседников в своей «человечности» в 56% диалогов. Эксперты подчеркивают, что именно внедрение персонализированного контекста стало ключевым фактором, позволившим алгоритмам выйти на столь высокий уровень мимикрии.

Хотя традиционный тест Тьюринга часто воспринимается как попытка доказать наличие у машины разума, в данном контексте он служит лишь индикатором поведенческой достоверности, подтверждая, что ИИ научился мастерски копировать паттерны естественного общения.

GPT-4.5 обошел людей в упрощенном тесте Тьюринга
Источник: Pexels

Ученые акцентируют внимание на том, что подобные успехи не свидетельствуют о наличии у моделей сознания или глубокого понимания контекста — это результат филигранного воспроизведения социальных алгоритмов речи. Тем не менее, грань, позволяющая отличить машину от человека в текстовом чате, становится все более призрачной.

Такие возможности ИИ могут быть применены в самых разных сферах — от служб поддержки и образовательных ресурсов до социальных медиа и политических дискуссий, где фактор доверия к собеседнику имеет критическое значение.

Авторы работы настаивают на необходимости обязательной маркировки ИИ-агентов. По их мнению, когда технологии достигают такой степени имитации, прозрачность коммуникаций перестает быть чисто технической задачей, превращаясь в фундаментальный вопрос общественной безопасности.

Итоги исследования подтверждают: хотя ИИ по-прежнему лишен истинного понимания сути вещей, он уже научился создавать крайне убедительную иллюзию человеческого присутствия в диалоге, по крайней мере, в рамках кратковременных контактов.

* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена

 

Источник: iXBT

Читайте также