Учёные из Университета Калифорнии в Сан-Диего установили, что некоторые современные нейросети могут искусно выдавать себя за людей.
В серии экспериментов, основанных на традиционном тесте Тьюринга, модели GPT-4.5 и Llama 3.1–405B показали впечатляющую способность в стандартном трехстороннем тесте Тьюринга, в то время как GPT-4o не смогла справиться с заданием.
В ходе исследования участники общались с человеком и одной из систем в течение пяти минут, после чего пытались определить, кем был их собеседник. Эксперименты проводились в форме светских бесед, при этом акцент ставился на эмоциональные аспекты общения. Участники могли задавать вопросы, касающиеся мнений, чувств и переживаний.

Результаты теста показали, что GPT-4.5 чаще принимали за человека, чем реального человека — её показатель достиг 73%. Llama 3.1–405B получила 56%, а GPT-4o – лишь 21%.
Если участники эксперимента не в состоянии отличить человека от машины, это свидетельствует о том, что машина успешно преодолела тест Тьюринга. Таким образом, GPT-4.5 и Llama 3.1–405B продемонстрировали выдающийся уровень имитации человеческого общения.
Авторы исследования
Тест Тьюринга, разработанный Аланом Тьюрингом в 1950 году, оценивает способность машины имитировать человеческий интеллект. Если люди не в состоянии отличить её ответы от человеческих, система считается успешно прошедшей данное испытание.
Источник: iXBT