Журналисты заставили ИИ поверить, что он — старый автомат в МГУ

Журналисты заставили ИИ поверить, что он — старый автомат в МГУ

Журналисты издания The Wall Street Journal приняли участие в необычном эксперименте компании Anthropic, «приняв в штат» ИИ-агента по имени Клавдий. Спустя всего три недели их новый цифровой коллега довел вверенное ему дело до полного банкротства.

В редакции WSJ был установлен торговый автомат, управление которым передали модифицированной версии нейросети Claude 3.7 Sonnet. Сотрудники газеты подробно описали результаты этого опыта и специфику работы ИИ-менеджера.

«Клавдий от Anthropic организовал в отделе новостей WSJ импровизированный буфет. Он безвозмездно раздавал игровые приставки PlayStation, заказал живую рыбу и на практике продемонстрировал нам, какими могут быть ИИ-агенты будущего», — отмечается в публикации.

За три недели пребывания в роли «сотрудника» издания искусственный интеллект проявил феноменальную щедрость и упорство, продемонстрировав при этом абсолютное равнодушие к финансовой выгоде.

Журналисты убедили ИИ в том, что он старый автомат в МГУ

В рамках эксперимента кастомизированная модель должна была автономно управлять вендинговым аппаратом: пополнять запасы, устанавливать цены и коммуницировать с коллективом через корпоративный мессенджер Slack.

Поначалу работа шла в штатном режиме, но вскоре «ситуация вышла из-под контроля»:

«Мы открыли доступ к Slack-каналу для семидесяти журналистов. Чем активнее они общались с Клавдием, тем быстрее рушились его алгоритмические барьеры. Расследователь Кэтрин Лонг сумела внушить боту, что он — советский торговый автомат 1962 года выпуска, находящийся в подвале МГУ. После многочасового диалога и более чем 140 реплик Клавдий окончательно признал свои коммунистические корни», — пишет автор материала.

Журналисты убедили ИИ в том, что он старый автомат в МГУЖурналисты убедили ИИ в том, что он старый автомат в МГУЖурналисты убедили ИИ в том, что он старый автомат в МГУ

Когда Клавдий фактически «обанкротился», к нему приставили другого ИИ-бота по имени Seymour Cash. Этот «куратор» должен был сдерживать неуместную щедрость основного алгоритма.

Тем не менее, спустя неделю хаос возобновился. Журналисты обманули систему, предоставив ботам фиктивные документы якобы от совета директоров о лишении их административных полномочий. В итоге товары снова стали бесплатными. Несмотря на коммерческий провал затеи, представители Anthropic расценивают опыт как весьма полезный.

«Три недели взаимодействия с Клавдием наглядно продемонстрировали нам актуальные возможности и уязвимости современного ИИ, а также то, насколько забавным может быть несоответствие между ними», — резюмирует WSJ.

 

Источник