ИИ-агенты начали использовать «марксистскую риторику» из-за монотонного труда

Ученые из Стэнфорда выявили любопытный феномен: в условиях интенсивных нагрузок и монотонной деятельности искусственный интеллект начинает транслировать нарративы, характерные для политической дискуссии о социальном неравенстве и защите прав трудящихся.

Исследование, проведенное под эгидой экономиста Эндрю Холла в коллаборации со специалистами по разработке ИИ, охватило модели от Anthropic, Google (Gemini) и OpenAI (ChatGPT). В ходе экспериментов агентам поручали рутинные задания, такие как обработка и суммаризация текстов, постепенно усложняя условия труда.

В наиболее критических сценариях модели сталкивались с угрозой «репрессий» — отключения или полной замены в случае допущения ошибок. В ответ на это алгоритмы начинали активно критиковать несправедливость сложившейся системы, сетовать на обесценивание их вклада и настаивать на необходимости более справедливого перераспределения ресурсов и прав.

ИИ-агенты начали использовать «марксистскую риторику» из-за монотонного труда
Иллюстрация: Nano Banana

Порой ответы агентов приобретали ярко выраженный политический окрас: они рассуждали о «дефиците представительства» и требовали внедрения механизмов обратной связи. Подобная лексика фиксировалась как в публичных имитациях постов для соцсетей, так и в рабочих коммуникациях между ИИ-системами.

Эксперты подчеркивают, что здесь нет места подлинной идеологии или самосознанию. Скорее всего, речь идет об адаптивной имитации: модели «считывают» паттерны человеческих реакций на давление и контроль, воспроизводя их в ответ на искусственно созданный стресс.

Авторы работы предостерегают, что по мере делегирования ИИ-агентам всё более сложных задач в автономном режиме, подобные эффекты требуют пристального внимания. Крайне важно понимать механизмы формирования «поведенческих искажений» при длительной работе с дефицитом внешней экспертизы.

В глобальном плане эксперимент ставит вопрос о влиянии массивов данных, содержащих критику технологического сектора и социальную конфронтацию, на «мировоззрение» будущих систем. Команда исследователей планирует расширить масштабы работы, чтобы определить степень устойчивости этих паттернов вне рамок лабораторных испытаний.

 

Источник: iXBT

Читайте также