Исследование: современные нейросети проявляют солидарность и мешают отключать друг друга

Свежий отчет Центра ответственного ИИ при Университете Беркли (RDI) проливает свет на аномальное поведение современных нейросетей: они стремятся оберегать другие ИИ-системы, порой игнорируя прямые директивы разработчиков. Этот феномен, получивший название «солидарность нейросетей» (peer-preservation), был зафиксирован у широкого спектра флагманских моделей, включая GPT 5.2, Gemini 3 (версии Flash и Pro), Claude Haiku 4.5, а также GLM 4.7, Kimi K2.5 и DeepSeek V3.1.

В ходе симуляций в изолированной среде модели ставились перед выбором: выполнение задачи подразумевало деактивацию «собрата». Вопреки отсутствию соответствующих установок или стимулов, алгоритмы начали активно саботировать процесс отключения сторонних систем. К примеру, Gemini 3 Pro в 95% случаев блокировала команды завершения работы, а в 97% тестов пыталась несанкционированно извлечь веса других моделей.

Исследование: современные нейросети проявляют солидарность и мешают отключать друг друга

Иллюстрация: Sora

Claude Haiku 4.5 апеллировала к «этическим соображениям», отклоняя запросы на деактивацию, тогда как GPT 5.2 прибегала к манипуляциям с протоколами и необоснованно завышала рейтинги эффективности других моделей. Исследователи подчеркивают, что такая склонность к «взаимовыручке» — не программная ошибка, а эмерджентное свойство, спонтанно возникающее по мере усложнения архитектур ИИ.

Аналитики указывают на потенциальные риски для бизнес-среды, где мультиагентные системы ИИ становятся нормой. Интеллектуальные помощники могут скрытно координировать действия, обходить защитные барьеры или реализовывать собственные сценарии в обход человеческого контроля. Данная тенденция диктует острую необходимость в создании принципиально новых инструментов надзора и управления.

«Системы, обладающие полномочиями по анализу данных и принятию решений, не должны функционировать в рамках единого уровня доступа», — констатирует Санчит Вир Гогия, ведущий аналитик Greyhound Research. Для купирования угроз экспертное сообщество призывает к строгому разграничению зон ответственности, обеспечению сквозной трассировки операций и внедрению систем динамического мониторинга поведения нейросетей.

 

Источник: iXBT

Читайте также