Claude научился самоанализу: ИИ-агенты Anthropic начали самостоятельно исправлять ошибки и совершенствовать свои стратегии

Компания Anthropic презентовала «Dreaming» («Сновидение») — передовой механизм для экосистемы Claude Managed Agents, который наделяет ИИ-агентов способностью к самостоятельной аналитике собственного опыта. Изучая закономерности в ходе выполненных операций, агенты оптимизируют свои стратегии для последующих сессий. Разработчики позиционируют это решение как важный шаг на пути к созданию самокорректирующихся систем, способных совершенствоваться на основе полученного опыта без необходимости дообучения базовой модели.

Анонс был сделан в Сан-Франциско на профильной конференции Code with Claude. В дополнение к Dreaming, в стадию публичного бета-тестирования перешли два инструмента: Outcomes и Multi-Agent Orchestration. Первый обеспечивает автоматизированную верификацию результатов согласно заданным стандартам качества, тогда как второй позволяет эффективно распределять функциональную нагрузку между узкоспециализированными ИИ-агентами.

В центре внимания Anthropic находится именно Dreaming. В отличие от стандартной памяти, фиксирующей лишь хронологию диалога или пользовательские предпочтения, Dreaming функционирует как фоновый процесс глубокого анализа. В «режиме сна» система инспектирует завершенные сессии, выявляя повторяющиеся дефекты и успешные кейсы, после чего систематизирует их в виде структурированных «плейбуков» — персональных методических пособий для будущей работы.

Специалисты Anthropic подчеркивают, что этот процесс не предполагает изменения весов или структуры самой нейросети. ИИ не занимается «самообучением» в буквальном смысле — вместо этого агент генерирует прикладные алгоритмы, которые становятся инструкциями для последующих итераций.

Claude научился самоанализу: ИИ-агенты Anthropic начали самостоятельно исправлять ошибки и совершенствовать свои стратегии
Иллюстрация: Nano Banana

Алекс Альберт, руководитель отдела исследований продуктов Anthropic, сравнил принцип работы системы с накоплением профессиональной экспертизы человеком. Подобно тому как специалист формирует рабочие навыки после реализации сложных проектов, Dreaming автоматически создает аналогичные ментальные модели для ИИ-агентов.

В ходе презентации возможности технологии были продемонстрированы на примере вымышленного аэрокосмического стартапа Lumara, занимающегося разработкой автономных посадочных модулей для Луны. В процессе задействовалась группа агентов, распределявших задачи по выбору площадки, навигации и контролю миссии. После серии неудачных симуляций была активирована система Dreaming: проанализировав логи за ночь, она составила детальный «плейбук посадки», что привело к существенному росту эффективности работы системы на следующий день.

По мнению Anthropic, такой подход устраняет критическую проблему современных ИИ-агентов — снижение качества при выполнении длительных и многоступенчатых задач. Отдельный агент-верификатор, работающий в «чистом» контексте, зачастую более эффективно обнаруживает ошибки, чем модель, перегруженная длинной цепочкой рассуждений.

Параллельно компания делает ставку на мультиагентные архитектуры. Multi-Agent Orchestration позволяет главному управляющему агенту делегировать задачи профильным исполнителям, каждый из которых располагает собственными контекстными окнами и инструментарием. Этот подход признан более результативным, чем попытка удержать весь объем сложности задачи в рамках одной диалоговой сессии.

CEO Anthropic Дарио Амодеи в рамках конференции отметил, что реальные темпы развития компании значительно превзошли прогнозы: вместо запланированного десятикратного роста спрос и выручка увеличились почти в 80 раз в годовом исчислении, что привело к острому дефициту вычислительных ресурсов.

Также стало известно о заключении партнерского соглашения со SpaceX, направленного на масштабирование инфраструктуры через дата-центр Colossus.

Стратегия Anthropic очевидна: компания делает ставку на то, что ключевым преимуществом ИИ-платформ будущего станет не только «интеллект» модели, но и способность к надежной автономной работе в долгосрочных производственных циклах за счет механизмов памяти, самоанализа и кумулятивного обучения.

 

Источник: iXBT

Читайте также