Компания Anthropic анонсировала Claude Sonnet 5 — новую языковую модель, ключевым приоритетом которой стала агентная деятельность. Как заявляют разработчики, новинка совершила качественный скачок в способности выстраивать алгоритмы действий, взаимодействовать с внешними инструментами и писать программный код, практически вплотную приблизившись по своим функциональным возможностям к премиальной модели Claude Opus 4.8.
В Anthropic подчеркивают, что именно линейка Sonnet стала эталоном для создания ИИ-агентов — автономных систем, способных самостоятельно оперировать браузером, терминалом, API-интерфейсами и другим прикладным ПО. Если раньше пальму первенства в этой нише удерживали более ресурсоемкие модели Opus, то с выходом Claude Sonnet 5 этот разрыв был практически нивелирован.
Ключевые улучшения коснулись четырех аспектов: глубины логического анализа, навыков программирования, работы с внешними интерфейсами и исполнения многоступенчатых сценариев. Внутренние тесты Anthropic подтверждают заметный прогресс относительно версии Sonnet 4.6: новая модель по ряду параметров сопоставима с Opus 4.8, при этом демонстрируя гораздо более высокую экономическую эффективность.

Эффективность модели подтверждается специализированными бенчмарками, такими как BrowseComp (тестирование навигации и анализа веб-данных) и OSWorld-Verified (имитация управления реальной компьютерной средой). В этих испытаниях новинка показала отличный баланс между затратами на вычисления и результативностью.
Пользователи, получившие ранний доступ, отмечают, что Claude Sonnet 5 уверенно справляется с длительными цепочками действий, на которых «спотыкались» предыдущие итерации. Важной особенностью стала способность модели к самоконтролю: ИИ теперь самостоятельно проводит аудит своих действий и исправляет возникшие ошибки, не дожидаясь правок со стороны человека.
Серьезное внимание уделили и вопросам кибербезопасности. Claude Sonnet 5 лучше справляется с фильтрацией вредоносных запросов и эффективнее противостоит попыткам взлома через «инъекции промптов» по сравнению с предшественником. Кроме того, существенно снижена вероятность «галлюцинаций» и слепого подтверждения ложных суждений пользователя.

В Anthropic поясняют, что модель не обучалась узкоспециализированным методам кибер-атак, поэтому в задачах создания эксплойтов она все еще уступает Claude Opus 4.8. Тем не менее, для новой версии предусмотрена встроенная система защиты от опасных сценариев, активированная по умолчанию.
Claude Sonnet 5 доступна для всех подписчиков сервиса, включая пользователей бесплатного и платного уровней, а также интегрирована в Claude Code и API. В рамках промо-периода, который продлится до 31 августа 2026 года, стоимость использования составляет $2 за миллион входных токенов и $10 за миллион выходных. В дальнейшем тарифы скорректируют до $3 и $15 соответственно.
Источник: iXBT


