Anthropic представила Claude Sonnet 3.5: бюджетная модель, догнавшая флагман Opus

Компания Anthropic анонсировала Claude Sonnet 5 — новую языковую модель, ключевым приоритетом которой стала агентная деятельность. Как заявляют разработчики, новинка совершила качественный скачок в способности выстраивать алгоритмы действий, взаимодействовать с внешними инструментами и писать программный код, практически вплотную приблизившись по своим функциональным возможностям к премиальной модели Claude Opus 4.8.

В Anthropic подчеркивают, что именно линейка Sonnet стала эталоном для создания ИИ-агентов — автономных систем, способных самостоятельно оперировать браузером, терминалом, API-интерфейсами и другим прикладным ПО. Если раньше пальму первенства в этой нише удерживали более ресурсоемкие модели Opus, то с выходом Claude Sonnet 5 этот разрыв был практически нивелирован.

Ключевые улучшения коснулись четырех аспектов: глубины логического анализа, навыков программирования, работы с внешними интерфейсами и исполнения многоступенчатых сценариев. Внутренние тесты Anthropic подтверждают заметный прогресс относительно версии Sonnet 4.6: новая модель по ряду параметров сопоставима с Opus 4.8, при этом демонстрируя гораздо более высокую экономическую эффективность.

Anthropic представила Claude Sonnet 3.5: бюджетная модель, догнавшая флагман Opus
Источник: Anthropic

Эффективность модели подтверждается специализированными бенчмарками, такими как BrowseComp (тестирование навигации и анализа веб-данных) и OSWorld-Verified (имитация управления реальной компьютерной средой). В этих испытаниях новинка показала отличный баланс между затратами на вычисления и результативностью.

Пользователи, получившие ранний доступ, отмечают, что Claude Sonnet 5 уверенно справляется с длительными цепочками действий, на которых «спотыкались» предыдущие итерации. Важной особенностью стала способность модели к самоконтролю: ИИ теперь самостоятельно проводит аудит своих действий и исправляет возникшие ошибки, не дожидаясь правок со стороны человека.

Серьезное внимание уделили и вопросам кибербезопасности. Claude Sonnet 5 лучше справляется с фильтрацией вредоносных запросов и эффективнее противостоит попыткам взлома через «инъекции промптов» по сравнению с предшественником. Кроме того, существенно снижена вероятность «галлюцинаций» и слепого подтверждения ложных суждений пользователя.

Источник: Anthropic

В Anthropic поясняют, что модель не обучалась узкоспециализированным методам кибер-атак, поэтому в задачах создания эксплойтов она все еще уступает Claude Opus 4.8. Тем не менее, для новой версии предусмотрена встроенная система защиты от опасных сценариев, активированная по умолчанию.

Claude Sonnet 5 доступна для всех подписчиков сервиса, включая пользователей бесплатного и платного уровней, а также интегрирована в Claude Code и API. В рамках промо-периода, который продлится до 31 августа 2026 года, стоимость использования составляет $2 за миллион входных токенов и $10 за миллион выходных. В дальнейшем тарифы скорректируют до $3 и $15 соответственно.

 

Источник: iXBT

Читайте также