Opus 4.7: провальный релиз в истории Anthropic?

1 час назад

Недавно Борис Черный опубликовал разбор того, как выжать максимум из актуальной Opus 4.7. В материале есть дельные советы, но автор упустил из виду критически важный момент: это обновление в корне меняет привычные механизмы взаимодействия с моделью.

Anthropic подготовили руководство по миграции, которое большинство проигнорирует. А зря. Вот три ключевых изменения, способных мгновенно дестабилизировать ваши рабочие процессы:

Параметр budget_tokens теперь провоцирует ошибку 400.
Новый токенизатор потребляет на 35% больше токенов для идентичного контента.
Токены размышлений (thinking tokens) теперь скрыты по умолчанию.

Разберем эти перемены детальнее.

1. Проблема с budget_tokens

Если в вашем коде заложено нечто подобное:
thinking={"type": "enabled", "budget_tokens": 32000}
…то при работе с Opus 4.7 вы гарантированно получите ошибку 400 Bad Request. Без предупреждений, без уведомлений о прекращении поддержки — модель просто отказывается работать.

Для тех, кто интегрировал Opus в высоконагруженные системы, это серьезная помеха: ручное управление бюджетом на «размышления» для контроля затрат более недоступно.

Альтернативный синтаксис:
thinking={"type": "adaptive"}
output_config={"effort": "xhigh"}

Предусмотрены уровни интенсивности (effort): low, medium, high, xhigh (новый показатель) и max.

Важный нюанс: в Opus 4.7 адаптивное мышление отключено по умолчанию. Модель будет выдавать ответы «на лету», без глубокого анализа. Будьте предельно внимательны при миграции с версии 4.6 — без соответствующей настройки качество ответов может заметно снизиться.

2. Аппетиты токенизатора выросли

Хотя стоимость за токен осталась прежней, а контекстное окно сохранило объем в 1 млн токенов, дьявол кроется в деталях.

Обновленный токенизатор расходует в 1.35 раза больше токенов на тот же самый объем текста.

Пользователи все чаще сообщают о преждевременной потере контекста (context rot). Фактически, затраты выросли, а реальная польза осталась под вопросом. Не стоит слепо доверять маркетинговым бенчмаркам.

Последствия для бизнеса:

Ваши текущие жесткие лимиты контекста стали некорректными.
Клиентские инструменты для оценки объема токенов выдают ошибочные данные.
Счета за API неизбежно возрастут при той же интенсивности запросов.

3. «Скрытые» расходы на размышления

Это наиболее спорное новшество.
Если в Opus 4.6 блоки размышлений по умолчанию были доступны в формате дайджеста, то в версии 4.7 их статус изменился на «исключено» (omitted).

В ответе блоки thinking визуально выглядят пустыми, но вы все равно оплачиваете их в полном объеме.

В официальной документации Anthropic указано: «Списание средств за токены размышлений происходит в любом случае. Скрытие текста лишь минимизирует задержку, но не стоимость услуги».

Итог: в счетах появятся позиции, содержимое которых вы даже не видите.

Деградация работы с длинным контекстом

Результаты тестирования MRCR v2 (способность удерживать контекст в 1 млн токенов):

Opus 4.6: 78.3%
Opus 4.7: 32.2%

Это регресс на 46 процентных пунктов в рамках собственного бенчмарка Anthropic.

Попытки защитить эти изменения выглядят неубедительно, и сообщество разработчиков в X уже отреагировало крайне скептично. Скорее это выглядит как шаг назад.

Реальная эксплуатация: отзывы разработчиков

Обратная связь от пользователей крайне негативная.

Среди жалоб: галлюцинации стали нормой:

Модель выдумывает коллег и детали, которых не существовало.

Модель открыто признается в генерации абсурдных данных.

Игнорирование системных инструкций и предпочтений пользователя.

Складывается впечатление, что модель работает «на отвали», стараясь быстрее завершить сессию.

Иллюзия «щедрости» с лимитами

На волне негатива Anthropic анонсировали расширение лимитов на запросы.

Здесь я сохраняю скепсис: конкретных метрик не предоставлено. Даже при увеличении лимитов на 35%, это лишь компенсирует возросшее потребление токенов новой версией, не давая реального прироста производительности.

Что предпринять?

Если располагаете 5 минутами:
Просканируйте кодовую базу на предмет budget_tokens. Для задач по программированию замените параметры на effort: xhigh (актуально и для Claude Code).

Если есть 15 минут:
Ознакомьтесь с актуальными примечаниями к релизу и руководством по миграции, иначе счета за использование API могут стать неприятным сюрпризом в конце месяца.

Источник