Opus 4.7: провальный релиз в истории Anthropic?

Недавно Борис Черный опубликовал разбор того, как выжать максимум из актуальной Opus 4.7. В материале есть дельные советы, но автор упустил из виду критически важный момент: это обновление в корне меняет привычные механизмы взаимодействия с моделью.

Anthropic подготовили руководство по миграции, которое большинство проигнорирует. А зря. Вот три ключевых изменения, способных мгновенно дестабилизировать ваши рабочие процессы:

  1. Параметр budget_tokens теперь провоцирует ошибку 400.

  2. Новый токенизатор потребляет на 35% больше токенов для идентичного контента.

  3. Токены размышлений (thinking tokens) теперь скрыты по умолчанию.

Разберем эти перемены детальнее.


1. Проблема с budget_tokens

Если в вашем коде заложено нечто подобное:
thinking={"type": "enabled", "budget_tokens": 32000}
…то при работе с Opus 4.7 вы гарантированно получите ошибку 400 Bad Request. Без предупреждений, без уведомлений о прекращении поддержки — модель просто отказывается работать.

Для тех, кто интегрировал Opus в высоконагруженные системы, это серьезная помеха: ручное управление бюджетом на «размышления» для контроля затрат более недоступно.

Альтернативный синтаксис:
thinking={"type": "adaptive"}
output_config={"effort": "xhigh"}

Предусмотрены уровни интенсивности (effort): low, medium, high, xhigh (новый показатель) и max.

Важный нюанс: в Opus 4.7 адаптивное мышление отключено по умолчанию. Модель будет выдавать ответы «на лету», без глубокого анализа. Будьте предельно внимательны при миграции с версии 4.6 — без соответствующей настройки качество ответов может заметно снизиться.


2. Аппетиты токенизатора выросли

Хотя стоимость за токен осталась прежней, а контекстное окно сохранило объем в 1 млн токенов, дьявол кроется в деталях.

Обновленный токенизатор расходует в 1.35 раза больше токенов на тот же самый объем текста.

Пользователи все чаще сообщают о преждевременной потере контекста (context rot). Фактически, затраты выросли, а реальная польза осталась под вопросом. Не стоит слепо доверять маркетинговым бенчмаркам.

Последствия для бизнеса:

  • Ваши текущие жесткие лимиты контекста стали некорректными.

  • Клиентские инструменты для оценки объема токенов выдают ошибочные данные.

  • Счета за API неизбежно возрастут при той же интенсивности запросов.

3. «Скрытые» расходы на размышления

Это наиболее спорное новшество.
Если в Opus 4.6 блоки размышлений по умолчанию были доступны в формате дайджеста, то в версии 4.7 их статус изменился на «исключено» (omitted).

В ответе блоки thinking визуально выглядят пустыми, но вы все равно оплачиваете их в полном объеме.

В официальной документации Anthropic указано: «Списание средств за токены размышлений происходит в любом случае. Скрытие текста лишь минимизирует задержку, но не стоимость услуги».

Итог: в счетах появятся позиции, содержимое которых вы даже не видите.


Деградация работы с длинным контекстом

Результаты тестирования MRCR v2 (способность удерживать контекст в 1 млн токенов):

  • Opus 4.6: 78.3%

  • Opus 4.7: 32.2%

Это регресс на 46 процентных пунктов в рамках собственного бенчмарка Anthropic.

Попытки защитить эти изменения выглядят неубедительно, и сообщество разработчиков в X уже отреагировало крайне скептично. Скорее это выглядит как шаг назад.


Реальная эксплуатация: отзывы разработчиков

Обратная связь от пользователей крайне негативная.

Среди жалоб: галлюцинации стали нормой:

  • Модель выдумывает коллег и детали, которых не существовало.

  • Модель открыто признается в генерации абсурдных данных.

  • Игнорирование системных инструкций и предпочтений пользователя.

Складывается впечатление, что модель работает «на отвали», стараясь быстрее завершить сессию.


Иллюзия «щедрости» с лимитами

На волне негатива Anthropic анонсировали расширение лимитов на запросы.

Здесь я сохраняю скепсис: конкретных метрик не предоставлено. Даже при увеличении лимитов на 35%, это лишь компенсирует возросшее потребление токенов новой версией, не давая реального прироста производительности.


Что предпринять?

Если располагаете 5 минутами:
Просканируйте кодовую базу на предмет budget_tokens. Для задач по программированию замените параметры на effort: xhigh (актуально и для Claude Code).

Если есть 15 минут:
Ознакомьтесь с актуальными примечаниями к релизу и руководством по миграции, иначе счета за использование API могут стать неприятным сюрпризом в конце месяца.

 

Источник

Читайте также