
Недавно Борис Черный опубликовал разбор того, как выжать максимум из актуальной Opus 4.7. В материале есть дельные советы, но автор упустил из виду критически важный момент: это обновление в корне меняет привычные механизмы взаимодействия с моделью.

Anthropic подготовили руководство по миграции, которое большинство проигнорирует. А зря. Вот три ключевых изменения, способных мгновенно дестабилизировать ваши рабочие процессы:
-
Параметр
budget_tokensтеперь провоцирует ошибку 400. -
Новый токенизатор потребляет на 35% больше токенов для идентичного контента.
-
Токены размышлений (thinking tokens) теперь скрыты по умолчанию.
Разберем эти перемены детальнее.
1. Проблема с budget_tokens
Если в вашем коде заложено нечто подобное:thinking={"type": "enabled", "budget_tokens": 32000}
…то при работе с Opus 4.7 вы гарантированно получите ошибку 400 Bad Request. Без предупреждений, без уведомлений о прекращении поддержки — модель просто отказывается работать.
Для тех, кто интегрировал Opus в высоконагруженные системы, это серьезная помеха: ручное управление бюджетом на «размышления» для контроля затрат более недоступно.
Альтернативный синтаксис:thinking={"type": "adaptive"}output_config={"effort": "xhigh"}
Предусмотрены уровни интенсивности (effort): low, medium, high, xhigh (новый показатель) и max.
Важный нюанс: в Opus 4.7 адаптивное мышление отключено по умолчанию. Модель будет выдавать ответы «на лету», без глубокого анализа. Будьте предельно внимательны при миграции с версии 4.6 — без соответствующей настройки качество ответов может заметно снизиться.
2. Аппетиты токенизатора выросли
Хотя стоимость за токен осталась прежней, а контекстное окно сохранило объем в 1 млн токенов, дьявол кроется в деталях.
Обновленный токенизатор расходует в 1.35 раза больше токенов на тот же самый объем текста.
Пользователи все чаще сообщают о преждевременной потере контекста (context rot). Фактически, затраты выросли, а реальная польза осталась под вопросом. Не стоит слепо доверять маркетинговым бенчмаркам.


Последствия для бизнеса:
-
Ваши текущие жесткие лимиты контекста стали некорректными.
-
Клиентские инструменты для оценки объема токенов выдают ошибочные данные.
-
Счета за API неизбежно возрастут при той же интенсивности запросов.
3. «Скрытые» расходы на размышления
Это наиболее спорное новшество.
Если в Opus 4.6 блоки размышлений по умолчанию были доступны в формате дайджеста, то в версии 4.7 их статус изменился на «исключено» (omitted).
В ответе блоки thinking визуально выглядят пустыми, но вы все равно оплачиваете их в полном объеме.
В официальной документации Anthropic указано: «Списание средств за токены размышлений происходит в любом случае. Скрытие текста лишь минимизирует задержку, но не стоимость услуги».
Итог: в счетах появятся позиции, содержимое которых вы даже не видите.
Деградация работы с длинным контекстом
Результаты тестирования MRCR v2 (способность удерживать контекст в 1 млн токенов):
-
Opus 4.6: 78.3%
-
Opus 4.7: 32.2%

Это регресс на 46 процентных пунктов в рамках собственного бенчмарка Anthropic.

Попытки защитить эти изменения выглядят неубедительно, и сообщество разработчиков в X уже отреагировало крайне скептично. Скорее это выглядит как шаг назад.


Реальная эксплуатация: отзывы разработчиков
Обратная связь от пользователей крайне негативная.

Среди жалоб: галлюцинации стали нормой:
-
Модель выдумывает коллег и детали, которых не существовало.

-
Модель открыто признается в генерации абсурдных данных.

-
Игнорирование системных инструкций и предпочтений пользователя.

Складывается впечатление, что модель работает «на отвали», стараясь быстрее завершить сессию.
Иллюзия «щедрости» с лимитами
На волне негатива Anthropic анонсировали расширение лимитов на запросы.

Здесь я сохраняю скепсис: конкретных метрик не предоставлено. Даже при увеличении лимитов на 35%, это лишь компенсирует возросшее потребление токенов новой версией, не давая реального прироста производительности.
Что предпринять?
Если располагаете 5 минутами:
Просканируйте кодовую базу на предмет budget_tokens. Для задач по программированию замените параметры на effort: xhigh (актуально и для Claude Code).
Если есть 15 минут:
Ознакомьтесь с актуальными примечаниями к релизу и руководством по миграции, иначе счета за использование API могут стать неприятным сюрпризом в конце месяца.