Бета-версия D&D AI-Мастера: почему главная проблема оказалась не в кубиках, а в памяти

24 минуты назад

Что на практике означает запуск ОБТ для пет-проекта

Чтобы привлечь реальных тестеров, а не просто любопытствующих, я предоставил пользователям стартовый запас маны — местной валюты. Этого объема хватает примерно на сотню ходов. Стратегия проста: позволить игроку погрузиться в процесс достаточно глубоко, чтобы он столкнулся с реальными игровыми вызовами, а не уперся в стену «бесплатные попытки закончились, оплатите доступ» через пять минут после начала.

Аналитика первых дней

Данные дашборда OpenRouter за период запуска:

32 тысячи обращений к нейромоделям;
91,4 миллиона обработанных токенов.

Бета-версия D&D AI-Мастера: почему главная проблема оказалась не в кубиках, а в памяти — Статистика запросов 13.06-18.06

Важно понимать: это не количество активных пользователей, а показатель технической нагрузки от тех, кто решил протестировать сырой билд. Суть в том, что каждый игровой ход генерирует не один запрос, а целую цепочку вызовов. Огромный объем токенов за считанные дни наглядно иллюстрирует, почему основная часть моей работы сейчас — это оптимизация запросов, а не внедрение новых фич.

Почему нейросеть в чистом виде — плохой Мастер

Попытка просто доверить ИИ проведение партии по D&D предсказуемо оборачивается провалом.

Во-первых, нейросети не «знают» правил, а лишь мимикрируют под них. Если попросить ее бросить кубик, она часто «выкидывает» результат, который кажется ей наиболее подходящим для сценария, а не случайным.

Во-вторых, модель склонна к избыточной доброте. Она легко раздает тысячи золотых за пустяковые действия и поощряет игроков за бездействие, что моментально разрушает игровой баланс.

Эти проблемы я купировал еще до начала ОБТ. В текущей версии за механики — кости, спасброски, инициативу, урон — отвечает детерминированный движок D&D 5e. Нейросеть отвечает лишь за нарратив, тогда как код обеспечивает строгое следование правилам. Ошибки игроков здесь караются в соответствии с механикой, а не по прихоти ИИ. Я был уверен в этой части системы, но, как оказалось, главная проблема скрывалась в другом.

Главная боль ОБТ — память и консистентность

Узкое место обнаружилось там, где я его не ждал: модель страдает от кратковременной памяти.

Типичный баг: игрок убивает противника, движок фиксирует смерть NPC, но спустя пару реплик нарратор «воскрешает» бандита, потому что в рамках художественного текста это кажется ему логичным продолжением сцены.

Бот регулярно забывал факты, путал NPC и противоречил собственным описаниям. Один из тестеров очень точно описал это состояние:

Забывчивость ИИ о состоянии мира удручает. Теряется ощущение целостности: мир каждые несколько сообщений словно стирается и пересобирается заново, с ошибками и потерей деталей. Как в комнате кривых зеркал.

Проблема крылась в архитектуре: нарратив был первичен, а память собиралась «постфактум» путем извлечения сущностей из уже сгенерированного текста. В итоге бот мог легко переписать прошлое, которое он сам же только что зафиксировал.

Решение: «Директор состояния»

Сейчас я внедряю новую архитектуру, которую назвал «Директор состояния».

Идея в разделении ролей: «Директор» отвечает за канон (состояние мира, статус NPC, факты), а нарратор лишь облекает этот канон в художественную форму, не имея права вносить фактические изменения. Теперь каждый ход проходит через четкий пайплайн: анализ намерения — расчет механики — проверка директором — генерация текста.

Я также добавил настройку строгости. В режиме «Строго» канон является догмой, в режиме «Лояльно» система более гибкая, допуская легкий дрейф фактов ради живости повествования. При этом предусмотрен «failover»: если Директор недоступен, бот откатывается к базовому режиму, чтобы игра не прерывалась.

Выводы и планы

Моя цель — создать систему, позволяющую полноценно отыгрывать D&D в одиночку, где мир обладает постоянством и собственной логикой. Несмотря на шероховатости, пользователи уже создают удивительные истории, выходящие за рамки сценариев — от перевоспитания кузнецов до построения карьеры в подпольных бойцовских ямах.

Проект активно развивается, и я приглашаю всех желающих протестировать его и помочь мне с обратной связью. Бот доступен по ссылке: https://t.me/dnd5char_bot.

Главный урок, который я извлек: кубики — это самая простая часть задачи. Настоящая инженерия нейросетевых RPG заключается в управлении памятью и контекстом. И не стоит откладывать релиз пет-проекта в бесконечность в попытках добиться совершенства — выпускайте в свет и дорабатывайте на ходу.

Источник