ИИ-напарник DeepMind AlphaEvolve решает 67 непростых задач без ложного пафоса

Новый интеллектуальный агент AlphaEvolve от Google DeepMind демонстрирует беспрецедентное ускорение работы в чистой математике, успешно решая десятки нетривиальных задач и предлагая инновационные методики для классических проблем в тесном партнёрстве с ведущими исследователями.

В недавней статье, соавтором которой выступил профессор Терренс Тао, описывается достижение AlphaEvolve: он справился с 67 сложными задачами, воссоздал оптимальные известные решения и разработал свежие конструкции для ряда фундаментальных вопросов геометрии и теории множеств. Учёные подчёркивают, что система служит не заменой человека, а мощным инструментом для ускоренной и структурированной проверки гипотез.

В отличие от стандартных чат-ботов, часто уязвимых к ошибкам в строгих доказательствах, AlphaEvolve функционирует как «универсальный эволюционный кодирующий агент». С опорой на крупномасштабные языковые модели, включая Gemini, он генерирует, исполняет и последовательно улучшает Python-скрипты, исследующие огромное пространство возможных решений. Этот подход расширяет представленный DeepMind в мае 2025 года прототип и, по мнению авторов, превращает AlphaEvolve в «превосходный инструмент математического творчества», способный обрабатывать задачи оптимизации в масштабах, недоступных ранее.

Ключевой принцип заключается в том, что ИИ не рисует математический объект напрямую, а создаёт код, самостоятельно отыскивающий подходящие примеры или оптимальные фигуры. В «режиме поиска» единичная, но ресурсоёмкая генерация кода запускает затем масштабный перебор миллионов вариантов с помощью выведенных эвристик. В «режиме обобщения» агент фокусируется на построении формул и конструкций, применимых к целым классам объектов, а не к отдельным случаям. По словам авторов, подготовка постановки каждой задачи для AlphaEvolve занимала всего несколько часов, существенно снижая порог для масштабных вычислительных экспериментов.


ИИ-напарник DeepMind AlphaEvolve решает 67 непростых задач без ложного пафоса
Источник: Google DeepMind

Система не ограничивается воспроизведением ранее известных результатов: в статье выделяют новую конструкцию для множеств Никодима и улучшенные решения конечнопольной версии задачи Какея в размерностях 3, 4 и 5. Эти примеры из аналитической и геометрической теории множеств традиционно требуют сочетания математической интуиции и серьёзных вычислений, однако идеи, предложенные AlphaEvolve, уже будут включены в планируемую публикацию Терренса Тао.

AlphaEvolve также успешно работает с наглядной геометрией. Агент воссоздал классический «диван Гервер» — фигуру максимальной площади, проходимую сквозь прямоугольный коридор, а также представил «диван Ромика» для амбидекстричного варианта задачи. При переходе к трёхмерному корпусу система предложила новую конструкцию с доказанным объёмом не менее 1,81 кубических единиц, превосходящую ранее известные кандидаты.

Важный аспект проекта – интеграция нескольких специализированных ИИ-инструментов в единую цепочку. AlphaEvolve выдвигает перспективные конструкции, затем системы вроде Deep Think, ранее применявшиеся DeepMind для задач Международной математической олимпиады, подтверждают корректность идей, а инструменты вроде AlphaProof формализуют доказательства на языке Lean для машинной верификации. Как отмечает Тао в своём блоге, при этом необходим жёсткий профессиональный контроль: ИИ может искать лазейки и эксплуатировать слабости проверяющих процедур, отчего создание надёжного контура верификации требует значительных усилий.

По мнению авторов, AlphaEvolve задаёт новый стандарт «проверки разумности» для математиков: система эффективно генерирует очевидные и неожиданные контрпримеры к гипотезам, позволяя избежать месяцов человеческой работы. При этом ни одна серьёзная открытая гипотеза не была опровергнута, и статья подчёркивает этот факт в качестве доказательства строгости методики, особенно на фоне недавних публичных ошибок других компаний, вынужденных отозвать громкие заявления о «решении» задач Эрдёша.

Итоговая работа над AlphaEvolve продолжает традицию проверяемых достижений DeepMind в математике и предлагает практическую модель эффективного сотрудничества человека и машины.

 

Источник: iXBT

Читайте также