В свежем научном докладе подразделение Seed AI компании ByteDance заявляет: автономные ИИ-агенты, действующие в качестве самостоятельных исполнителей, способны удваивать темпы своего обучения каждые три месяца, если они функционируют в условиях длительной работы с реальными системами.
В отличие от традиционных методов дообучения на статических датасетах, здесь акцент делается на пост-интеграционном развитии, где агент совершенствует алгоритмы принятия решений непосредственно в ходе накопления практического опыта. Данная концепция выступает перспективной альтернативой общепринятой стратегии «экстенсивного роста», базирующейся исключительно на наращивании вычислительных мощностей и объёмов обучающих выборок.
Специалисты констатируют, что индустрия искусственного интеллекта постепенно упирается в «потолок» грубого масштабирования. Ранее эксперты отрасли, включая Андрея Карпатого, уже подчеркивали, что бесконечное увеличение ресурсов перестает быть единственно эффективным рычагом прогресса.

При этом авторы отмечают наличие серьезного пробела в знаниях: несмотря на массовое внедрение агентов для выполнения многоступенчатых операций, их поведение в реальных условиях «дикой» среды изучено крайне поверхностно.
Для заполнения этого пробела команда ByteDance создала специализированный бенчмарк EdgeBench. В него вошли 134 комплексных сценария, каждый из которых требует от ИИ непрерывной работы на протяжении как минимум 12 часов.
Тестовые задания охватывают широкий спектр профессиональных дисциплин: от академических исследований и написания программного кода до сложной математики и глубокой аналитики. Такой стресс-тест позволяет оценить не только результативность агента, но и его способность поддерживать стабильность функционирования в режиме долгого «автономного плавания».
Данное исследование подтверждает актуальный тренд: вектор развития ИИ смещается от фундаментальных параметров исходной модели к её способности к постоянной адаптации и самосовершенствованию уже после фактического внедрения в бизнес-процессы.
Источник: iXBT


