Французская компания Mistral AI представила Devstral — открытую языковую модель для создания программного обеспечения. Этот выпуск был ответом на критику предыдущей закрытой модели и отметил возвращение компании к политике открытого исходного кода. Devstral разработана в сотрудничестве со стартапом All Hands AI, создателями платформы OpenDevin, и включает 24 миллиарда параметров, что позволяет ей функционировать даже на ноутбуках.
Devstral отличается от традиционных инструментов искусственного интеллекта для генерации кода, таких как GitHub Copilot и CodeWhisperer. Модель способна анализировать контекст нескольких файлов, работать с крупными кодовыми базами и решать сложные задачи. Она доступна под лицензией Apache 2.0, которая разрешает свободное использование, модификацию и коммерческое использование. «Мы хотели предложить сообществу инструмент, который можно запускать локально и адаптировать под конкретные потребности», — пояснил Батист Розиер, ведущий научный сотрудник Mistral AI.

Эта модель стала продолжением серии Codestral, представленной в мае 2024 года. Если Codestral с 22 миллиардами параметров уделяла внимание автодополнению кода и поддерживала 80 языков программирования, то Devstral расширила функционал до уровня самостоятельного агента. На бенчмарке SWE-Bench Verified она продемонстрировала результат 46,8%, опередив все открытые аналоги и некоторые закрытые модели, включая GPT-4.1-mini, на 20 процентных пунктов.
Devstral основана на Mistral Small 3.1, с использованием методов обучения с подкреплением и доработана для интеграции с такими фреймворками, как OpenHands, SWE-Agent и OpenDevin. Это позволяет модели взаимодействовать с тестами, редактировать исходные файлы и выполнять сложные многошаговые задачи. Для обучения использовались как публичные репозитории, так и внутренние разработки Mistral AI.
Благодаря своей компактной архитектуре Devstral работает на системах с 32 ГБ оперативной памяти и видеокартой RTX 4090, что делает её подходящей для задач с повышенными требованиями к конфиденциальности. Модель доступна через API Mistral’s Le Platforme и для локального развёртывания — подробности опубликованы на Hugging Face.
В данный момент Devstral находится на стадии исследовательского превью. Mistral AI и All Hands AI уже работают над более масштабной версией с расширенными функциями. Несмотря на текущий статус, модель рассматривается как основа для создания автономных систем разработки, а не просто как инструмент для генерации кода.
Источник: iXBT



