Новые модели Phi 4 от Microsoft дают возможность разрабатывать «умные» приложения даже на маломощных устройствах

Microsoft представила ряд новых открытых моделей искусственного интеллекта, демонстрируя значительные достижения в области доступных и эффективных решений для разработки приложений. Анонс включает три модели семейства Phi 4, нацеленных на логическое мышление: Phi 4 mini reasoning, Phi 4 reasoning и Phi 4 reasoning plus. Эти модели призваны усилить возможности разработчиков, особенно тех, кто работает над приложениями для устройств с ограниченными вычислительными ресурсами.

Главным свойством представленных моделей является способность к более тщательному анализу и верификации фактов при решении сложных задач — поэтому они классифицируются как «модели рассуждения». Microsoft впервые представила серию Phi, ориентированную на создание компактных, но мощных моделей, ровно год назад, в апреле 2024 года, и новые разработки являются логичным продолжением этой стратегии.

Самая компактная из моделей, Phi 4 mini reasoning, содержит около 3,8 миллиарда параметров и была обучена на приблизительно миллионе синтетических математических задач, созданных моделью R1 от китайского стартапа DeepSeek. Microsoft позиционирует её как идеальное решение для образовательных приложений, особенно для функции «встроенного репетитора» на маломощных устройствах. Количество параметров в модели обычно коррелирует с её способностью решать задачи, и модели с большим количеством параметров обычно демонстрируют более высокую производительность.


Новые модели Phi 4 от Microsoft дают возможность разрабатывать «умные» приложения даже на маломощных устройствах
Фото: Microsoft

Модель Phi 4 reasoning, содержащая 14 миллиардов параметров, обучена на высококачественных веб-данных и отобранных примерах из модели o3-mini, разработанной OpenAI. Microsoft отмечает, что эта модель особенно эффективна для решений в области математики, науки и программирования.

Наиболее значительным достижением является модель Phi 4 reasoning plus. Это модифицированная версия ранее выпущенной Microsoft модели Phi-4, оптимизированная для повышения точности в некоторых задачах. По данным Microsoft, Phi 4 reasoning plus приближается по характеристикам к более крупной модели R1 (с 671 миллиардом параметров). Внутренние тесты компании показали, что Phi 4 reasoning plus демонстрирует сравнимые результаты с o3-mini на тесте OmniMath, оценивающем математические навыки.

Все три модели – Phi 4 mini reasoning, Phi 4 reasoning и Phi 4 reasoning plus – сейчас доступны на платформе для разработчиков AI Hugging Face, с детальными техническими отчётами, описывающими процесс обучения и характеристики моделей.

В блоге Microsoft подчеркнула, что новые модели достигли баланса между размером и производительностью благодаря использованию методов дистилляции знаний, обучения с подкреплением и высококачественных данных. Это позволяет даже устройствам с ограниченными ресурсами эффективно выполнять задачи, требующие логики и анализа.

 

Источник: iXBT

Читайте также