Компания Nvidia представила новейшую модель искусственного интеллекта с открытым исходным кодом, способную выполнять задачи визуализации и обработки естественного языка наравне с передовыми системами, такими как OpenAI и Google.
Новое семейство крупных мультимодальных языковых моделей NVLM 1.0, главное из которых — модель NVLM-D-72B с 72 миллиардами параметров, значительно расширяет возможности работы с текстом и демонстрирует высокую гибкость при обработке как визуальных, так и текстовых данных.
По словам исследователей, NVLM-D-72B повышает производительность в текстовых задачах после мультимодального обучения, улучшая точность в среднем на 4,3 балла по ключевым текстовым бенчмаркам. Это существенное улучшение в сравнении с текстовыми системами, использующими только текстовые данные для тестов по математике и программированию.
Решение Nvidia сделать столь мощную модель общедоступной может значительно ускорить исследования и разработки в области ИИ. Предоставляя доступ к модели, способной конкурировать с решениями крупных технологических компаний, Nvidia предоставляет возможность малым организациям и независимым исследователям вносить более весомый вклад в развитие ИИ.
NVLM также внедряет инновационные архитектурные решения, включая гибридный подход, объединяющий различные методы мультимодальной обработки. Этот шаг может определить направление будущих исследований в этой области.
Однако выпуск NVLM 1.0 сопряжён с определёнными рисками. С ростом доступности высокоэффективных ИИ увеличиваются опасения по поводу их неправильного использования и возможных этических последствий. Сообществу ИИ предстоит сложная задача — способствовать инновациям, одновременно устанавливая защитные меры для ответственного использования.
Решение Nvidia также поднимает вопросы о будущем бизнес-моделей в сфере ИИ. Если современные модели станут общедоступными, компании могут быть вынуждены пересмотреть свои подходы к созданию ценности и поддержанию конкурентных преимуществ.
Настоящее влияние NVLM 1.0 станет очевидным в ближайшие месяцы и годы. Это может открыть эру непревзойдённого сотрудничества и инноваций в области ИИ или потребовать от нас преодоления непредвиденных последствий от широкодоступного продвинутого ИИ.
Источник: iXBT