Компания OpenAI собирается представить в ближайшем будущем свою новейшую языковую модель, оснащённую открытыми весами и функциями анализа, что станет первым подобным релизом со времён GPT-2. Об этом сообщил исполнительный директор компании Сэм Альтман.
Модель с открытыми весами — это нейросетевая структура, для которой разработчики делают общедоступными файлы, содержащие веса (параметры, которые были определены в ходе обучения), а также исходный код архитектуры. Это предоставляет возможность другим специалистам и разработчикам загружать, использовать, дорабатывать и настраивать модель по своему усмотрению. Веса представляют собой числовые показатели, которые модель «усвоила» в рамках обучения, и они являются основополагающими для её функционирования. Эти языковые модели отличаются от классов, предоставляющих полный доступ к исходному коду, тренировочным данным и методологиям.

OpenAI планирует обсудить с разработчиками, как сделать данную модель максимально продуктивной. Первое собрание состоится в Сан-Франциско через несколько недель, после чего планируются сессии в Европе и Азиатско-Тихоокеанском регионе. По словам Альтмана, окончательные решения ещё не были приняты, компания собирает отзывы, чтобы доработать начальные прототипы. В феврале Альтман упоминал о намерениях упростить продукты в рамках новой стратегии компании.
Выход модели связан с этапом перехода OpenAI, поддержанной Microsoft, к коммерческой структуре. Это необходимо для привлечения финансирования в размере 40 миллиардов долларов от SoftBank Group и других инвесторов к концу 2025 года.
Источник: iXBT