Т-Банк открыл доступ к своей большой языковой модели T-lite, которая включает 8 миллиардов параметров. По заявлению разработчиков, нейросеть показывает лучшие результаты в решении бизнес-задач на русском языке среди открытых моделей размером 7–8 млрд параметров. К примеру, на индустриальных и внутренних бенчмарках T-lite обогнала по показателям ChatGPT 3.5, при этом она создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей, отмечают в Т-Банке.
С помощью модели T-lite компании смогут создавать LLM-приложения (Large Language Models) для собственного использования без передачи данных третьим лицам. Например, ассистентов поддержки, которые могут автоматически обрабатывать запросы клиентов и предоставлять мгновенные ответы, инструменты для анализа и обобщения больших объёмов текста (отчётов или исследований), интеллектуальные поисковые системы и т.д.
T-lite входит в Gen-T — семейство собственных специализированных языковых моделей Т-Банка, которые умеют обучаться под решение конкретных узкоспециализированных задач. Разработчики заявляют, что T-lite после дообучения на конкретные бизнес-задачи даёт качество, сопоставимое с моделями размером от 20 миллиардов параметров, но она в разы дешевле в эксплуатации.
Источник: iXBT