Команда СберБанка заявила о предстоящем введении новой функции для генеративной нейросети GigaChat. На этот раз, модель GigaChat займётся изучением удмуртского языка. Сбер и Министерство национальной политики Удмуртской Республики подписали соглашение о совместных усилиях в этом направлении.
Для обучения разработчики получат тексты на удмуртском языке с переводом на русский. Это будут литературные произведения, статьи, научно-образовательные публикации, записи из соцсетей и иные материалы. С целью, чтобы AI освоил удмуртский язык, будут задействованы носители языка. Также планируется дополнить данные актуальной информацией и речью. Далее все тексты проверят на наличие ошибок, прежде чем они станут частью процесса машинного обучения.
В Сбере отметили:
В России насчитывается 150 национальных языков, некоторые из которых находятся под угрозой исчезновения. Технологии искусственного интеллекта могут быть полезны для их сохранения.
Источник: iXBT