Исследователи из Университета Мэриленда совместно с командой Microsoft в серии экспериментов установили, что современные системы искусственного интеллекта дают более полные и точные ответы не на английском, а на отдельных европейских языках — прежде всего на польском и русском.
В эксперименте протестировали несколько ключевых моделей — включая OpenAI, Google Gemini, Qwen, Llama и DeepSeek — на наборе из 26 языков. Для всех моделей использовались унифицированные запросы; оценки ответов проводили по критериям точности, полноты и согласованности, с отдельным вниманием к обработке длинных текстовых запросов.
По результатам тестов лидирует польский — 88% точности. Русский занимает второе место с 87%, затем следуют французский (86%), итальянский (85%) и испанский (85%). Английский оказался лишь на шестой позиции — 84%.
Авторы работы признали, что такие итоги стали для них неожиданностью: несмотря на то, что большинство моделей обучаются преимущественно на англоязычных данных, эксперимент показал, что алгоритмы в ряде европейских языков умеют эффективнее анализировать и структурировать запросы. Исследователи связывают это с морфологическими и синтаксическими особенностями — в частности, наличием падежей и других грамматических маркеров, которые снижают уровень неоднозначности.
Таким образом, по данным исследования, нейросети в тестах показали более высокую эффективность при обработке запросов на польском и русском языках по сравнению с английским, несмотря на доминирование английского в обучающих корпусах.

