Исследование, проведенное авторитетными учеными из Университета Мэриленда в партнерстве с корпорацией Microsoft, выявило существенные различия в эффективности обработки запросов крупными языковыми моделями в зависимости от языка ввода. «Наш эксперимент принёс несколько неожиданных и нелогичных результатов. Во-первых, английский язык не показал наилучших результатов во всех моделях. Более того, при оценке длинных текстов он оказался шестым из 26 языков, в то время как польский язык оказался лидером», — пишут авторы отчёта.

В ходе комплексного эксперимента были протестированы ведущие модели, включая OpenAI, Google Gemini, Qwen, Llama и DeepSeek. Оценка проводилась по строгим критериям точности и глубины анализа, особенно при обработке объемных текстов. Результаты оказались неожиданными для научного сообщества, бросив вызов существующим представлениям.

Помимо польского, высокую эффективность продемонстрировали другие европейские языки: итальянский (86%), испанский (85%), русский (84%) и украинский (83,5%). Немного уступили им португальский (82%), немецкий (81%) и голландский (80%).