Группа экономистов, в которую вошли Мишель Инь и Хоа Ву из Северо-Западного университета, а также Клаудия Персико из Американского университета, проанализировала прогностические способности передовых нейросетей — ChatGPT-5 от OpenAI, Gemini 2.5 от Google DeepMind и Claude 4.5 от Anthropic. Целью исследования было оценить, насколько объективно данные системы оценивают степень влияния искусственного интеллекта на различные профессии.
Согласно материалу The Wall Street Journal, прогнозы моделей относительно уязвимости тех или иных специальностей перед лицом автоматизации оказались крайне неоднородными. Искусственные интеллекты продемонстрировали существенные разногласия, особенно когда речь заходила о должностях, сочетающих интеллектуальную нагрузку с физическим трудом.
Так, Claude отнес профессию бухгалтера к категории высокого риска, тогда как Gemini занял прямо противоположную позицию, оценив вероятность замещения этих специалистов как минимальную. Аналогичные противоречия возникли и в оценке перспектив таких ролей, как менеджеры по рекламе и руководители высшего звена.

Исследование также выявило, что хотя ChatGPT и Gemini демонстрируют схожие ответы в большинстве случаев, примерно в 25% сценариев их выводы кардинально расходятся. Авторы работы полагают, что причина такой несогласованности кроется в различиях обучающих выборок, на которых базируются эти модели.
На основании полученных данных экономисты настоятельно рекомендуют работодателям не полагаться исключительно на оценки рисков, сформированные искусственным интеллектом, ввиду их высокой нестабильности и противоречивости.
Подводя итог, Мишель Инь подчеркнула: «Я бы не стала опираться на единичный показатель нейросети, принимая судьбоносные решения о смене карьеры или выборе образовательной траектории для своих детей».
Источник: iXBT


