От хайпа к фактам: что пишут tech-СМИ об ИИ и кто по-настоящему впереди в 2025?

За последние 26 дней я проанализировал 200 публикаций об искусственном интеллекте в ведущих западных tech-ресурсах: TechCrunch, VentureBeat и MIT Technology Review. В среднем это почти восемь новостей об ИИ ежедневно. Цель эксперимента — проверить, насколько активно раздуваемый медиа-хайп совпадает с реальными достижениями моделей ИИ.

Краткий вывод: реальность существенно отстаёт от шумного информационного фона.

Методика исследования

В ходе работы были выбраны три основных источника:

  • TechCrunch — крупнейший ресурс о стартапах и инновациях;
  • VentureBeat — специализация на enterprise-решениях и ИИ;
  • MIT Technology Review — академический взгляд на технологии.

Отбирались материалы, в которых упоминались ИИ-компании, конкретные модели, продукты на основе искусственного интеллекта или методы машинного обучения. Проанализированы следующие параметры:

  • частота упоминаний брендов;
  • число ссылок на отдельные модели;
  • ключевые темы и тренды;
  • распределение упоминаний по источникам.

Для сопоставления с реальными показателями применялся рейтинг Chatbot Arena Leaderboard — независимый рейтинг, основанный на миллионах пользовательских голосов.

От хайпа к фактам: что пишут tech-СМИ об ИИ и кто по-настоящему впереди в 2025?

Итоги медиапокрытия

Распределение по изданиям

Издание Статей Доля
TechCrunch 141 70,5%
VentureBeat 35 17,5%
MIT Technology Review 23 11,5%

TechCrunch публикует семь из десяти новостей по ИИ среди этих ресурсов, что подчёркивает его фокус на искусственном интеллекте как ключевом тренде.

Топ компаний по упоминаниям

Место Компания Упоминаний Доля
1 OpenAI 28 14,0%
2 Google 10 5,0%
3 Meta 10 5,0%
4 Microsoft 8 4,0%
5 Nvidia 8 4,0%
6 Apple 6 3,0%
7 Amazon 6 3,0%
8 Anthropic 3 1,5%
9 Perplexity 3 1,5%

OpenAI лидирует, его упоминают в каждой седьмой статье — почти в три раза чаще, чем Google или Meta.

Топ моделей по упоминаниям

Место Модель Упоминаний Доля
1 ChatGPT 13 6,5%
2 Gemini 4 2,0%
3 Copilot 3 1,5%
4 o1 3 1,5%
5 Sora 2 1,0%

ChatGPT остаётся самым узнаваемым брендом — о нём пишут в три раза чаще, чем о Gemini.

Популярные темы

Тема Статей Доля
Бизнес и инвестиции 17 8,5%
AI-агенты 11 5,5%
Кодинг 7 3,5%
Поиск 7 3,5%
Генерация видео 6 3,0%
Open Source 6 3,0%
Reasoning 4 2,0%
Робототехника 4 2,0%

Самая обсуждаемая тема — финансы. Генерация изображений упоминается лишь в 1% случаев, так как превратилась в обыденность.

Реальная эффективность моделей по данным LMArena

Text (текстовые задачи)

Рейтинг моделей в категории Text
Рейтинг моделей в категории Text по данным LMArena
Место Модель Score Голосов
1 Gemini 2.5 Pro 1452 61 259
1 Claude Opus 4.1 (thinking) 1448 27 970
1 Claude Sonnet 4.5 (thinking) 1448 12 313
2 GPT-4.5 Preview 1442 14 644
3 Claude Opus 4.1 1439 40 413
3 ChatGPT-4o Latest 1438 46 917
4 GPT-5 High 1436 29 552
4 Claude Sonnet 4.5 1436 5 483
4 o3 1435 57 953
4 Qwen3-max Preview 1433 24 457

Тройка лидеров по текстовым задачам: Gemini 2.5 Pro и две версии Claude с режимом мышления.

WebDev (веб-разработка)

Рейтинг моделей в категории WebDev
Рейтинг моделей в категории WebDev по данным LMArena
Место Модель Score Голосов
1 GPT-5 High 1473 8 004
1 Claude Opus 4.1 (thinking) 1458 8 726
2 Claude Opus 4.1 1451 8 986
4 Claude Sonnet 4.5 (thinking) 1420 4 863
4 MiniMax-M2 1405 3 515

GPT-5 и Claude удерживают лидерство в задачах по генерации кода.

Vision (мультимодальность)

Рейтинг моделей в категории Vision
Рейтинг моделей в категории Vision по данным LMArena
Место Модель Score Голосов
1 Gemini 2.5 Pro 1249 63 845
1 ChatGPT-4o Latest 1240 15 468
2 GPT-4.5 Preview 1228 2 925
2 Gemini 2.5 Flash Preview 1224 2 963

Gemini уверенно лидирует в работе с визуальными данными.

Text-to-Image

Рейтинг моделей в категории Text-to-Image
Рейтинг моделей в категории Text-to-Image по данным LMArena
Место Модель Score Голосов
1 Hunyuan Image 3.0 1153 37 888
1 Gemini 2.5 Flash Image 1146 283 324
2 Imagen 4.0 Ultra 1145 465 488
1 Seedream 4 2K 1143 14 539

Китайская Hunyuan разделяет первое место, оставаясь невидимой для западных медиа.

Text-to-Video

Рейтинг моделей в категории Text-to-Video
Рейтинг моделей в категории Text-to-Video по данным LMArena
Место Модель Score Голосов
1 Veo 3.1 Fast Audio 1384 4 454
1 Veo 3.1 Audio 1384 4 407
1 Veo 3 Fast Audio 1361 23 856
1 Sora 2 Pro 1358 4 633

Модели Veo и Sora демонстрируют лучшие результаты в генерации видео.

Search

Рейтинг моделей в категории Search
Рейтинг моделей в категории Search по данным LMArena
Место Модель Score Голосов
1 Grok 4 Fast Search 1166 14 957
2 Perplexity Sonar Pro High 1149 18 453
2 Gemini 2.5 Pro Grounding 1142 19 350
2 o3 Search 1142 19 254

Grok от xAI лидирует в поисковых сценариях, несмотря на скромное медийное присутствие.

Сопоставление медиаповестки и реальных результатов

OpenAI vs реальность

  • В СМИ: 28 упоминаний OpenAI, 13 упоминаний ChatGPT.
  • В тестах: ChatGPT-4o лишь в середине рейтинга текстовых задач, GPT-5 и Claude опережают его.

Вывод: сильный PR не гарантирует лидерства в качестве.

Anthropic — недооценённый игрок

  • В СМИ: 3 упоминания Anthropic, 1 упоминание Claude.
  • В тестах: Claude Opus занимает топовые позиции в нескольких категориях.

Вывод: качество моделей Anthropic почти не отражается в медиа.

Китайские модели

  • В СМИ: ни одного упоминания Qwen, Hunyuan или DeepSeek.
  • В тестах: Hunyuan Image лидирует в Text-to-Image, Qwen3-max — в Text.

Вывод: западные издания игнорируют мощные разработки из Китая.

Google и xAI

  • В СМИ: Google упоминают 10 раз, xAI — 1 раз.
  • В тестах: Gemini и Grok показывают выдающиеся результаты.

Вывод: эти компании недооценены в медиа с учётом технологических достижений.

Рекомендации по выбору моделей

Для работы с текстом

  • Лучший выбор: Gemini 2.5 Pro или Claude Opus 4.1;
  • Эконом-вариант: Claude Sonnet 4.5;
  • Альтернатива: Qwen3-max для китайского рынка.

Для программирования

  • Лучший выбор: GPT-5 High или Claude Opus 4.1 (thinking);
  • Быстрый вариант: Claude Sonnet 4.5;
  • Неожиданность: MiniMax-M2.

Для распознавания изображений

  • Лучший выбор: Gemini 2.5 Pro;
  • Альтернатива: ChatGPT-4o Latest.

Для генерации изображений

  • Лучший выбор: Hunyuan Image 3.0 или Seedream 4;
  • Проверенный вариант: Imagen 4.0 Ultra;
  • Устарело: DALL-E и Midjourney.

Для создания видео

  • Лучший выбор: Veo 3.1 Fast Audio;
  • Альтернатива: Sora 2 Pro;
  • Бюджетный: Hailuo 2.3.

Для интеллектуального поиска

  • Лучший выбор: Grok 4 Fast Search;
  • Альтернатива: Perplexity Sonar Pro;
  • От гигантов: Gemini 2.5 Pro Grounding или o3 Search.

Заключение

Анализ 200 статей выявил значительный разрыв между тем, что обсуждают СМИ, и реальными возможностями ИИ. OpenAI доминирует в новостях, но его модели не всегда лучшие. Anthropic и Google показывают более высокие результаты, а китайские разработки остаются незамеченными западными изданиями. Наиболее стремительный прогресс идёт в мультимодальности и reasoning.

Все данные актуальны на начало ноября 2025 года.

 

Источник

Читайте также