Годы 2024 и 2025 в аппаратной индустрии прошли под девизом «AI». Если раньше производители соревновались тактовыми частотами и количеством ядер, то теперь Intel, AMD и Qualcomm хвастаются показателями TOPS (триллионов операций в секунду). Обещают эру «AI PC»: в бюджетные процессоры внедряют нейронные ускорители (NPU), а на клавиатуры выводят специальные клавиши для вызова ассистентов.
Но у владельца системы с RTX 4090 возникает логичный вопрос: зачем ему «скромный» нейронный блок, когда GPU в 50 раз мощнее? Дело не в максимальной производительности, а в том, чтобы система стала мгновенно отзывчивой. Отбросим маркетинг и разберёмся в архитектуре, сценариях и причинах перехода к гетерогенным вычислениям.
Архитектурная база: скаляры, векторы и матрицы
Чтобы понять ценность NPU, вспомним, как работают разные блоки ПК:
- CPU (Central Processing Unit) — универсальный «солдат»: отлично решает последовательные задачи и ветвления, но захлёбывается при умножении больших матриц.
- GPU (Graphics Processing Unit) — король параллелизма: тысячи ядер обрабатывают пиксели и вершины, а тензорные ядра NVIDIA созданы для матричных операций (см. DLSS).
- NPU (Neural Processing Unit) — специализированный ASIC: не годится для рендеринга и ОС, но дьявольски эффективен в операциях умножения с накоплением (MAC) над тензорами.
Главная разница — уровень специализации и накладные расходы. RTX 4090 тоже может работать с INT8, но GPU вынужден использовать сложный конвейер, разогревать память и раскручивать вентиляторы. NPU сразу оперирует квантованными данными (INT8/INT4) без лишних затрат.
Для инференса не нужна точность FP32: модель отлично распознаёт кота на картинке, даже если её веса сжаты до 8 бит. Это и есть квантование.
Эффективность ватта: Ferrari против электросамоката
В десктопе с блоком питания 1200 Вт экономия 20 Вт кажется несущественной, но важны шум и ресурс. Хотите, чтобы вентиляторы RTX 4090 включались при каждом «слушании» ассистента? NPU позволяет системе оставаться тихой.
Сценарий: вы в Teams или Zoom с размытием фона и шумоподавлением:
- С GPU: карта «просыпается», поднимает частоты, раскручивает вентиляторы. Потребление растёт на 20–40 Вт, батарея садится быстрее, шум усиливается.
- С NPU: нейронный блок справляется за 1–2 Вт, CPU и GPU в спящем режиме. NPU создан для энергоэффективного выполнения AI-задач.
TOPS: 40 против 1300
Microsoft задала планку для AI PC: NPU должен выдавать не менее 40 TOPS для локального запуска Copilot.
- Intel Core Ultra 200V (Lunar Lake): около 48 TOPS.
- AMD Ryzen AI 300: примерно 50 TOPS.
- NVIDIA GeForce RTX 4090: свыше 1300 AI TOPS. Такая разница позволяет GPU генерировать изображение в Stable Diffusion за секунды, тогда как NPU займёт минуты. Но NPU привлекателен низкой задержкой и параллельной работой с GPU.
Геймеры и стримеры
Во время игры с трассировкой лучей GPU загружен на 99%. Если одновременно включить AI-шумодав или AI-аватар на GPU, FPS и стабильность пострадают. NPU же работает автономно, не отвлекая ресурсы видеокарты.
Always-on ассистенты
Нужно поискать договор в локальных документах? Запускать для этого 450-ваттную GPU — всё равно что ездить карьерным самосвалом за хлебом. NPU ответит быстрее и без переключения контекста VRAM.
Реальность 2025: железо опережает софт
В аппаратуре всё готово: Intel, AMD и Qualcomm оснащают процессоры мощными NPU. Софт же пока отстаёт:
- Adobe Premiere и Lightroom продолжают полагаться на CUDA и Metal.
- В играх NPU для интеллекта NPC встречается лишь в технодемках.
- Локальные LLM (LM Studio, Ollama) лучше работают на GPU.
- API (OpenVINO, Ryzen AI, QNN) представляют зоопарк решений. Надежда — Microsoft DirectML, единая прослойка под любой NPU.
Будущее: NPU как новый QuickSync
Когда-то аппаратный декодек решил проблему воспроизведения 4K на слабых CPU; теперь даже дешевый ноутбук тянет 4K/60 fps без просадок. С NPU случится то же самое. В ближайшие 2–3 года AI станет гетерогенным:
Лёгкие задачи (NPU):
- шумоподавление
- транскрипция речи
- умная фокусировка камеры
- анализ почты
Тяжёлые задачи (GPU):
- DLSS/FSR
- генерация изображений
- обучение моделей
Супертяжёлые (облако):
- ChatGPT-5, ChatGPT-6 и масштабные LLM
Итог: апгрейд или ждать?
Для владельцев мощных десктопов NPU — приятный бонус, но не причина для апгрейда: RTX 4090 справится быстрее, пока массовый софт не перейдёт на DirectML. А вот для ноутбуков NPU критичен: он продлит время автономной работы на 20–30% и сделает систему бесшумной. Энтузиастам и разработчикам NPU пока интересен как площадка для экспериментов, но связан с борьбой драйверов и опорно�ми сложностями документации.
Вывод
Эра AI PC уже наступила, но софт ещё догоняет. Железо готово — остаётся дождаться, когда разработчики полноценно раскроют потенциал NPU.


