Накануне старта крупной выставки Computex в Тайбэе, на которой производители ПК покажут новые системы с процессорами Intel и AMD, мобильный конкурент ARM решил официально представить CPU и GPU нового поколения. ARM Cortex-A75 стал новым флагманским решением и обещает на 22 % более высокую производительность по сравнению с A73. Он дополняется процессором Cortex-A55, который позиционируется как наиболее энергоэффективный CPU среднего звена, когда-либо спроектированный ARM. И, наконец, третьим продуктом является графический ускоритель Mali-G72, который тоже обещает на 25 % более высокую энергоэффективность по сравнению с предшественником G71.
Улучшения в области производительности и энергоэффективности были вполне ожидаемы и предсказуемы, а вот принципиальным новшеством серии стали интегрированные вычислительные блоки, созданные специально для ускорения работы алгоритмов искусственного интеллекта и машинного обучения прямо на мобильных устройствах. Очень своевременное новшество — сегодня всё больше ИИ-алгоритмов исполняется прямо на смартфонах, без использования облачных ресурсов. Google даже представила особый API для этих целей — TensorFlowLite.
Руководитель отдела маркетинга ARM Джон Ронко (John Ronco) отмечает, что в ближайшие 3–5 лет производительность ИИ возрастёт в 50 раз за счёт оптимизаций в области архитектур, микроархитектур и ПО. Интересно, что ARM не только встраивает блоки машинного обучения в новые ядра, но и использует ИИ в проектировании CPU. В частности, новые CPU получили улучшенный алгоритм предсказания ветвлений на основе нейронной сети, благодаря чему предварительная выборка данных становится эффективнее, повышается общая производительность.
Вдобавок британский разработчик чипов, принадлежащий сейчас японской SoftBank, существенно переработал и расширил прошлогодние оптимизации, призванные улучшить производительность в таких ресурсоёмких задачах, как виртуальная и дополненная реальность. Таким образом, ARM готовит почву для массового распространения нового поколения мобильных устройств, которые смогут эффективно обрабатывать задачи в области ИИ и VR без привлечения облачных ресурсов.
Cortex-A75 и A55 — первые CPU от ARM, созданные по принципу Dynamiq. Это означает, что конечные производители чипов вроде Qualcomm, Samsung или MediaTek получат более гибкие возможности дизайна кристаллов. Например, ранее ARM предусматривала возможность создания энергоэффективных чипов по принципу big.LITTLE, в которых работает кластер высокопроизводительных CPU (например, серии A7x) с в связке с кластером энергоэффективных CPU (серия A5x). Теперь же производители могут создавать чипы с одним кластером, включающим в себя любое количество тех или иных ядер. То есть производители, без лишнего проектирования со своей стороны, могут выпускать, например, однокристальную систему с семью ядрами A55 и одним A75, чтобы достичь нужной стоимости, энергоэффективности и, когда это требуется, высокой однопоточной производительности.
Также изменения ARM Dynamiq касаются подсистемы памяти и работы кеша CPU, благодаря чему, например, поточная производительность памяти удвоилась в A55 по сравнению с A53. Именно A55 призван оказать на рынок наибольшее влияние, ведь предыдущее ядро A53 за последние 3 года использовалось в 1,7 млрд устройств. Как отмечает ARM, в большинстве задач A55 обходит ядро прошлого поколения на 10–30 %, предлагая при этом на 15 % более высокую энергоэффективность и на 18 % более высокую однопоточную производительность. Но ещё более важно, что новый дизайн делает ядро в 10 раз более конфигурируемым: производителям предложено 3000 различных вариантов конфигурации, благодаря чему они могут оптимизировать чип под конкретные собственные нужды.
Cortex-A75 тоже приносит заметные улучшения: ARM обещает, что ядро в среднем на 22 % мощнее A73, пропускная способность памяти выше на 16 %, а улучшения в тестовом пакете Geekbench, по которому любят оценивать производительность мобильных решений, достигает 34 %. Однопоточная производительность A75 увеличена на 20 % за счёт улучшения показателя инструкций за такт. Площадь ядра A75 примерно в 2,5 раза больше, чем у A55, и оно создано для применения в инфраструктурных продуктах, автомобилях и ресурсоёмких мобильных приложениях вроде игр, VR и AR.
Любопытное архитектурное новшество A75 — расчёт на использование в более энергоёмких однокристальных системах с возможностью потребления до 2 Вт. За счёт этого производительность A75 может быть повышена ещё на 30 % в устройствах с большими экранами (другими словами, в планшетах и ноутбуках). Это явно сделано с прицелом на выходящую в этом году ARM-платформу Windows 10 с эмуляцией x86.
Что же касается Mali G72, то этот графический ускоритель включает 32 потоковых процессора, может предложить на 25 % возросшую энергоэффективность и на 20 % повышенную производительность на квадратный миллиметр площади кристалла. Этот GPU является важной частью инициативы ARM по ускорению расчётов искусственного интеллекта, демонстрируя на 17 % более высокую производительность в этом направлении по сравнению с G71. Но оптимизации ARM призваны прежде всего ускорять расчёты готовых алгоритмов ИИ на мобильных системах, а не задачи обучения. Задачи обучения ИИ будут пока по-прежнему производиться преимущественно на высокопроизводительных суперкомпьютерах, оснащённых графическими ускорителями AMD, NVIDIA или специализированными Google TPU.
Партнёры ARM имели доступ к дизайнам Cortex-A75 и A55 уже в конце 2016 года, так что наверняка уже работают над новыми однокристальными системами с этими ядрами. ARM считает, что реальные коммерческие продукты на базе таких SoC начнут появляться в первой четверти 2018 года. Впрочем, компания также упоминает феномен «китайской скорости», когда производители из Китая выводят на рынок продукты на базе последних наработок ARM гораздо быстрее остальных. Например, смартфон Huawei Mate 9 появился спустя всего 9 месяцев после начала лицензирования ускорителя Mali-G71. Описанный феномен может привести к тому, что первые смартфоны с ядрами A75 и A55 и ускорителем Mali-G72 появятся уже в этом году.
Источник: 3DNews