Будущее энергоэффективных микроархитектур Intel туманно

Отмена выпуска семейств микросхем SoFIA и Broxton для смартфонов не означает, что корпорация Intel также отказывается от производства систем на кристалле (system-on-chip, SoC) для других устройств с малым энергопотреблением. Однако отказ от выпуска нескольких важных продуктов на поздней стадии означает, что в компании пересмотрят будущее как процессоров Atom, так и, возможно, микроархитектур.

Немного истории

Компания Intel начала разработку своих энергоэффективных микроархитектур и «маленьких» ядер в 2004 году. Основной задачей, которая ставилась при создании первой микроархитектуры Atom — Bonnell — была разработка x86-совместимого ядра, которое бы отличалось сверхмалым энергопотреблением и миниатюрными размерами кристалла. Подобное ядро могло бы быть встроено в мультиядерные процессоры для параллельных вычислений или же использовано для обеспечение запуска приложений под Microsoft Windows (тогда доминирующую операционную систему) на сверхпортативных устройствах, таких как планшеты.

Intel Atom первого поколения

Intel Atom первого поколения

В 2008 году Intel представила первые процессоры семейства Atom, известные как Silverthorne. Чтобы максимально снизить энергопотребление вычислительных ядер, инженеры Intel отказались от внеочередного исполнения инструкций (out-of-order execution, OOO) в пользу последовательного исполнения инструкций (in-order execution, IO), 64-разрядности и ряду других вещей, которые к тому времени стали стандартными для CPU. Тем не менее, будучи сделанными по технологии 45 нм, Atom первого поколения имели размер ядра 25 мм2, энергопотребление около 2,5 Вт и могли запускать Microsoft Windows. Хотя потребление самих процессоров Atom было минимальным, даже самый экономичный набор логики для них — US15W — имел энергопотребление 2,3 Вт, а потому использование платформы для мобильных телефонов было исключено. Чуть позже в том же году был представлен двухъядерный 64-разрядный Diamondville для настольных ПК с рассеиваемой тепловой мощностью (TDP) 8 Вт. С ним были совместимы более мощные наборы логики, пригодные для ПК, например, комбинация из северного моста Intel 945GSE Express и южного моста 82801GBM (I/O контроллер), которая потребляла 10 Вт. Кроме того, предлагался Intel 945GC Express с TDP в 22 Вт.

Весьма высокое энергопотребление US15W и других было следствием стратегии Intel в области производства наборов логики того времени, данная микросхема производилась по технологии 130 нм. Поскольку для производства CPU применялись передовые технологические процессы, чтобы обеспечить максимальную производительность (в случае с Atom — наименьшее энергопотребление), чипсеты производились при помощи устаревших техпроцессов (кстати, это одна из причин, почему графические ядра в наборах логики Intel всегда имели крайне низкую производительность — их транзисторный бюджет всегда был ограничен, а площадь на ядре выделялась по остаточному принципу). Подобный подход не был проблемой для настольных ПК и даже для ноутбуков, но был неприемлемым для устройств со сверхмалым энергопотреблением.

Intel Atom второго поколения поколения

Intel Atom второго поколения поколения

Стремясь максимально снизить потребление платформы Atom, Intel встроила контроллер памяти и графическое ядро непосредственно в процессоры Atom второго поколения (Pineview для ПК и Lincroft для планшетов), сократив количество микросхем до двух. Это увеличило энергопотребление самих CPU до 1,3–5,5 Вт, тогда как совместимые с ними I/O контроллеры NM10 и SM35 потребляли 2,1 и 0,75 Вт соответственно. Тем не менее, снижение энергопотребление по сравнению с решениями на базе Intel 945 Express было налицо. Видя, что Atom пользуются спросом в первую очередь у производителей ноутбуков, наиболее продвинутые варианты Pineview получили два процессорных ядра, 64-разрядность, высокие тактовые частоты и TDP в 10–13 Вт.

Перевод Atom на технологический процесс 32 нм во второй половине 2011 года позволил Intel создать свою первую платформу для смартфонов (Medfield/Penwell), а также представить третье поколение процессоров Atom (Cedarview) для ПК. Данные микросхемы имели два ядра и относительно высокие тактовые частоты (1,6–2,13 ГГц), но при этом потребляли от 3,5 до 10 Вт энергии, давая понять, что текущая IO-микроархитектура (Saltwell, 32-нм версия Bonnell) едва ли может хорошо масштабироваться в плане производительности на ватт.

Silvermont и новые возможности

Для увеличения производительности, но при сохранении низкого энергопотребления Intel представила Silvermont в 2013 году. Данная микроархитектура получила не только внеочередное исполнение инструкций, но и массу современных возможностей в области производительности (SSE4.1) и безопасности (AES-NI), что открыло для неё двери на рынок серверов и относительно производительных ПК. Однако архитектура, поддерживающая внеочередное исполнение инструкций, неизменно ведёт к увеличению размеров ядра и энергопотреблению. Чтобы этого гарантированно избежать, Intel не стала вводить в Silvermont поддержку Hyper-Threading и решила не увеличивать количество параллельно выбираемых и декодируемых инструкций. Как и в случае Bonnel/Saltwell, Silvermont умеет выбирать и исполнять две инструкции за такт (для сравнение, Haswell умеет исполнять 4–5 инструкций за такт (с учётом MacroFusion), а разработанные при участии легендарного Джима Келлера (Jim Keller) Apple Cyclone, Twister и Typhoon — шесть).

Intel Atom Avoton

Intel Atom Avoton

Благодаря тому, что Intel имеет существенное преимущество перед другими производителями в виде собственных фабрик и лучших в индустрии технологических процессов, переход к OOO-архитектуре (точнее, добавление соответствующей логики) не только не привёл к увеличению энергопотребления, но и дал возможность снизить его у процессоров для телефонов/планшетов. По сути, именно с Silvermont у экономичных ядер Intel появилось новое предназначение: мобильные телефоны. Ни Bonnell, ни Saltwell под эти устройства не проектировались.

Более того, по словам Intel, применение 14-нм технологического процесса дало возможность увеличить производительность в случае с микроархитектурами Airmont и Goldmont. К сожалению, компания не указывает на конкретные улучшения Airmont и Goldmont, но учитывая тот факт, что обе базируются на Silvermont, принципиальная архитектура осталась прежней: ядро может декодировать две инструкции за такт.

Области применения Intel Silvermont

Области применения Intel Silvermont

Именно благодаря Silvermont области применения экономичных микроархитектур Intel существенно расширились. Помимо клиентских SoC, энергоэффективные ядра применяются для различных чипов встраиваемых систем, процессоров для микросерверов, а также суперкомпьютерных ускорителей Xeon Phi.

Системы на кристалле для серверов имеют большое количество ядер (до восьми в текущем поколении), поддерживают различные технологии, которых нет в SoC для клиентских ПК (ECC, виртуализация, криптографический ускоритель QuickAssist и т. д.), а также включают в себя большое количество различных интерфейсов ввода/вывода. Основными преимуществами использования микроархитектур вроде Silvermont и Airmont для таких микросхем является как относительно низкое энергопотребление, так и меньшие размеры самих ядер, что крайне важно при создании многоядерных конфигураций для микросерверов.

Ближайшие планы

Чуть позже в этом году Intel планирует выпустить новые SoC для планшетов, дешёвых ноутбуков, гибридных ПК, а также недорогих настольных ПК. Платформы Apollo Lake и Willow Trail будут базироваться на микроархитектуре Goldmont и графических ядрах девятого поколения. Новые системы на кристалле смогут похвастаться увеличенной производительностью, а также способностью кодировать и декодировать видео (с разрешением до 3840 × 2160 точек) при помощи кодеков HEVC и VP-9, что позволит не экономить заряд батареи при просмотре качественных видео на YouTube.

Платформа Intel Apollo Lake

Платформа Intel Apollo Lake

Что касается рынка микросерверов, то для них Intel готовит новое семейство процессоров Atom C3000 (Denverton). Как говорят слухи, Denverton будет иметь весьма впечатляющие характеристики: 16 ядер Goldmont, 16 Мбайт кеша второго уровня (по 2 Мбайт на пару ядер), контроллер PCI Express 3.0 x16, четыре порта 10Gb Ethernet, USB 3.0, Serial ATA и поддержка до 128 Гбайт памяти типа DDR4-2400. Будучи сделанным по 14-нм технологическому процессу, данная микросхема обещает быть очень экономичной, что позитивно скажется на возможностях конкурировать с аналогичными решениями на базе ARMv8.

Если будущее Intel на рынке мобильных телефонов довольно очевидно, а ближайшие планы в области планшетов ясны, то будущее самой платформы Atom, а также энергоэффективных микроархитектур находится под вопросом. Так, Intel не анонсировала каких-либо микроархитектур после Goldmont. Также ничего не известно и про наследников платформ Apollo Lake и Willow Trail. Это не означает, что их нет, но отсутствие информации говорит о том, что компания либо не готова принять на себя обязательства по выпуску определённого семейства продуктов, либо всё еще работает над его характеристиками.

А нужны ли энергоэффективные ядра?

Учитывая возрастающую параллельность исполнения инструкций у высокопроизводительных микроархитектур Intel (Haswell, Broadwell, Skylake, Kaby Lake), а также их снижающееся энергопотребление и размеры, для очень многих задач они могли бы заменить экономичные микроархитектуры (Silvermont, Airmont, Goldmont).

Система на кристалле Intel Atom

Система на кристалле Intel Atom

К примеру, двухъядерные процессоры Skylake-Y (Core M-6Yxx) имеют TDP около 4,5 Вт, тогда как SDP (scenario design power) четырёхъядерного Cherry Trail (Atom x5-8300/x5-8500/x7/8700) составляет всего против 2 Вт. Следует помнить, что Cherry Trail — полноценная система на кристалле и состоит всего из одной 14-нм микросхемы. В то же время, Skylake-Y (2+GT2) состоит из двух микросхем: процессора, который производится с использованием 14-нм литографии, и набора логики Intel 100-серии, который изготовляется по технологическому процессу 22 нм. Компания Intel не раскрывает SDP для каждого из кристаллов, но поскольку это один продукт, указывается общий максимальный SDP. Хотя низкое SDP позволяет использовать Skylake-Y в планшетах, а мощные x86-ядра и графический процессор с 24 вычислительными процессорами (execution units, EUs) означают высокую производительность, энергопотребление решения на базе Airmont в два раза ниже. Трудно сказать, насколько ядра Skylake потребляют больше энергии по сравнению с Airmont, но очевидно, что разница существует.

Кроме того, Cherry Trail должен быть дешевле Skylake-Y. По некоторым оценкам, размер четырёхъядерного кристалла Cherry Trail составляет около 85 мм2, тогда как размер кристалла двухъядерного Skylake-Y (2+GT2) — примерно 100 мм2. При этом последний требует чипа-компаньона, что дополнительно увеличивает его стоимость.

Intel Xeon D

Intel Xeon D

Возможно, размеры, чуть более высокий SDP и цена не столь важны для дорогих планшетов или систем 2-в-1. Однако для серверных SoC, где количество ядер критично, а размеры кристалла влияют на конечную цену, небольшие размеры ядер могут стать преимуществом. Впрочем, учитывая тот факт, что Intel не обновляла модельный ряд серверных Atom с 2013 года, а недавно выпустила Xeon D c 16 ядрами Broadwell для рынка микросерверов, в компании отдают приоритет высокопроизводительным решениям. Это логично, поскольку производительность ядер вроде Silvermont для однопоточных задач довольно низка, что означает увеличение задержек при обработке данных, а это заметно снижает энергоэффективность самих серверов (пока процессор обрабатывает задачу, сервер держит включёнными другие компоненты системы, тратя энергию), увеличивая стоимость владения центром обработки данных.

Тем не менее, в официальных планах Intel значится серверный SoC под названием Atom C3000 (Denverton), который должен появиться во второй половине года. Denverton задерживался уже как минимум один раз, что говорит о том, что приоритеты Intel на рынке ЦОД сосредоточены на высокопроизводительных решениях, а не на микросерверах, чьи преимущества во многом существуют лишь на бумаге. Тем не менее, 16 ядер общего назначения и богатый набор возможностей ввода/вывода должны помочь ему конкурировать с разнообразными SoC на базе ARMv8, имея неоспоримый козырь: совместимость с x86.

Intel Xeon Phi Knights Landing

Intel Xeon Phi поколения Knights Landing

Более того, выходящий вскоре Xeon Phi (Knights Landing) базируется на 72 ядрах на основе Silvermont (с очень существенными доработками, которые дадут возможность исполнять 512-разрядные инструкции AVX, добавят четырёхпоточный Hyper-Threading, увеличат пропускную способность кешей и т. д.). При этом Intel утверждает, что это полноценные ядра, которые способны запускать операционные системы. Иными словами, суперкомпьютерам на базе подобных Xeon Phi (установленным в процессорные гнёзда, а не в PCIe разъёмы) не потребуются обычные Xeon, что удешевляет стоимость систем, а также увеличивает их энергоэффективность. Учитывая, что перспективный план для Xeon Phi уже составлен на годы вперёд, очень вероятно, что и Knights Hill базируется на x86-совместимых ядрах, но, каких именно — не известно.

Основным преимуществом энергоэффективных ядер Intel для Xeon Phi является их малая площадь и возможность установить их в сопроцессор в больших количествах. В конечном итоге, одной из задач при разработке архитектуры Bonnell было создание мультиядерных микросхем. Доработанный Silvermont в Knights Landing показывает, что компания продолжает считать экономичные ядра оптимальным решением для подобных суперкомпьютерных устройств, которым едва ли требуется максимальная производительность в однопоточных приложениях.

Как видно, применение микроархитектур Airmont и Silvermont вполне оправдано в дешёвых мобильных и настольных клиентских решениях, в суперкомпьютерных процессорах, а также в некоторых видах серверов (главное, не переоценить перспективы этих машин). Судя по всему, экономичные ядра Intel рано списывать со счетов прямо сейчас. Однако что же нас ждёт в будущем?

Энергоэффективные CPU Intel: Перспективы

К сожалению, о будущем энергоэффективных микроархитектур Intel не известно ничего. Вполне может быть, что у Intel есть возможность и дальше усовершенствовать архитектуру, которая выбирает/декодирует две инструкции за такт (например, путём добавления Hyper-Threading, улучшения блоков выборки, добавления исполнительных устройств, увеличение размеров OOO буферов, уменьшение латентности кешей и т. д.). Однако более логичным было бы «расширение» архитектуры в сторону увеличения одновременно исполняемых инструкций. Но это неизбежно увеличит размеры ядра, а также его энергопотребление, приблизив эти показатели к таковым у высокопроизводительных ядер.

Intel Atom S1200

Intel Atom S1200

Имеет ли для Intel смысл увеличивать параллельность экономичных микроархитектур, при условии, что обычные архитектуры продолжат исполнять четыре инструкции за такт, а значит, разница между двумя микроархитектурами Intel будет сокращаться? Учитывая тот факт, что основная архитектура для Kaby Lake и CannonLake уже определена, Intel не планирует грандиозных изменений в своих высокопроизводительных микроархитектурах как минимум до конца 2018 года (учитывая слухи об Ice Lake и Tiger Lake, и того дольше). Как следствие, как минимум до этого срока Intel не будет заинтересована сокращать разрыв между экономичными и высокопроизводительными микроархитектурами.

Кроме того, если Intel хочет продолжать разрабатывать энергоэффективные малые ядра с прицелом на Xeon Phi, то большого смысла увеличивать параллелизм исполнения инструкций в этих ядрах с одновременным их увеличением для компании нет. Но при этом нет и смысла использовать экономичные ядра только в суперкомпьютерных ускорителях на базе архитектуры MIC (many Intel core). Следующее мини-ядро понадобится Intel для Xeon Phi четвёртого поколения, известного как Knights Hill, которое будет производиться по технологии 10 нм и увидит свет в конце этого – начале следующего десятилетия. Теоретически, Intel могла бы задействовать для Knights Hill ядро Goldmont, однако поскольку нам неизвестны требования к процессорам Xeon Phi 2019–2020 годов, с уверенностью этого сказать нельзя.

Модуль Intel Curie на базе процессора Quark

Модуль Intel Curie на базе процессора Quark

Понятно одно, с уходом Intel с рынка процессоров для смартфонов компании более не требуется разрабатывать процессорные ядра с минимальным энергопотреблением с прицелом на подобные устройства. Однако Intel не планирует уходить с рынка процессоров для носимой и ультракомпактной электроники (что странно, поскольку конкуренция там ожидается нешуточная, а видимых преимуществ у x86 там нет), а значит, компания продолжит работать на сокращением энергопотребления электронных схем как таковых. Учитывая, что Intel перепрофилирует устаревшие ядра в процессорах Quark для носимой и ультракомпактной электроники, ядра Silvermont/Airmont/Goldmont могли бы иметь смысл для таких устройств будучи дополнительно оптимизированными и сделанными по технологии 7 нм.

Судя по всему, различная продукция на базе ядер Goldmont будет выпускаться в ближайшие пару лет для сегментов недорогих ПК и даже серверов. При этом у компании не будет возможности уменьшить размеры и энергопотребление своих недорогих SoC при помощи нового технологического процесса до конца 2017 года. Как следствие, либо Intel придётся пропустить цикл выпуска дешёвых процессоров для ПК и планшетов в начале 2017, либо усовершенствовать имеющиеся проекты, как минимум интегрировав в них новый графический процессор от Kaby Lake.

Экспериментальный процессор Intel

Экспериментальный процессор Intel

Обычно разработчики микропроцессоров (AMD, ARM, IBM, Intel) обнародуют особенности микроархитектур за год–два до их выхода на рынок, чтобы позволить разработчикам программного обеспечения оптимизировать свои продукты под новые CPU. Поскольку про наследников Goldmont не известно ничего, очень вероятно, что в ближайшей 12–24 месяца их не появится. Учитывая обновлённую область применения энергоэффективных малых ядер Intel, инженерам корпорации более нет смысла делать их максимально экономичными, но имеет смысл сохранять минимальные размеры ядра. Будет ли иметь смысл для этой цели разрабатывать отдельные ядра (которые сильно уступают высокопроизводительным по скорости), или же есть смысл максимально урезать высокопроизводительные ядра — не известно. Однако очевидно, что сузившаяся область применения окажет влияние на принимаемые Intel решения и есть большая вероятность, что они будут не в пользу экономичных микроархитектур.

Источник:

airmont, atom, Cannonlake, Goldmont, Ice Lake, intel, Kaby Lake, quark, silvermont, Skylake, Tiger Lake

Читайте также