AMD Ryzen: подробности об архитектуре и публичная демонстрация

Ключевой разработкой корпорации Advanced Micro Devices последних лет является процессорная микроархитектура Zen. Компания AMD возлагает большие надежды на новые CPU и рассчитывает на то, что они помогут ей вернуть утраченные позиции на рынке персональных компьютеров и серверов, увеличить выручку и норму прибыли. В последние несколько месяцев AMD начала раскрывать подробности о новой микроархитектуре и особенностях новых платформ для ПК и серверов. Одной из важных вех на пути новых CPU на рынок стал анонс коммерческого названия новых процессоров, а также демонстрация их работы на этой неделе. Ниже мы попытаемся кратко подытожить то, что мы уже знаем о микроархитектуре Zen, а также о процессорах Ryzen на её базе.

Микроархитектура

Микроархитектура Zen является первой полностью новой микроархитектурой AMD с конца 2011 года, когда компания представила Bulldozer. Приоритеты при создании последней отдавались возможностям быстрого роста тактовых частот, количества ядер (в том числе за счёт использования двухъядерных кластеров), а также постепенному усовершенствованию последних. Физическое воплощение Bulldozer первого и второго поколения продемонстрировало, что данная микроархитектура не может обеспечить сравнимую с основным конкурентом производительность при схожем энергопотреблении, а потому в 2012 году было принято решение отказаться от серьёзной доработки Bulldozer и сосредоточить инженерные ресурсы компании на разработке принципиально новой микроархитектуры, получившей название Zen.

AMD Ryzen: подробности об архитектуре и публичная демонстрация

Глава AMD представляет процессоры Ryzen

AMD Zen коренным образом отличается от Bulldozer в том, что касается приоритетов. Джим Келлер (Jim Keller), главный архитектор Zen, поставил перед разработчиками ядра задачу максимально увеличить количество одновременно исполняемых инструкций (instructions per clock, IPC) без увеличения потребляемой мощности. Подобный подход исповедуется довольно широко, а его преимущества отлично иллюстрируются процессорами Apple, когда микросхемы с двумя ядрами оставляют позади конкурентов с четырьмя в многопоточных приложениях. Разумеется, «широкие» ядра имеют свои ограничения (размеры, тактовые частоты и т. д.), но их преимущества перевешивают возможные недостатки.

Принимая во внимание всё вышесказанное, неудивительно, что ядро AMD Zen существенно отличается от предшественников. С точки зрения исполнительных устройств ядро Zen имеет четыре блока целочисленных операций (ALU) и один модуль операций с плавающей запятой (FPU) с двумя блоками сложения (ADD) и двумя блоками умножения (MUL). Внимательный читатель может отметить, что количество исполнительных устройств в ядре Zen полностью соответствует количеству исполнительных устройств в «двухъядерном» модуле Bulldozer. Работая в парах, указанные блоки могут исполнять либо две операции совмещённого умножения-сложения (fused multiply-accumulate, FMAC) за такт, либо одну 256-разрядную инструкцию AVX.

Ядро AMD Zen

Ядро AMD Zen

Однако ключом к высокой производительности современных CPU зачастую являются не только существенные вычислительные ресурсы, но и способность процессоров полностью задействовать потенциал этих ресурсов. Чтобы иметь возможность эффективно загрузить вычислительные ресурсы, ядро Zen использует полностью новый блок прогнозирования ветвлений, новый декодер инструкций, новую систему кеширования внутри ядра с кешем декодированных микроопераций, расширенное на 75 % окно планировщика инструкций, расширенный в полтора раза исполнительный тракт (и упомянутое выше симметричное увеличение числа исполнительных устройств), а также другие улучшения.

Новый блок предсказания переходов

Новый блок предсказания переходов

Помимо всего прочего, AMD упомянула, что новый блок предсказания ветвлений основан на аппаратной нейронной сети и является обучаемым, то есть он может делать предположения касательно данных/инструкций, которые понадобятся в ближайшее время (а затем загружать их в соответствующие кеши) не только на основе аппаратно «зашитых» шаблонов, но и на основе анализа поведения приложения. На данном этапе AMD не стремится рассказать подробности о механизмах обучения; почему именно они лучше, чем традиционные алгоритмы предсказаний, и как «обучаемый» блок предсказаний гарантирует защиту от неверных предсказаний (которые уменьшают производительность и увеличивают энергопотребление). Тем не менее, упоминание механизмов даёт поверхностное представление о масштабах и характере изменений в ядре Zen по сравнению с предшественниками.

Блок предсказания переходов на основе нейронной сети

Блок предсказания на основе нейронной сети

Как уже сообщалось, каждое ядро Zen может конкурентно исполнять два потока одновременно, что призвано обеспечить более эффективную загрузку исполнительного тракта и дополнительно увеличить производительность на ватт. Объём кеш-памяти второго уровня составит 512 Кбайт на ядро. Ядра Zen будут группироваться в кластеры по четыре ядра с 8 Мбайт разделяемого «виктимного» (victim) кеша третьего уровня. Таким образом, в микросхемах с числом ядер более четырёх будут использоваться два кластера. Подобная компоновка облегчает создание многоядерных CPU для серверов, а заодно указывает на то, что AMD обладает необходимой «обвязкой» для создания таковых — высокоскоростной внутренней шиной, многоканальными контроллерами памяти и другими элементами для подобных устройств.

Частоты и энергопотребление

Возможности микроархитектуры являются важнейшей составляющей производительности процессоров. Однако ничуть не менее значимыми являются высокие тактовые частоты при минимально возможном энергопотреблении, что обеспечивается как микроархитектурой, так и технологией производства микросхем. Для изготовления процессоров на базе микроархитектуры Zen первого поколения будет применяться технология 14LPP с некоторыми доработками GlobalFoundries. Это большой шаг вперёд по сравнению с 32-нм и 28-нм техпроцессами GlobalFoundries и TSMC, которые использовались для предыдущих поколений APU и CPU разработки AMD последние пять лет.

Начиная с мобильных процессоров Carrizo в 2015 году корпорация AMD внедряла в свои процессоры набор различных датчиков с целю обеспечить возможность работы технологии динамического масштабирования напряжения питания и частот процессора (dynamic voltage and frequency scaling, DVFS). В случае с мобильными процессорами технология могла кратковременно снижать напряжение питания и частоту на неиспользуемых участках CPU, тем самым экономя потребляемую мощность.

AMD Pure Power

AMD Pure Power

Судя по всему, в процессоры Ryzen на базе Zen будет внедрена новая версия технологии DVFS, называемая Pure Power. Датчики Pure Power будут соединяться между собой при помощи технологии Infinity Fabric (что, судя по названию, намекает на «бесконечное» количество поддерживаемых устройств), а изменения тактовых частот CPU будут осуществляться как вверх, так и вниз, с шагом 25 МГц благодаря технологии Precision Boost. Пока не ясно, будет ли последняя манипулировать тактовой частотой всей микросхемы, отдельных ядер (как это делает Intel Turbo Boost Max Technology 3.0) или отдельных участков микросхем. К примеру, процессоры Intel Core i7 Extreme Edition на базе ядер Broadwell-E умеют снижать тактовую частоту на ядрах, занятых исполнением энергоёмких AVX-инструкций. Если бы AMD удалось реализовать то же самое, но при этом снижать частоты динамически, это дало бы преимущества процессорам компании в ряде приложений, задействующих AVX.

AMD Extended Frequency Range (XFR)

AMD Extended Frequency Range (XFR)

Наличие огромное количества датчиков внутри процессорных ядер, способность оперативно получать с них данные и анализировать их в реальном времени, а также поддержка технологии Precision Boost открывает AMD ещё один способ увеличить производительность своих CPU. Не секрет, что многие энтузиасты используют очень продвинутые системы охлаждения, способные рассеивать огромное количество тепловой энергии. К примеру, гигант Alpenföhn Olymp способен рассеять до 340 Вт, мощные жидкостные системы охлаждения — 300+ Вт, а жидкий азот и того больше. Измеряя температуру процессора, а также динамику её изменений относительно загрузки и тактовых частот, микропроцессор Ryzen может сделать вывод об используемой системе охлаждения и попытаться увеличить свою тактовую частоту свыше заявленной для режима Turbo. AMD называет эту технологию Extended Frequency Range (XFR), но не говорит, будет ли она поддерживаться всеми микросхемами Ryzen, или же только самыми производительными (по примеру Intel Turbo Boost Max Technology 3.0). По сути, AMD намекает на то, что Ryzen для настольных ПК смогут разгонять себя сами при наличии достойной системы охлаждения. При этом наиболее вероятным является сценарий, когда XFR будет отключён для мобильных и серверных микросхем, поскольку увеличение частот ведёт к увеличению энергопотребления, что является негативным для ноутбуков и центров обработки данных.

В ближайшие месяце AMD предстоит ещё много рассказать об архитектуре процессоров Ryzen, об их возможностях управлять частотами и многом другом. Тем не менее, основной посыл AMD — очевиден. Одним из ключевых нововведений Ryzen станет возможность максимально тонкой настройки частот для достижения максимальной производительности и минимального энергопотребления в каждый конкретный момент времени.

Платформа

В полном соответствии с традициями последних лет процессоры AMD Ryzen в форм-факторе AM4 получат некоторые функциональные возможности, когда-то присущие наборам логики. Известно, что процессоры Ryzen будут иметь встроенные контроллеры памяти DDR4, PCI Express 3.0, NVMe, Serial ATA, SATA Express и т. д. Перенесение поддержки основного накопителя данных непосредственно в CPU сокращает задержки при обращении к быстрым SSD, что несколько увеличит общую производительность системы. Что более важно, выделенные линии PCIe для твердотельных накопителей дадут возможность использовать основные линии исключительно для графических карт, что максимизирует предельную производительность игровых ПК.

Платформа AM4 для процессоров AMD Ryzen

Платформа AM4 для процессоров AMD Ryzen

Перенос основных возможностей ввода/вывода непосредственно в CPU также даёт возможность отказаться от набора логики и максимально упростить материнские платы для недорогих ПК. Однако едва ли производители материнских плат воспользуются этой возможностью при создании платформ для Ryzen на базе кристаллов Summit Ridge. Процессоры с восемью ядрами предназначены для высокопроизводительных ПК с большим количеством накопителей, мощными графическими картами и т. п., для таких систем нет смысла экономить несколько десятков долларов на материнской плате. Тем не менее, процессоры Raven Ridge со встроенным графическим ядром, а также недорогие Summit Ridge с четырьмя ядрами, в ряде случаев вполне могут обойтись и без дорогого набора логики (например, в случае использования в ПК класса всё-в-одном или форм-фактора Mini-ITX).

Поскольку первые процессоры семейства AMD Ryzen будут предназначены в первую очередь для мощных игровых ПК, то и экипироваться такие компьютеры будут соответствующими наборами логики с богатыми функциональными возможностями вроде поддержки USB 3.1 со скоростью передачи данных 10 Гбит/с и других. На сегодняшний день компания AMD воздерживается от более точного описания возможностей высокопроизводительных платформ AM4, но указывает на максимальные возможности модернизации и расширения, что является отличительной чертой платформ Intel HEDT.

Первая материнская плата под AMD Ryzen… и не только

Материнские платы AM4 для процессоров Ryzen/Summit Ridge не были основной темой мероприятия AMD, а потому компания не стремилась акцентировать на них внимание. Тем не менее, в презентации для журналистов приводится фотография материнской платы с гнездом AM4 для игровых компьютеров. Судя по всему, именно это системная плата в форм-факторе ATX сейчас используется для демонстрации возможностей AMD Ryzen.

Поскольку данная материнская плата не была анонсирована официально, AMD попыталась скрыть производителя и модель новинки при помощи чёрной изоленты и программы Adobe Photoshop. Тем не менее, ряд косвенных признаков говорят о том, что мы имеем дело с изделием MSI среднего ценового сегмента, чьё состояние готовности не так далеко от финального: плата уже экипирована «стильными» радиаторами на наборе логики и модуле регулятора напряжения (voltage regulator module, VRM), а также укреплённым разъёмом PCI Express, но всё ещё нуждается в неких последних штрихах (например, в корпусировке контактов для USB на фронтальной панели ПК, маркировке разъёмов DIMM и другой «косметике»).

Материнская плата AM4

Материнская плата AM4

Что касается самой платы, то мы можем заметить довольно скромный шестифазовый преобразователь напряжения питания процессора, что свойственно недорогим платформам. Среди портов ввода/вывода для задней панели ПК можно заметить как один коннектор USB Type-C, так и DVI и даже D-Sub. По всей видимости, наличие разъёмов для подключения монитора говорит о том, что данная материнская плата с гнездом AM4 предназначена не только для процессоров Summit Ridge, но и для APU Raven Ridge со встроенным графическим ядром.

Материнская плата экипирована двумя слотами PCI Express x16, парой разъёмов PCI Express x1 и даже двумя слотами PCI, что весьма странно для современного ПК. Несмотря на наличие двух архаичных разъёмов, на плате видно лишь два порта Serial ATA, один разъём M.2-22110 для твердотельного накопителя и один коннектор U.2 для ещё одного SSD. Мы не знаем, возможна ли одновременная работа накопителей подключённых к M.2 и U.2 (поскольку мы не знаем количество поддерживаемых данной платформой линий PCIe 3.0), но даже четыре накопителя данных для высокопроизводительного современного ПК непростительно мало, но вполне достаточно для системы на базе APU. Что касается подсистемы памяти, то мы видим четыре разъёма для модулей, которые поддерживают до 64 Гбайт DDR4, что является обычным для материнских плат ATX.

Главный вывод, который можно сделать глядя на системную плату, показанную AMD, это то, что компания, судя по всему, использует универсальную платформу для процессоров Summit Ridge и Raven Ridge для демонстрации первых. Трудно сказать, означает ли это, что выпуск Raven Ridge не за горами (появление данной микросхемы сложно ожидать ранее второй половины 2017 года), но, по меньшей мере, это означает, что энергопотребление восьмиядерного процессора AMD Ryzen действительно укладывается в 95 ватт, что само по себе является существенным достижением.

Демонстрация и производительность

Мероприятии New Horizon не стало первой публичной демонстрацией систем на базе Ryzen. Впервые компания показала работающий CPU на базе микроархитектуры Zen в августе этого года. Тем не менее, оно стало первым, где AMD показало работу Ryzen в типичных приложениях, а не в синтетических программах с открытым исходным кодом.

AMD Ryzen (Summit Ridge): 8 ядер, тактовая частота 3,4 ГГц, 20 Мбайт кеша, 95 Ватт

AMD Ryzen (Summit Ridge): 8 ядер, тактовая частота 3,4 ГГц, 20 Мбайт кеша, 95 Вт

Если в августе AMD демонстрировала работу восьмиядерного CPU на базе Zen при в программе Blender, которая используется при создании трёхмерных анимационных фильмов, то на этой неделе восьмиядерный процессор AMD Ryzen на частоте 3,4 ГГц был использован для запуска игр Battlefield 1, Doom, Star Wars: Battlefront, а также приложений Handbrake, Z-Brush и Key Shot.

Впрочем, без Blender не обошлось и в этот раз: программа использовалась для рендеринга процессора с логотипом Ryzen. В последнем случае производительность AMD Ryzen сравнивалась с таковой у системы на базе Intel Core i7-6900K (8 ядер, 3,2 ГГц), а сравнение выявило примерный паритет при несколько меньшем энергопотреблении микросхемы AMD. Благостную картину несколько смазал тот факт, что память Core i7-6900K работала в двухканальном режиме (при этом процессор поддерживает четырёхканальный режим работы). Те же ПК использовались для транскодирования видео при помощи программы Handbrake, также выявившей некоторое преимущество Ryzen перед конкурентом (54 секунды против 59 секунд). Хотя и Blender, и Handbrake показывают паритет между Ryzen и Core i7-6900K, следует понимать, что, во-первых, оба не являются популярными приложениями среди абсолютного большинства пользователей (впрочем, кодеки X264 и Х265 c открытым исходным кодом используются далеко не только в Handbrake); а во-вторых, являются программами с открытым исходным кодом, которые могут быть оптимизированы (или, наоборот, деоптимизированы…) под конкретные CPU силами разработчиков последних. Как следствие, попытка анализа результатов Blender и Handbrake в данном случае — не самая лучшая идея. Помимо всего прочего, во время демонстрации AMD не делала акцента на возможностях XFR (было бы логично показать, как процессоры Ryzen ведут себя под жидким азотом), что может говорить о том, что пока данная возможность работает не так, как того желает AMD.

Результаты работы AMD Ryzen 3,4 ГГц и Intel Core i7-6900K в Handbrake

Результаты работы AMD Ryzen 3,4 ГГц и Intel Core i7-6900K в Handbrake

Что касается запуска игр, то компания не делала акцента на производительности CPU, а стремилась показать, что новые процессоры Ryzen стабильно работают на заданных частотах в том числе в играх. Учитывая, что большинство игр сегодня затачиваются под популярные четырёхъядерные Core i5/Core i7 (и которые оказываются лучше приспособленными к играм за счёт высокой тактовой частоты, чем Core i7-6900K), то восьмиядерный Ryzen едва ли покажет в них все свои возможности (если только процессоры Ryzen не умеют избирательно разгонять N ядер из восьми при обнаружении рабочей нагрузки для N ядер).

Интересно отметить, что во время демонстрации процессоров Ryzen AMD впервые показала широкой публике работу своей высокопроизводительной графической карты следующего поколения на базе процессора Greenland (Vega) с 8 Гбайт памяти HBM2 (т. е. были использованы не анонсированные официально микросхемы 2Hi ёмкостью 2 Гбайт), которая почему-то работала на тактовой частоте 500 МГц. Сниженные тактовые частоты памяти свойственны в первую очередь вычислительным ускорителям, где объём памяти играет большую роль, а пропускная способность — меньшую. В случае с игровыми графическими картами существует предельный полезный объём памяти, при этом повышение пропускной способности почти всегда ведёт к увеличению производительности в высоких разрешениях с применением сглаживания. В AMD решили несколько замедлить работу графической карты следующего поколения: возможно, чтобы не давать основному конкуренту возможности проанализировать возможности новых GPU, которые демонстрировались в играх Doom и Star Wars: Battlefront в разрешении 4K (3840 × 2160). Как бы там ни было, в прошлом году предполагалось, что Greenland станет флагманской графической картой AMD в этом году, однако компания решила перенести его анонс на начало 2017 года. Принимая это во внимание, показ Greenland состоялся сильно позже предполагаемых изначально сроков.

Что касается сроков появления на рыке процессоров Ryzen, то компания AMD обещает начать продажи данных микросхем уже в первом квартале. Причём, по словам Лизы Су (Lisa Su), исполнительного директора AMD, «скорее, чем вы думаете». Означает ли это, что новинки появятся в продаже в январе, а не в марте — непростой вопрос.

Источник:

#amd, AM4, Ryzen, zen

Читайте также