То, какое решительное наступление смогла развить за короткий срок AMD на процессорном рынке, действительно поражает. С марта, когда были представлены первые процессоры Ryzen, основанные на новой микроархитектуре Zen, прошло всего пять месяцев. Но за это время компания не просто сумела развернуть всеобъемлющий модельный ряд массовых десктопных процессоров стоимостью от $100 до $500, но и добиться его обрастания полноценной замкнутой экосистемой.
Это тем более кажется удивительным на фоне того, что первоначально выпуск процессоров Ryzen 7 производил впечатление плохо подготовленного и явно поспешного. Материнские платы и кулера были в дефиците, совместимость со скоростной DDR4-памятью была удручающей, вызывал серьёзные нарекания и уровень производительности, который новые процессоры показывали в целом ряде приложений, особенно игровых. Однако все эти детские проблемы компании AMD удалось быстро и эффективно устранить. Тесная работа с партнёрами привела к тому, что ассортимент материнских плат для Ryzen стал весьма обширен, а популярные системы охлаждения быстро получили необходимую совместимость с Socket AM4. Решены были и многие вопросы с производительностью. Выпуск оптимизированного профиля управления питанием для Windows 10 смог поднять время реакции процессоров при малопоточной нагрузке, а обновления внутренних библиотек AGESA позволили поднять эффективность контроллера памяти и придать ему значительно более широкие возможности по работе с различными скоростными модулями DDR4 DIMM.
В результате достаточно быстро платформа Socket AM4 превратилась из экспериментального продукта с неясными перспективами в весьма соблазнительный вариант для тех потребителей, которые ищут выгодные многоядерные решения с хорошим сочетанием цены и производительности. И такое предложение уже успели по достоинству оценить многие энтузиасты. Популярность процессоров Ryzen стала быстро расти.
Но AMD не останавливается на достигнутом. Сделав вполне конкурентоспособное решение для массового рынка, компания задумала замахнуться на сегмент, в котором она не могла выступать последние лет десять – на процессоры для десктопов премиального уровня, HEDT (High-End Desktop). Как оказалось, новая микроархитектура Zen может прекрасно подойти и для таких продуктов, ведь она предлагает достойную удельную производительность, которая хорошо раскрывается в приложениях для создания и обработки цифрового контента. И более того, ядра Zen легко собираются в крупные кластеры, позволяя без обременительных накладных расходов создавать процессоры с большим числом вычислительных ядер.
Именно эти особенности Zen и сподвигли AMD на создание Ryzen Threadripper – новой элитарной платформы, в рамках которой будут существовать в два раза более мощные по сравнению с обычными Ryzen процессоры, способные предоставить пользователям до 16 вычислительных ядер, работающих на сравнительно высоких тактовых частотах. Это, безусловно, недешёвый и нишевый проект, и, судя по всему, с его помощью компания не планирует бить рекорды продаж, а собирается решать несколько иную задачу стратегического характера. Ryzen Threadripper должен показать общественности, что AMD действительно вернулась в высшую лигу процессорного рынка и ей вполне по силам создание процессоров, способных попирать позиции интеловских чипов в любом сегменте.
С этой точки зрения момент для выпуска Ryzen Threadripper оказался выбран очень удачно. На данный момент в модельном ряду интеловских HEDT-процессоров происходит смена архитектур, и отсутствуют предложения с числом ядер более десяти. В результате у AMD появился реальный шанс на некоторое время стать разработчиком, предлагающим самые быстрые процессоры для настольных компьютеров. В данном обзоре мы проверим, смогла ли AMD воспользоваться открывшейся возможностью, и будут ли способны новые процессоры Ryzen Threadripper заинтересовать энтузиастов высокой производительности, традиционно отдававших предпочтение процессорам класса Core i7 (i9) Extreme Edition.
⇡#Особенности конструкции Ryzen Threadripper
Стремление компании AMD попасть в сегмент высокопроизводительных настольных систем (HEDT) трудно назвать неожиданным. Коль скоро в её распоряжении появилась конкурентоспособная микроархитектура, которая позволяет проектировать не только десктопные, но и серверные решения, попытка оккупировать настольные компьютеры премиального класса – само собой разумеющийся следующий шаг. Intel уже многие годы занимается тем, что для сегмента HEDT адаптирует свои серверные CPU, и это даёт нормальные результаты и не кажется чем-то противоестественным. У AMD же теперь тоже есть очень достойные процессоры EPYC, ориентированные на дата-центры, поэтому логично, что компания решила попытаться сделать на их основе решения, которые могут заинтересовать нуждающихся в высоких вычислительных мощностях любителей и профессионалов.
Впрочем, сразу же следует отметить, что подход у AMD в отношении высокопроизводительной платформы не совсем такой, как у Intel. В то время как микропроцессорный гигант действительно использует для своих процессоров Core i9 полностью аналогичную серверным CPU полупроводниковую базу, Ryzen Threadripper и EPYC имеют между собой много меньше общего. Но связано это не с тем, что инженеры AMD решили заняться проектированием специальных полупроводниковых чипов для энтузиастов, а с тем, что AMD проповедует в принципе иной подход к построению продуктов разных классов.
Действительно, основой любых современных процессоров с микроархитектурой Zen выступает один и тот же восьмиядерный полупроводниковый кристалл Zeppelin, в котором содержится два CCX – четырёхъядерных CPU-комплекса. Этот кристалл используется во всех Ryzen с числом ядер от четырёх до восьми, что может даже показаться неким расточительством, однако на самом деле им не является, ведь должна же AMD иметь возможность куда-то реализовывать полупроводниковые кристаллы с браком. Zeppelin лежит и в основе серверных EPYC с числом ядер до 32, где такие кристаллы комбинируются на одной процессорной плате в кластеры по четыре штуки.
Ryzen Threadripper с точки зрения базовой конструкции представляет собой нечто среднее между EPYC и обычным Ryzen. Такие процессоры для энтузиастов высокой производительности должны иметь до 16 вычислительных ядер, так что для их сборки достаточно двух кристаллов Zeppelin. Поэтому в действительности Threadripper – это, грубо говоря, и есть двухпроцессорная система из пары Ryzen, собранная на единой процессорной подложке и выглядящая как один цельный процессор.
Однако на самом деле на уровне физического исполнения это не совсем так. Для того, чтобы упростить себе жизнь и не тратиться на организацию производства хоть и дорогостоящих, но всё же нишевых продуктов, AMD решила по возможности унифицировать Ryzen Threadripper с серверными EPYC. В конечном итоге они очень похожи внешне, и для них используется процессорное гнездо с одинаковой конфигурацией и 4096 контактами. Более того, как показали эксперименты со вскрытием крышки на образцах процессоров Ryzen Threadripper, внутри у них находится не по два, а по четыре полупроводниковых кристалла – точно так же, как и у новых серверных CPU компании AMD. Но это всё же не означает, что Threadripper – это производная от EPYC. Два «лишних» кристалла внутри этого процессора представляют собой простые полупроводниковые болванки, и они нужны лишь для правильного распределения механических усилий на процессорную сборку при её установке в сокете.
В конечном итоге, Ryzen Threadripper – это не урезанный EPYС, а просто его половина, сделанная из двух кристаллов Zeppelin. Это прослеживается во всех характеристиках, включая число ядер, объём кеш-памяти, количество каналов DDR4 SDRAM, возможности расширения и проч. Кроме того, в Threadripper нет никаких сугубо серверных штук вроде встроенного аппаратного криптографического движка и поддержки регистровой памяти. То есть, данный процессор, как и обычные Ryzen, ориентирован на потребительский сегмент.
Использование двух кристаллов Zeppelin означает, что внутри Ryzen Threadripper используется четыре CCX-комплектса, в каждом из которых имеется по 8 Мбайт разделяемой кеш-памяти. В сумме это даёт 32-мегабайтный L3-кеш, что ровно вдвое больше, чем предлагается в обычных Ryzen.
Помимо 16 вычислительных ядер Ryzen Threadripper может предложить четырёхканальный контроллер памяти с официальной поддержкой DDR4-2667 (здесь, как и раньше, есть определённые нюансы, касающиеся разной максимальной скорости с модулями DDR4 разной организации).
Каналы | Ранги DRAM | DIMM на канал | Число DIMM | Скорость |
---|---|---|---|---|
Четыре канала | Одноранговая | 1 | 4 из 8 | DDR4-2667 |
Четыре канала | Одноранговая | 2 | 8 из 8 | DDR4-2133 |
Четыре канала | Двухранговая | 1 | 4 из 8 | DDR4-2400 |
Четыре канала | Двухранговая | 2 | 8 из 8 | DDR4-1866 |
Естественно, поддерживается и разгон модулей DDR4 SDRAM выше номинальных частот. К настоящему моменту компании AMD удалось отладить работу своего контроллера памяти, поэтому никаких множественных проблем несовместимости отдельных модулей с процессорами Ryzen Threadripper уже быть не должно. Фактически можно рассчитывать на то, что контроллер памяти в новых HEDT-процессорах работает также, как контроллер в Ryzen после обновления библиотек AGESA до версии 1.0.0.6.
Общий объём памяти, который теоретически может адресовать Threadripper, достигает 2 Тбайт. Однако за неимением в данный момент на рынке небуферизированных модулей DDR4 SDRAM объёмом более 16 Гбайт, получить в системе на базе Ryzen Threadripper более 128 Гбайт не выйдет. Кроме того, не следует забывать и об ограничениях со стороны операционной системы. Более 128 Гбайт памяти, например, не поддерживается в Windows 10 Home, а версии Pro и Enterprise не могут работать с объёмами памяти более 512 Гбайт.
Подобным образом дело обстоит и с линиями PCI Express. EPYC в общей сложности имеют 128 линий PCI Express, а процессоры Threadripper предлагают вдвое меньше – до 64 линий PCI Express, которые могут дробиться или собираться произвольным образом. При этом существует лишь единственное ограничение: общее число PCIe-устройств (видеокарт, NVMe-накопителей и проч.), подключенных к Threadripper, не должно превышать восьми штук. Правда, одно PCIe x4-устройство в системах на базе Ryzen Threadripper есть всегда – это набор логики X399, поэтому пользователю в конечном итоге достаётся 60 линий PCI Express, которые можно поделить на семь устройств.
При этом на работу памяти и PCIe-устройств определённый отпечаток накладывает двухкомпонентное строение Ryzen Threadreaper. Поддержка четырёхканальной памяти и шины PCI Express в данном случае не совсем такая, как в HEDT-процессорах Intel, где применяется монолитный полупроводниковый базис. У AMD она оказывается не равномерной, а распределённой по двум кристаллам Zeppelin. Четырёхканальный контроллер памяти в Ryzen Threadripper – это на самом деле два независимых двухканальных контроллера DDR4 SDRAM, а работа 64 линий PCI Express обеспечивается двумя корневыми хабами PCI Express, которые физически находятся в разных кристаллах.
Но даже несмотря на всё это, думать о Ryzen Threadripper как о собранной в одной упаковке двухпроцессорной системе всё-таки не следует. Дело в том, что объединение двух кристаллов Zeppelin в единое устройство выполнено с использованием передовых технологий, способных обеспечить высокую пропускную способность и низкие латентности взаимодействий, получить которые в классических системах с двумя сокетами было бы нереально. Речь идёт о вездесущей шине Infinity Fabric – дальнейшем развитии HyperTransport, которое широко применяется AMD в том числе и внутри кристаллов Zeppelin для коммуникации между процессорными CCX-комплексами.
Шина Infinity Fabric, связывающая кристаллы в Ryzen Threadripper, имеет точно такую же пропускную способность, что и шина, пролегающая внутри Zeppelin. А это значит, что она синхронизирована по частоте с контроллерами памяти и может обеспечить передачу по 32 байт данных за каждый такт в каждую сторону. При использовании DDR4-2667-памяти это даёт, например, полосу пропускания в 85 Гбайт/с. Правда, в отличие от внутренней шины Infinity Fabric, внешняя шина применяется не только для межъядерных соединений и обслуживания доступа в память, но и для нужд контроллеров PCI Express, SATA и проч. Поэтому некоторая часть пропускной способности оказывается не всегда доступна. Кроме того, при использовании межкристалльной Infinity Fabric получаются выше и задержки – здесь отличие от внутренней шины примерно в 1,5-2 раза. Таким образом, процессор Ryzen Threadripper всё равно оказывается архитектурой с неравномерным доступом к памяти, что приводит к необходимости учитывать некоторые особенности. Поговорим о них подробнее.
⇡#Производительность межъядерного взаимодействия
Для того, чтобы проиллюстрировать тот факт, что ядра в Ryzen Threadripper по скорости взаимного обмена данными подразделяются на «ближайшие», находящиеся в одном CCX; «средние», находящиеся в одном кристалле Zeppelin, но в разных CCX; и «дальние», разнесённые по разным кристаллам, мы провели традиционный эксперимент по измерению латентностей при передаче данных от одного ядра к другому.
Приведённые в таблице числа относятся к Ryzen Threadripper 1950X, работающему с DDR4-3200 SDRAM.
Результаты очень наглядны. Латентность взаимодействия между ядрами, находящимися внутри одного CCX-комплекса, находится на очень хорошем уровне. Порядка 40 нс – это даже лучше задержки, который даёт интеловская кольцевая шина, так что процессоры AMD позволяют передавать данные между ядрами внутри одного CCX-комплекса даже быстрее, чем это могут делать лучшие интеловские процессоры. К тому же появившаяся в Skylake-X ячеистая сеть по сравнению с кольцевой шиной ухудшила латентности межъядерного взаимодействия, и теперь новые HEDT-процессоры Intel демонстрируют возросшие до 75-80 нм задержки при передаче данных между ядрами на уровне 75-80 нс.
Однако о прогрессивности выбранного AMD варианта межъядерного взаимодействия можно говорить лишь до тех пор, покуда речь не заходит о совместной работе с данными ядер из разных CCX-комплексов. Даже для пары ядер, находящихся в одном кристалле, но в разных CCX, латентность при взаимодействии возрастает более чем втрое и составляет уже более 150 нс. Если же обмен данными идёт между ядрами в различных кристаллах, то задержки оказываются ещё на треть выше.
Но справедливости ради стоит отметить, что различия практических латентностей при переходе от обмена данными между разными CCX, находящимися в одном или в соседних кристаллах, на самом деле не столь вопиюще. И это служит наглядной иллюстрацией того факта, что шина Infinity Fabric, связывающая кристаллы Zeppelin внутри Ryzen Threadripper со своей ролью справляется достаточно неплохо: такой собранный из двух частей процессор действительно не похож на ординарную систему с двумя CPU.
⇡#Режимы работы подсистемы памяти
Но дело не только в межъядерном взаимодействии, но и в контроллерах памяти, имеющихся в каждом кристалле Zeppelin. Эти контроллеры двухканальные, и максимальную пропускную способность они могут обеспечить лишь при согласованной многопоточной работе. Однако если речь идёт об однопоточных обращениях к памяти, то скорость доступа, очевидно, зависит от того, в одном или в разных кристаллах находятся контроллер памяти и инициирующее транзакцию ядро. А это значит, что Ryzen Threadripper представляет собой классическое воплощение NUMA-архитектуры (Non-Uniform Memory Architecture). Массив памяти, обслуживаемый этим процессором, получается неравномерным по скорости работы.
Для серверных систем такая организация массива памяти не представляет серьёзной проблемы. Там NUMA-архитектура применяется давно и повсеместно, поэтому программное обеспечение создаётся с учётом особенностей такого строения подсистемы памяти: данные по возможности хранятся как можно ближе к ядру, которое с ними работает. Однако для обычных массовых программ такой оптимизации не делается. Настольные системы всегда оперировали однородной памятью, поэтому подавляющее большинство приложений, с которыми пользователи сталкиваются на десктопах, спроектировано в предположении, что подсистема памяти имеет одинаковые скоростные характеристики в любой своей области. К сожалению, такое предположение может создать определённые проблемы для систем на базе Ryzen Threadripper из-за которых эффективность работы и производительность будет снижаться вследствие непреднамеренного использования областей памяти с большими задержками.
Для того, чтобы как-то обойти эту потенциальную сложность, AMD определила для контроллера памяти Threadripper два различных режима работы: распределённый и локальный.
В распределённом (distributed) режиме (в терминах AMD он также носит название Creator Mode) на первое место ставится пропускная способность памяти. В нём подсистема памяти обслуживается как обычный равноправный массив (UMA), а все запросы к данным равномерно распределяются по всем доступным каналам, вне зависимости от того, к какому из кристаллов процессора они относятся. Такой режим хорош в том случае, когда приложение задействует большие объёмы данных и не чувствительно к латентности.
Для того же случая, когда латентности для скорости работы важнее, предлагается локальный (local) режим. В нём транзакции в первую очередь отдаются тому двухканальному контроллеру, который находится в одном кристалле Zeppelin с ядром, их инициировавшим (эмуляция NUMA). Это в большинстве случаев понижает задержки, однако приложения не получают доступа к полной пропускной способности четырёхканальной памяти, фактически довольствуясь лишь двухканальным режимом.
Разницу между этими режимами нетрудно проиллюстрировать результатами измерений. С помощью бенчмарка CacheMem из пакета AIDA64 мы замерили производительность подсистемы памяти, составленной из четырёх идентичных модулей DDR4-3200 SDRAM (14-14-14-34) в системе с процессором Ryzen Threadripper, при её работе в локальном и распределённом режимах.
Практические различия между режимами оказываются огромны. Как и было обещано, локальный режим действительно позволяет выиграть в практических задержках при обращении к памяти. Кажется, что он лучше и с точки зрения пропускной способности, однако такая картина наблюдается лишь потому, что бенчмарк памяти в AIDA64 измеряет многопоточную производительность подсистемы памяти, загружая работой все доступные ядра и инициируя независимую и одновременную загрузку контроллеров памяти обоих кристаллов Zeppelin, а затем суммирует результаты. То есть, если говорить о том, какую пропускную способность памяти будет получать в своё распоряжение один поток, то представленные для локального режима показатели надо делить пополам. И в конечном итоге именно распределённый режим даст заметное преимущество в полосе пропускания.
AMD по умолчанию активирует локальный режим (эмуляцию NUMA), поскольку он, по мнению компании, обеспечивает лучшую производительность в большем числе случаев. Насколько это справедливо, сказать трудно, но некоторые приложения, которые не используют весь многопоточный потенциал Ryzen Threadripper, но требуют при этом интенсивной межъядерной синхронизации, действительно получают заметный выигрыш. Однако нужно понимать, что в этом случае Ryzen Threadripper практически не пользуется преимуществами четырёх каналов, и этот режим больше подходит для игровых, а не для рабочих приложений. Поэтому существование большого числа приложений для создания цифрового контента, которые в распределённом режиме функционируют явно эффективнее, удивлять не должно.
Для примера ниже приводятся результаты тестов Ryzen Threadripper 1950X в приложениях при работе с четырёхканальным массивом DDR4-3200 SDRAM (14-14-14-34) в распределённом (UMA) и локальном (NUMA) режимах.
Получается, единого и универсального подхода не существует. В некоторых случаях выгоднее один режим, в других ситуациях – иной. К сожалению, переключение между локальным и распределённым режимами работы контроллера памяти выполняется в BIOS материнской платы, что не слишком удобно, так как требует перезагрузки системы. Существует и другой путь – через фирменную утилиту AMD Ryzen Master, где для процессоров Ryzen Threadripper доступен соответствующий переключатель.
Но и он ничего не упрощает. Активация необходимого алгоритма работы с памятью через утилиту тоже требует перезагрузки, поэтому в реальной жизни частое переключение режимов контроллера памяти в зависимости от решаемых задач вряд ли способно стать удобным и популярным подходом.
Но в целом для ресурсоёмких приложений для создания и обработки цифрового контента более оптимальным представляется распределённый режим, а не локальный, который выбирает по умолчанию AMD.
⇡#Игровой режим Ryzen Threadripper
AMD хочет позиционировать свои процессоры Ryzen Threadripper не только как решения для создателей контента, но и в качестве бескомпромиссной игровой платформы. Однако тут существует серьёзная проблема, связанная с тем, что многие игры чрезвычайно чувствительны к латентности памяти и скорости межъядерного взаимодействия, из-за чего, в частности, обычные Ryzen выступают в приложениях такого рода хуже интеловских процессоров Kaby Lake. Но с Ryzen Threadripper ситуация рискует оказаться ещё хуже, ведь у них существуют варианты распределения потоков и данных таким образом, что задержки будут ещё выше, чем у обычных Ryzen.
Казалось бы, проблему могла бы решить активация локального режима контроллера памяти, при котором данные по возможности располагаются в той части памяти, которая относится к кристаллу, исполняющему соответствующий процесс. Однако некоторые многопоточные игры могут легко разрушить этот принцип и захотеть занять большее число ядер, чем присутствует в одном кристалле Threadripper, что приведёт к попаданию части данных в память, относящуюся к «дальнему» контроллеру. К тому же не стоит забывать и про существование смежных потоков, например, DirectX и графического драйвера, которые вполне могут переехать исполняться в соседний кристалл, и тем самым затормозить весь процесс рендеринга кадров в игре. Чтобы такого не происходило, разработчики AMD реализовали ещё один режим – игровой (или режим совместимости).
Суть данного режима состоит в полном отключении всех вычислительных ядер, которые относятся ко второму кристаллу Zeppelin в Threadripper. Это – жёсткий метод привязки всех потоков к одному кристаллу, который действительно позволяет быть уверенным в первоочередном использовании части памяти с наименьшими задержками. Однако такое принудительное превращение многоядерного Threadripper в простой Ryzen – далеко не самый рациональный шаг, пойти на который может заставить лишь крайняя необходимость. К тому же, получающаяся конфигурация оказывается по своим параметрам всё равно хуже обычной Socket AM4-системы на базе Ryzen, так как половина памяти остаётся подключенной к «дальнему» контроллеру. Поэтому, если игра захочет использовать больше памяти, чем есть в первых двух каналах, с высокими задержками столкнуться всё же придётся.
А это значит, что единственный способ добиться того, чтобы вся память могла работать с низкой латентностью, заключается в активации игрового режима с одновременной физической перестановкой всех модулей DDR4 SDRAM в слоты, относящиеся к первому кристаллу Zeppelin. Но не проще ли всё же в игровых системах использовать процессоры, которые подходят для них без подобных странных ухищрений?
Тем не менее, игровой режим в Ryzen Threadripper всё-таки существует, и активизировать его можно специальным переключателем в утилите AMD Ryzen Master. Впрочем, для окончательного включения потребуется ещё и перезагрузка, так что удобным такую реализацию назвать вряд ли возможно.
Сравнение игрового режима с обычным локальным показывает, что он позволяет выгадать дополнительные несколько процентов игровой производительности не повсеместно, а лишь в некоторых случаях. Приведённые далее результаты тестов проведены в системе с Ryzen Threadripper 1950X, памятью DDR4-3200 SDRAM (14-14-14-34) и видеокартой NVIDIA Titan X (Pascal).
По представленным данным хорошо видно, что заметное преимущество игровой режим даёт лишь в отдельных случаях. То есть, универсальным средством увеличения частоты кадров в играх он не является. Если его включение и помогает, то чаще всего это не почти незаметно, а в некоторых ситуациях можно наблюдать, напротив, даже снижение быстродействия. Поэтому скорее всего реальные пользователи будут прибегать к включению игрового режима лишь в каких-то исключительных обстоятельствах.
Сама AMD приводит лишь небольшой список игр, для которых активация игрового режима имеет смысл с точки зрения наблюдаемой частоты кадров. Он включает: Civilization VI, Call of Duty: Modern Warfare Remastered, Heroes of the Storm, Gears of War Ultimate, DOTA 2, Watch Dogs, Thief, Hitman: Absolution и Fallout 4. Однако существует и ряд игр, в которых без игрового режима обойтись невозможно, поскольку они попросту не запускаются в системах с более чем 20 логическими процессорами. Среди популярных игр, имеющих такую проблему, нужно упомянуть DiRT Rally, Far Cry Primal, Far Cry, F1 2016 и GTA V.
В утилите Ryzen Master игровой режим носит название режима совместимости, и это хорошо передаёт его суть. Фактически он играет роль «средства последней надежды», к которому имеет смысл прибегать лишь тогда, когда всё остальное не помогает, и работа Threadripper в его стандартном состоянии с каким-то приложением становится совершенно неудовлетворительной. Причём максимум, что может сделать игровой режим, это лишь приблизить быстродействие Ryzen Threadripper к скорости обычного Ryzen. То есть, никакой панацеей в плане улучшения игровой производительности процессоров AMD он не является.
К сказанному стоит добавить и то, что Ryzen Threadripper может оказаться не слишком удачным вариантом для формирования мощных игровых конфигураций не только из-за распределённой по двум контроллерам памяти, но и из-за аналогичной реализации шин PCI Express, что может стать критичным в случае использования нескольких видеокарт, соединённых в массив по технологиям SLI или CrossfireX. Пара (или большее число) GPU в этом случае окажется подключена к корневым хабам, расположенным в разных кристаллах Zeppelin, поэтому их взаимные коммуникации получат увеличенные латентности. В конечном итоге это может сделать доступный в платформе Threadripper режим PCI Express x16 + x16 даже более медленным вариантом, чем PCI Express x8 + x8 в случае обычных Ryzen, но это соображение ещё нуждается в дополнительной проверке.
⇡#Платформа Socket sTR4 и набор системной логики X399
Ryzen Threadripper используют процессорное гнездо Socket sTR4 с 4096 контактами, которое до сих пор нигде и никогда не встречалось. Однако полностью новым его назвать всё же нельзя – сам разъём в смысле его конструкционного исполнения позаимствован из процессорной платформы EPYC и имеет точно такой же форм-фактор и конструкцию, как и серверный Socket SP3. Скорее всего, между этими разъёмами есть и частичная электрическая совместимость, а отличие состоит лишь в том, что в Socket sTR4 остаётся незадействованной часть контактов, которая отвечает за пятый-восьмой каналы памяти, за межсокетные соединения Infinity Fabric и за дополнительные линии PCI Express, которые есть у EPYC.
Тем не менее, если смотреть на Socket sTR4 глазами пользователя десктопных систем, то выглядит он совершенно безумно. Во-первых, он сразу же поражает своими габаритами: ещё бы, ведь в этом разъёме к процессору подводится более четырёх тысяч контактов, и это даже больше, чем используется в последнем поколении Xeon SP, не говоря уже о двукратном превосходстве над интеловскими CPU для HEDT-сегмента. Во-вторых, Socket sTR4 предполагает LGA-исполнение процессоров, которое компания AMD ранее никогда не использовала в своих продуктах для настольных компьютеров. И в-третьих, фиксация процессора внутри сокета происходит не привычными подпружиненными рычагами, а тремя винтами, которые обеспечивают более надёжный прижим и равномерное распределение механических усилий.
В результате установка процессора в Socket sTR4 превращается в целую эпопею, проиллюстрировать которую лучше всего может следующая схема.
Обратите внимание: непосредственно в Socket sTR4 процессор вставлять не требуется. Вместо этого он вдвигается в появившиеся внутри сокета специальные направляющие полозья, причём корпус CPU остаётся заключён в оранжевую пластиковую монтажную рамку, которая теперь сопровождает процессор на всём протяжении его жизненного цикла.
Для платформы Socket sTR4 компания AMD предлагает и собственный набор системной логики, получивший название X399. Однако на самом деле новым он не является, это простое переименование чипсета Z370, используемого с Socket AM4-процессорами Ryzen. И в этом нет ничего удивительного: кристаллы Zeppelin, из которых собирается Ryzen Threadripper, содержат элементы южного моста. Поэтому многие возможности для подключения внешних устройств легко реализуются без каких-либо дополнительных микросхем, а чип X399 нужен лишь для добавления отдельных дополнительных портов.
Так, сами Ryzen Threadripper помимо 64 линий PCI Express 3.0 обеспечивают поддержку четырёх портов SATA и восьми портов USB 3.0. Микросхема же X399 подключается к процессору по четырём линиям PCI Express 3.0 и выступает дополнительным интегральным концентратором, который добавляет к имеющимся в самом Ryzen Threadripper возможностям поддержку двух портов USB 3.1, шести портов USB 3.0, шести портов USB 2.0, восьми SATA-портов и восьми линий PCI Express 2.0. В результате, платформа Socket sTR4 приобретает вполне достаточный на данном этапе набор характеристик, в котором не хватает разве только поддержки RAID-массивов, составленных из NVMe-накопителей.
Остающиеся в распоряжении пользователя после подсоединения к процессору чипсета 60 процессорных линий PCI Express 3.0 могут дробиться или собираться в любые наборы, но общее число поддерживаемых PCIe-устройств ограничено семью. Учитывая это, AMD приводит разные варианты систем, в которых эти линии тем или иным методом распределяются по различным устройствам. Компания указывает на возможность формирования не только игровых систем с несколькими видеокартами, но и компьютеров для рендеринга, рабочих станций для научных расчётов или систем для обработки видеоконтента. В качестве примера максимальной конфигурации, в частности, приводится сборка с четырьмя видеокартами и тремя NVMe накопителями, на которую, несмотря на грандиозность, ресурсов процессора хватает без каких-либо ограничений.
С HEDT-процессорами Intel аналогичная системы была бы невозможна, так как даже у премиальных процессоров семейства Core i9 число линий PCI Express 3.0, запитанных от процессора, ограничено 44.
Также нужно отметить и тот факт, что Ryzen Threadripper унаследовали от своих младших собратьев все способности к разгону. Коэффициент умножения в HEDT-процессорах AMD не заблокирован, а материнские платы на базе X399 обладают всеми привычными для пользователей Ryzen настройками для изменения частот, напряжений и параметров памяти.
Работает с Ryzen Threadripper и оверклокерская утилита Ryzen Master, которую можно применять для мониторинга и настройки параметров процессора в среде операционной системы Windows.
Несмотря на то, что Socket sTR4 – это принципиально новая экосистема, компании AMD вместе с партнёрами удалось неплохо подготовиться к запуску Ryzen Threadripper. Все основные производители материнских плат спроектировали и запустили серийное производство необходимых Socket sTR4-плат. Не остались в стороне и производители систем охлаждения. Иными словами, никакой неподготовленности инфраструктуры, как наблюдалась при запуске Ryzen 7, на этот раз не будет.
Сегодня, в день начала продаж Ryzen Threadripper, в магазинах должны появиться как минимум шесть разных Socket sTR4-плат компаний ASUS, Gigabyte, MSI и ASRock, а концу месяца ассортимент платформ расширится до более чем десятка разных вариантов.
Не должно быть проблем и с подходящими кулерами. Несмотря на то, что площадь поверхности теплораспределительной крышки процессоров Ryzen Threadripper очень велика, AMD считает возможным использование с ними уже имеющихся на рынке замкнутых систем жидкостного охлаждения Asetek, для полной совместимости с которыми в комплекте поставки Threadripper имеется необходимая система крепления. Это значит, что многие популярные СВО, продающиеся под марками Arctic, Cooler Master, Corsair, NZXT, Thermaltake и т.п., без каких-либо проблем встанут и на Ryzen Threadripper.
То же, что подошва водоблоков таких систем покрывает поверхность CPU далеко не полностью, причиной для переживаний быть не должно. Теплораспределительная крышка процессоров AMD сделана из медного сплава с высокой теплопроводностью и качественно снимает и передаёт дальше тепло с процессорных кристаллов благодаря тому, что в качестве внутреннего термоинтерфейса в Threadripper используется эффективный припой на основе индия.
⇡#Модельный ряд Ryzen Threadripper
На данный момент компания AMD анонсировала три модели Ryzen Threadripper, отличающихся друг от друга в первую очередь количеством ядер. В семейство входят 16-, 12- и 8-ядерная версии. Базовые характеристики процессоров приведены в таблице.
Ядра/ потоки | Базовая частота/ турбо, ГГц | Технология XFR | L3-кеш, Мбайт | TDP, Вт | Цена | |
---|---|---|---|---|---|---|
Ryzen Threadripper 1950X | 16/32 | 3,4/4,0 | +200 МГц | 32 | 180 | $999 |
Ryzen Threadripper 1920X | 12/24 | 3,5/4,0 | +200 МГц | 32 | 180 | $799 |
Ryzen Threadripper 1900X | 8/16 | 3,8/4,0 | +200 МГц | 16 | 180 | $549 |
Сегодня, 10 августа, на рынок приходят первые две модели с 16 и 12 ядрами, 8-ядерная же модель будет выпущена 31 августа. Кроме того, есть информация, что в модельном ряду со временем появятся дополнительные версии Threadripper без литеры «X» на конце, которые будут отличаться пониженными частотами и тепловыделением на уровне 140 Вт, но пока это официальными источниками не подтверждается.
Все версии Threadripper основываются на одном и том же полупроводниковом базисе: двух кристаллах Zeppelin, объединённых в единое целое посредством шины Infinity Fabric. Соответственно, структура Threadripper включает четыре четырёхъядерных CCX-комплекса. Модификации процессоров с числом ядер, меньшим 16, получаются отключением одинакового количества ядер в каждом CCX. Иными словами, в 12-ядерном процессоре каждый CCX имеет по три активных ядра, а в 8-ядерном – по два. Кроме того, в восьмиядерной модели Ryzen Threadripper 1900X инженеры AMD собираются деактивировать половину кеш-памяти третьего уровня.
Зато в отношении всех остальных характеристик AMD настроена очень либерально. Все объявленные версии Ryzen Threadripper имеют схожие тактовые частоты, достигаемые в турбо-режиме, все они имеют также и достаточно агрессивную технологию XFR, способную на дополнительные 200 МГц увеличивать рабочую частоту процессоров в благоприятном температурном режиме. Отличия есть лишь в базовой частоте, что обусловлено рамками 180-ваттного теплового пакета. Впрочем, к частотам старших процессоров какие-то претензии предъявить очень сложно: 12-ядерный Ryzen Threadripper 1920X по этому параметру похож на старший восьмиядерник Ryzen 7 1800X, а 16-ядерный Ryzen Threadripper 1950X как минимум не уступает в рабочих частотах другому восьмиядернику, Ryzen 7 1700X. Причём, максимальные турбо-частоты процессоры семейства Ryzen Threadripper могут развивать при нагрузке на четыре ядра, в то время как Ryzen 7 способны на максимальный авторазгон при задействовании в работе лишь пары ядер.
Столь впечатляющие по частотам режимы работы AMD обеспечивает за счёт специального отбора для процессоров Threadripper наиболее удачных полупроводниковых кристаллов. Лишь только один из двадцати кристаллов Zeppelin оказывается достаточно хорош для того, чтобы попасть во флагманские HEDT-процессоры по параметрам частотного потенциала и тепловыделения, поэтому Ryzen Threadripper – это отборные и элитарные процессоры в прямом смысле этих эпитетов.
Важно отметить, что помимо числа ядер, частот и размера кеш-памяти, никаких других различий между моделями Threadripper нет. Intel дополнительно дифференцирует свои HEDT-процессоры путём урезания в младших моделях числа доступных линий PCI Express и искусственного снижения скорости исполнения AVX-512-инструкций. Члены же модельного рада Ryzen Threadripper никаких дополнительных или скрытых различий между собой не имеют: все они обладают полным набором из 64 линий PCI Express 3.0 и поддерживают по четыре канала DDR4 SDRAM с максимальной официальной частотой 2667 МГц.
Если ко всему этому прибавить весьма привлекательные цены, которые не выходят за 1000-долларовую планку, то кажется, что интеловская HEDT-платформа LGA 2066 находится под серьёзным ударом. В частности, если исходить из стоимости, то 16-ядерный Ryzen Threadripper 1950X можно сопоставлять с 10-ядерным Core i9-7900X, у которого предложение AMD выигрывает не только по числу ядер, но и по другим характеристикам: немного – по базовой частоте, существенно – по общему объёму кеш-памяти и ощутимо – по числу линий PCI Express. Более того, выгодно на фоне Core i9-7900X выглядит даже 12-ядерный Ryzen Threadripper 1920X. Он не только на 20 процентов дешевле и обладает более развитыми средствами многопоточности, но так же как и Ryzen Threadripper 1950X, обходит интеловский десятиядерник по частотам, объёму кеш-памяти и возможностям контроллера PCI Express.
⇡#Ryzen Threadripper 1950X и Ryzen Threadripper 1920X
Для знакомства с платформой Threadripper мы получили от компании AMD обе модели HEDT-процессоров, выход которых назначен на сегодня.
Спецификации моделей:
Ryzen Threadripper 1950X | Ryzen Threadripper 1920X | |
---|---|---|
Внутренняя топология | 2 кристалла Zeppelin: 4+4 и 4+4 | 2 кристалла Zeppelin: 3+3 и 3+3 |
L2-кеш | 512 Кбайт на ядро 8 Мбайт суммарно |
512 Кбайт на ядро 6 Мбайт суммарно |
L3-кеш | 8 Мбайт на CCX 32 Мбайт суммарно |
|
Базовая частота | 3,4 ГГц | 3,5 ГГц |
Турбо-режим | До 3,7 ГГц при нагрузке на 16 ядер До 4,0 ГГц при нагрузке на 4 ядра До 4,2 ГГц при активации XFR (4 ядра) |
|
Поддержка SMT | Есть | |
Линии PCI Express 3.0 | 64 (4 линии зарезервировано на чипсет) | |
Каналы DDR4 SDRAM | 4 | |
Частота памяти | До DDR4-2666 (Single Rank, 1 DIMM на канал) | |
Поддержка ECC | Есть | |
TDP | 180 Вт | |
Процессорное гнездо | Socket sTR4 |
В работе эти процессоры выглядят так. 16-ядерный Ryzen Threadripper 1950X:
Частота такого процессора при полной ресурсоёмкой нагрузке на все ядра составляет порядка 3,3 ГГц, что даже ниже номинального значения, определённого в спецификациях. Зато при этом процессор сохраняет весьма невысокую рабочую температуру. При использовании системы жидкостного охлаждения Corsair Hydro Series H115i нагрев не превышал 58 градусов.
Снижение сложности накладываемой на процессор нагрузки ожидаемо приводит к увеличению тактовой частоты. Например, при запуске тестирования Prime95 29.2 в однопоточном режиме, Ryzen Threadripper 1950X работает на частоте порядка 4,1 ГГц, а при исполнении четырёх потоков реальная частота «гуляет» в районе 3,95-4,0 ГГц. Впрочем нужно понимать, что частота корректируется технологией XFR, а она опирается на температуры. Поэтому на практике разные экземпляры процессоров, работающие с разными системами охлаждения, могут показывать слегка отличающиеся результаты.
Как и в случае обычных Ryzen, термодатчик Ryzen Threadripper (Tctl) возвращает значения температуры процессора со значительным смещением, составляющим 27 градусов. По словам AMD, оно нужно для правильной настройки профилей работы систем охлаждения. Однако свежие версии популярной утилиты HWINFO64 уже учитывают эту особенность и отображают не только значение Tctl, но и скорректированное значение Tdie, на которое можно ориентироваться для оценки температурного режима.
12-ядерный Ryzen Threadripper 1920X:
При максимальной нагрузке, производимой Prime95 29.2, процессор работает на частоте около 3,55 ГГц. Системе жидкостного охлаждения при полной нагрузке на CPU удавалось удерживать его температуру в пределах 66 градусов. Снижение нагрузки позволяло процессору постепенно увеличивать свою реальную частоту вплоть до величин порядка 4,15 ГГц в случае исполнения одного потока.
Как видно по приведённым скриншотам, в основе процессоров Ryzen Threadripper лежат абсолютно те же самые ядра Zeppelin степпинга B1, которые применяются в массовых процессорах Ryzen. Поэтому в целом от многоядерных новинок никаких сюрпризов ждать не приходится: они по своим повадкам должны быть похожи на младших собратьев.
⇡#Разгон
Разгон процессоров Ryzen Threadripper в целом похож на разгон обычных Ryzen, что, в общем-то, совершенно закономерно. Никаких специальных, свойственных лишь платформе Socket sTR4, настроек в данном случае не предлагается, и для увеличения частоты выше номинальных значений можно пользоваться привычным методом – простым наращиванием коэффициента умножения CPU с одновременной прибавкой в напряжении питания. Правда, в случае с HEDT-платформой AMD заметно большие, чем обычно, неприятности приносит чрезмерный нагрев процессора. Суммарное тепловыделение двух кристаллов Zeppelin, упрятанных внутри Ryzen Threadripper, при разгоне нарастает очень быстро, и именно это ограничивает максимальные частоты, до которых можно добраться, не прибегая к каким-то экстремальным методам теплоотвода. Иными словами, качественное охлаждение – это ключ к покорению оверклокерских вершин.
Максимально допустимая температура Ryzen Threadripper, при которой активируется троттлинг, составляет 85 градусов для 16-ядерного процессора и 87 градусов – для процессора с 12 ядрами. Используемая нами в тестовой платформе замкнутая система жидкостного охлаждения Corsair Hydro Series H115i, опирающаяся на 280-миллиметровый радиатор, если ориентироваться на тяжёлую вычислительную нагрузку, создаваемую утилитой Prime95 29.2, оказалась способна не допускать перегрева и троттлинга Ryzen Threadripper лишь в том случае, если напряжение питания таких CPU не превышает уровень в 1,325-1,375 В. И именно данный фактор стал главным барьером в разгоне: ни о каких 1,4-1,45 В, которые можно было беспрепятственно выбирать при оверклокерских экспериментах с Ryzen 7, теперь речь не идёт.
Предельный уровень напряжения, который позволял работать нашему экземпляру старшего 16-ядерного Ryzen Threadripper 1950X без перегрева в тестах стабильности, составил всего лишь 1,325 В. Тем не менее, даже с таким питанием нам удалось добиться прохождения процессором полного цикла тестирования в Prime95 29.2 на частоте 3,9 ГГц, что является вполне нормальным результатам разгона даже по меркам восьмиядерных Ryzen 7.
Как видно по скриншоту, температура при проверке стабильности приближалась к критическим значениям, но троттлинга, при активации которого частота отдельных ядер Ryzen Threadripper сбрасывается до 600 МГц, избежать удалось.
Второй тестовый процессор, 12-ядерный Ryzen Threadripper 1920X, получилось разогнать немного лучше. Возможно, нам повезло с конкретным экземпляром, но по сравнению с 16-ядерной моделью он не перегревался и при существенно более высоком напряжении питания. Благодаря этому выше оказалась и финальная частота: с напряжением питания 1,375 В процессор стабильно работал при любой нагрузке на частоте 4,0 ГГц.
Естественно, температура в Prime95 29.2 при этом находилась «на грани» и достигала в пике 85,5 градусов, однако никаких проблем со стабильностью или падений частоты из-за этого не возникало.
В конечном же итоге можно сказать, что разгон процессоров серии Ryzen Threadripper в смысле достижимых частот приносит примерно те же результаты, что и разгон обычных Ryzen 7. Если делать ставку на обычные имеющиеся в продаже системы жидкостного охлаждения, то похоже, что вполне можно рассчитывать на получение частот порядка 3,9-4,0 ГГц. Это не намного выше номинальных значений, установленных для Ryzen Threadripper, но таковы уж особенности применяемого для производства кристаллов Zeppelin LPP-техпроцесса с FinFET-транзисторами и 14-нм нормами, который в исполнении GlobalFoundries выдаёт продукцию именно такого качества.
Кроме того, определённый негатив в процесс разгона вероятно вносит и отсутствие систем охлаждения, разработанных непосредственно под Ryzen Threadripper. Высокий нагрев – это первая преграда, в которую упирается оверклокинг. Совместимые же с Ryzen Threadripper и рекомендованные AMD системы жидкостного охлаждения имеют водоблоки «старого образца», которые не закрывают процессор полностью. AMD считает, что это сказывается на теплоотводе не слишком критично, однако нам кажется, что с выходом специализированных систем охлаждения с водоблоками, полностью закрывающими теплораспределительную крышку процессора, предел разгона можно будет отодвинуть на 100-200 МГц дальше.
Впрочем, особых поводов для расстройства покорённые оверклокерские рубежи на самом деле на дают. Хотя близких частот получается добиться и с обычными Socket AM4-процессорами семейства Ryzen, в нашем случае речь фактически идёт о гораздо более сложном разгоне капризной двухпроцессорной системы, которая, несмотря на все «но», показывает почти такой же оверклокерский потенциал. Видимо производитель действительно отбирает для Ryzen Threadripper лучшие кристаллы Zeppelin. Тесты показали, что полупроводниковые устройства, составляющие HEDT-процессоры AMD, способны работать на частотах порядка 4,0 ГГц при сравнительно невысоком уровне напряжения, чего от обычных массовых процессоров Ryzen удаётся добиться крайне редко.
Источник: 3DNews