[Перевод] Монстры после каникул: AMD Threadripper 2990WX 32-Core и 2950X 16-Core (часть 5)

Часть 1 Часть 2 Часть 3 Часть 4 → Часть 5

Тепловые сравнения и XFR2: Не забудьте удалить пластик с кулера!

Каждая машина преследует цели с разными приоритетами: производительность, потребление, шум, тепловые характеристики или стоимость. Достигнуть всех и сразу очень трудно, так что выбор двух или трех целей — хорошая идея. Как проиграть по ВСЕМ ПЯТИ НАПРАВЛЕНИЯМ?.. Добро пожаловать в мой мир. Мир, в котором я впервые протестировал 32-ядерный AMD Ryzen Threadripper 2990WX, забыв удалить пластик с моего жидкостного кулера.

Не собирайте систему после длительного перелета.

Почти все новые кулеры, воздушные, жидкостные и водяные блоки, поставляются в комплекте с прокладкой, пеной, винтами, вентиляторами и набором инструкций. В зависимости от производителя и типа упаковки нижняя часть кулера процессора будет подготовлена двумя способами:

  1. Предварительно нанесена термопаста
  2. Небольшая самоклеящаяся пластиковая лента для защиты полировки во время транспортировки

Встречайте в нашем обзоре массивный воздушный кулер Wraith Ripper, производства Cooler Master, но продвигаемый AMD в качестве базового кулера для новых процессоров Threadripper 2. На все его основание густо нанесена термопаста. Когда я попытался сделать фотографии, я все попутал.

Также в наш обзор включен жидкостный охладитель Enermax Liqtech TR4 с тюбиком термопасты. Нижняя часть блока, контактирующая с CPU, была покрыта защитной самоклеящейся пластиковой лентой.


Пример из Твиттера TechTeamGB

Итак, время исповеди. Наш обзорный комплект прилетел на день раньше меня. Действие происходило во время моего странствия с Великобритании в Сан-Франциско на Flash Memory Summit и Intel Datacenter Summit. В моих чемоданах я привез материнскую плату X399 (ASUS ROG Zenith), три чипа X399 (2990WX, 2950X, 1950X), материнскую плату X299 (ASRock X299 OC Formula), несколько чипов Skylake-X, источник питания Corsair AX860i, RX 460, мышь, клавиатуру, кабели – попросту компоненты, чтобы собрать две системы и использовать монитор в гостиничном номере для тестирования. После 11-часового прямого рейса, двух часов на паспортном контроле, и более часа в такси Uber до моего отеля, я собрал систему с 2990WX.

Я не снял пластик на охладителе Enermax. Я этого не заметил. Я даже нанес термопасту на процессор и ничего не заподозрил, даже когда затягивал винты.

Я настроил систему на максимально поддерживаемую частоту памяти, установил Windows, установил обновления системы безопасности, установил тесты и запустил систему на всю ночь, пока спал. Я даже не подозревал, что пластмасса осталась прикреплена. Утром тестовый набор уже закончил работу. Выполнив некоторые дополнительные тесты, такие как измерения латентности базовой частоты, я пошел заменить процессор на 2950X. Именно в это время я исполнил выразительный фейспалм.

Увидев термопасту, размазанную по процессору и пластику, я понял, что прийдется все запускать заново. Сняв пластик, вставил процессор, настроил систему, на этот раз с лучшим термическим профилем.

Тепловые характеристики – это важно

Цель любой системы состоит в том, чтобы поддерживать ее в нужном «температурном окне» для стабильной работы: большинство процессоров рассчитаны на правильную работу при температуре до 105 ° C, после чего они выключаются во избежание разрушительных термических повреждений. Когда процессор гоняет электроны по цепям и делает всякие нужные штуки, он потребляет энергию. Эта мощность теряется как тепло, рассеивается из чипа в двух основных направлениях: сокет и кулер.

У процессоров AMD Threadripper материал термического интерфейса между кремниевыми матрицами и теплоотводом — пайка из индия-олова. Прямая связь металл-металл нужна для прямого теплообмена. Современные процессоры Intel используют вместо этого слоя силиконовую термическую пасту, которая передает тепло хуже, но имеет одно важное преимущество — она ​способна прожить гораздо больше термических циклов. По мере того, как металлы нагреваются, они расширяются: два металла, связанные вместе, с различными коэффициентами теплового расширения, проходя через множество циклов нагрева, будут трескаться и терять эффективность. Термическая паста устраняет эту проблему. Кроме того, термопаста дешевле. Так что выбор термического интерфейса — это компромисс между ценой, долговечностью и производительностью.

Над теплоотводом находится процессорный кулер, но между ними есть еще один термический интерфейс, его пользователь может выбирать. Самый дешевый вариант — обычная силиконовую термопаста по цене цент за галлон, однако энтузиасты производительности могут выбрать термопасту на основе серебра или другую смесь с хорошими термическими характеристиками. Обычно способность пасты к распределению под давлением является позитивным качеством. Сторонники экстремальных скоростей могут использовать прослойку жидкого металла, подобную варианту пайки, которая почти навсегда привязывает процессор к кулеру.

Итак, что произойдет, если вы внезапно нанесете несколько микрон термически бесполезного пластика между теплоотводом и кулером процессора?

Прежде всего, теплообмен будет ужасен. Это означает, что тепловая энергия остается в пасте, заставляя процессор впитывать тепло, повышая температуру. Это, по сути, тот же случай, когда кулер перегружен большим процессором – поглощение тепла процессором становится настоящей проблемой. Это приводит к ускоренному повышению температуры, пока градиент температуры не сравняется с выходом тепловой энергии. Процессор становится слишком горячим, включается аварийный режим для аварийной тепловой ситуации, снижая напряжение и частоту до сверхнизких уровней. Производительность опускается на самое дно.

Что же видит пользователь в системе? Представьте, что ваш процессор работает на частоте 600 МГц при рендеринге, вместо хороших базовых 3125 МГц (см. предыдущую страницу). Базовые температуры выше, температура нагрузки выше, температура корпуса выше. Зато можно высушить влажную одежду, что бы тепло не пропадало. Небольшой перегрев не вредит процессору, но вот большое количество способно сделать его очень слабым.
XFR2 от AMD

В конечном итоге такая проблема вредит AMD больше, чем вы могли представить. Способ, которым AMD реализует свои турборежимы в новых процессорах, больше не является справочной таблицей со списком «загруженные ядра -> турбочастота». Она зависит от мощности, тока и тепловых пределов данного чипа. Если найдется место для прироста — платформа AMD добавит частоту и напряжение. Такая тепловая подстройка выполняется тем, что AMD называет XFR2, или eXtended Frequency Range 2.

В AMD’s Tech Day для Threadripper 2 нам были представлены графики, показывающие влияние использования более мощных кулеров на производительность: примерно 10% улучшение результатов тестов при росте теплоотводящего потенциала. Используйте систему в помещении с низкой температурой окружающей среды, и AMD даст 16% прироста производительности по сравнению со стоковой системой.

Однако, обратное тоже верно. Имея кусок пластика там, где хороший теплообмен должен был поднять частоты и напряжение, мы получили значительное снижение производительности.

Пластмассовая производительность:

Итак, несмотря на использование в хорошо кондиционированном гостиничном номере, этот дополнительный пластик оказал решающее влияние в большинстве наших тестов. Вот нанесенный им урон:

На всех многопоточных тестах, когда CPU сильно загружается, наблюдается значительное снижение производительности. Блендер показал 20% снижение пропускной способности, POV-Ray упал на 10%, для 3DPM потери составили 19%. Результаты PCMark снижены не так значительно, поскольку у него много однопоточных тестов, а в некоторых тестах мы увидели даже отклонение в другую сторону, например, в WinRAR, который зависит от DRAM. Другие бенчмарки, не перечисленные в списке, включают наш тест на компиляцию, где «пластифицированная» система была на всего 1% медленнее, или Dolphin, показавший разницу в одну секунду.

Чему я научился?

Не будь дураком. Сборка испытательного стенда с новыми компонентами, будучи сильно уставшим, может привести к повторным испытаниям.

Заключения: не все ядра рождены равными

Проектирование процессора часто представляет собой процесс тонкой настройки. Чтобы получить производительность, архитектор должен сбалансировать вычисления с пропускной способностью, и всегда иметь достаточно данных «кормления зверя» — загрузки процессорных ядер. Если «зверь» остался без дела, он потребляет энергию, не делая никакой работы. Настройка правильного сочетания ресурсов — сложная задача, и поэтому ведущие компании-производители процессоров нанимают тысячи инженеров, чтобы заставить систему работать правильно. И когда основной дизайн готов, он производит ряд наследников.

Иногда экзотические продукты выпадают из общего стека. Новое поколение процессоров AMD Ryzen Threadripper – это та самая экзотика. Казалось бы, выпущены прямые замены компонентов предыдущего поколения, подобные им, но с лучшей задержкой и большей частотой. Эти компоненты уже хорошо известны, и мы получаем ожидаемое повышение привычным путем. И в этот момент дополнительный кремний, включенный в 2990WX, без прямого доступа к памяти, бросает гаечный ключ в налаженный механизм.


2950X (слева) и 2990WX (справа)

Когда все ядра напрямую связаны с памятью, например, у 2950X, все ядра считаются равными, и распределение рабочей нагрузки является довольно простой задачей. С выходом новых процессоров мы получили ситуацию, показанную на рисунке справа. Теперь только некоторые ядра напрямую привязаны к памяти, а остальные — нет. Чтобы данные перешли от одного из «дальних» ядер к основной памяти, требуется дополнительный «прыжок», который добавляет латентность. А когда все ядра запрашивают доступ, возникает затор.

Чтобы в полной мере использовать возможности подобной архитектуры, рабочая нагрузка должна быть не требовательна к памяти. В таких задачах, как расчет движения частиц, трассировка лучей, рендеринг сцены и декомпрессия, полная загрузка всех 32-х ядер позволяет процессору быть звездой наших тестов и ставить новые рекорды.

В стиле двуликого Януса, при других рабочих нагрузках, которые исторически зависели от количества ядер, таких как физика, перекодирование и сжатие, двухмодульная структура приводит к значительной потере производительности. В итоге, здесь, по-видимому, нет средних результатов — либо рабочая нагрузка показывает отличные результаты на новом процессоре, либо оказывается в хвосте нашего высококачественного пакета тестирования.

Часть проблемы связана с распределением мощности этих очень больших процессорах. Как показано на стр. 4, чем больше chiplets, которые находятся в игре, или чем больше Mesh, тем больше энергии подается не на ядра, а внутренним сетям, таким как uncore или Infinity Fabric. Сравнивая один линк IF в 2950X с шестью в 2990WX, мы обнаружили, что IF теперь потребляет 60-73% от общей мощности чипа при небольших нагрузках, и 25-40% на высоких.

По сути, при полной нагрузке чип, подобный 2990WX, использует только 60% своего бюджета мощности для частоты процессора. В EPYC 7601 из-за дополнительных каналов памяти ядра потребляли всего 50% бюджета мощности под нагрузкой. Будьте уверены, что после того, как AMD и Intel закончат борьбу за количество ядер, следующей целью в их списке станет интерконнект.

Но побочный эффект от того, что чип не использует всю мощность для питания ядер, а также имеет бимодальную архитектуру, заключается в том, что некоторые рабочие нагрузки не будут масштабироваться, а в некоторых случаях наблюдается регресс.

Большой Босс: 32-ядерный бегемот AMD

Нет никаких сомнений в том, что, когда AMD Ryzen Threadripper 2990WX получит возможность поработать в полную, он сделает это с удовольствием. Мы смогли разогнать систему до 4 ГГц на всех ядрах, просто изменив настройки BIOS, хотя AMD также поддерживает Precision Boost Overdrive в Windows, чтобы выжать побольше из чипа. При этом потребляемая мощность при использовании половины ядер на частоте 4,0 ГГц подпрыгивает до 260 Вт, а полностью загруженный CPU взлетает до 450-500 Вт и местами превышает 600 Вт. Пользователям необходимо будет убедиться, что их материнская плата и блок питания готовы выполнить такую задачу.

Это тот момент, когда я наконец говорю, рекомендуем ли мы покупать новые продукты AMD. Возможность поставить в ваши слоты 2950X вместо 1950X, еще и по более низкой цене, кажется нам очень привлекательной. Однако 2950X уже является нишевым продуктом для высокой производительности — и 2990WX подхватывает эту эстафету и уносится вдаль, делая самый мощный процессор «нишей ниши». Честно говоря, далеко не во всех случаях его производительность так велика, как можно было бы ожидать, и его применение имеет смысл для узкого набора рабочих нагрузок, где он оказывается несравненным. И хотя он превосходит почти все другие процессоры в нашем компиляционном тесте, есть один процессор, который побил его: 2950X.

Для большинства пользователей достаточно 2950X. Для немногих избранных 2990WX окажется лучшим процессором в мире.

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

3 месяца бесплатно при оплате новых Dell R630 на срок от полугода — 2 х Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4х1TB HDD или 2х240GB SSD / 1Gbps 10 TB — от $99,33 месяц, только до конца августа, заказать можно тут.

Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

 
Источник

#amd, threadripper 2950x, threadripper 2990wx, процессоры

Читайте также