[Перевод] AMD Radeon VII: рывок в High-End (часть 3)

Часть 1 >> Часть 2>>Часть 3

Производительность вычислений

Пожалуй, достаточно об играх. Рассмотрим вычислительные аспекты Radeon VII. Хотя он в основе своей похож на Vega первого поколения, вокруг него много шума об улучшенной вычислительной мощности Vega 20. Пора и нам разобраться в этом вопросе.

[Перевод] AMD Radeon VII: рывок в High-End (часть 3)

Начиная с CompuBench 2.0, последняя итерация тестов вычислений на GPU от Kishonti предлагает широкий спектр различных вычислительных нагрузок, и мы решили сосредоточиться на level set segmentation (LSM), моделировании оптического потока и моделировании задачи N-тел.

Далее мы рассмотрим производительность с плавающей запятой одинарной точности с помощью FAHBench, официального бенчмарка Folding @ Home. Folding @ Home — это популярная инициатива в области исследований и распределенных вычислений, поддерживаемая Стэнфордом, работа которой распространяется по миллионам компьютеров-добровольцев через Интернет, и каждый из компьютеров отвечает за крошечный фрагмент симуляции сворачивания белка. FAHBench может тестировать производительность с плавающей запятой одинарной и двойной точности, при этом одинарная точность является наиболее важным показателем для большинства потребительских карт из-за низкой производительности двойной точности.

Далее идет пакет вычислений на GPU с помощью Geekbench 4. Это многогранный набор тестов, в котором выполняется семь различных суб-тестов графического процессора — от определения лиц до быстрого преобразования Фурье, а затем усредняются их оценки по их среднему геометрическому. В результате Geekbench 4 не тестирует какую-либо одну рабочую нагрузку, а представляет собой среднее из множества различных основных нагрузок.

Наконец, у нас есть SiSoftware Sandra, с общими вычислительными тестами с различной точностью.

Синтетическая производительность

Ниже результаты наших синтетических тестов.

Профессиональная визуализация и рендеринг

Поскольку AMD активно продвигает Radeon VII в качестве полупрофессиональной карты для создания контента, нам следует обратить внимание на производительность рендеринга, САПР и профессиональной визуализации. Тем не менее подходящие точные бенчмарки для этой области не так легко найти, тем более что производительность сильно зависит от рабочего процесса и проприетарного лицензионного программного обеспечения ISV. Учитывая аудиторию AnandTech, в которую часто входят инженеры, использующие эти приложения в критически важных производственных средах, наша цель — предоставить наиболее релевантные показатели. Однако, как обсуждал ранее Ян, наиболее точные сравнительные тесты рабочих станций для профессиональных приложений находится в руках независимых поставщиков программного обеспечения. И эти поставщики в лучшем случае недовольны, а зачастую и слышать не хотят о предоставлении доступа к программному обеспечению даже в виде ограниченных лицензий.

С учетом этих сложностей, следующая лучшая вещь для оценки общей производительности десктоп GPU — почтенный SPECviewperf, недавно обновленный до версии 13. Разделенный на «viewsets», которые представляют собой группы рабочих нагрузок для конкретных приложений, полученных из реальных наборов данных, SPECviewperf издавна является пакетом тестов общей производительности desktop/CAD GPU. Для SPECviewperf 13 наборы тестов основаны на:

  • Autodesk 3ds Max 2016 (Nitrous DX11 driver)
  • Dassault Systèmes CATIA V6 R2012
  • PTC Creo 3 & Creo 4
  • Geosurvey software, with workloads based on rendering techniques utilized by the open-source OpendTect seismic visualization application
  • Autodesk Maya 2017
  • Radiological (i.e. CT, MRI scans) rendering, with workloads using the Tuvok rendering core of the ImageVis3D volume visualization application
  • Autodesk Showcase 2013
  • Siemens NX 8.0
  • Dassault Systèmes Solidworks 2013 SP1

Хотя у нас не было времени для полного тестирования ПО для редактирования / производства видео, такого как Adobe Premiere Pro CC, мы постараемся добавить это в будущем.

Графики тестов

Полученные результаты ясно дают понять, что некоторые наборы тестов работают лучше на оборудовании одного производителя, чем на другом. Иногда Radeon VII нарушает тенденцию, хотя в Siemens NX сниженная производительность может быть связанна с незрелостью драйверов. В обратных сценариях, таких как Creo-02 или Maya-05, Radeon VII меняется местами с конкурентами, естественно, опережая RX Vega 64, но уступая картам RTX и GTX. И хотя результаты подчеркивают важность готовности программного обеспечения для нового оборудования, мы видим признаки того, что Vega 20 является мощной платой для рабочих станций. Недостатком является то, что новая не меняет общую картину для приложений, которые традиционно хорошо работают на аппаратном обеспечении NVIDIA.

Следующий набор тестов оценивает производительность рендеринга. Учитывая природу «войн рендеринга», а также особенности CUDA, необходимо прояснить, что представленные движки рендеринга не обязательно показывают общие возможности рендеринга GPU. Поскольку мы смотрим на Radeon VII, нецелесообразно использовать некоторые из наиболее популярных средств визуализации, таких как Redshift и Octane, которые предназначены только для CUDA, с другой стороны, использование не особо популярного Indigo Renderer дает еще одну точку данных.

Отметим, что официальные выпуски Blender все еще не включают CUDA 10, поэтому карты серии RTX 20 официально не поддерживаются.

V-RAY — единственный тест, использующий CUDA для карт NVIDIA, в то время как остальные используют OpenCL. Результаты в целом похожи на SPECviewperf, где Radeon VII продолжает оставаться лидером там, где аппаратное обеспечение AMD и раньше работало хорошо.

Radeon VII и Radeon RX Vega 64: тактовая производительность

Благодаря различным изменениям, произошедших на пути от RX Vega 64 на базе Vega 10 до нового Radeon VII на базе Vega 20, мы хотели взглянуть на производительность и вычислительные возможности, контролируя их тактовую частоту. Это позволит нам взглянуть на любые существенные улучшения или различия в псевдо-IPC. Здесь есть пара уточнений; очевидно, поскольку RX Vega 64 имеет 64 CU, а Radeon VII только 60 CU, сравнение уже не является точным. Другое дело, что «IPC» — это не точный измеримый показатель, а в некотором смысле то, сколько графической / вычислительной работы выполняется за такт, и как это может повлиять на производительность. Isoclock GPU сравнения, как правило, не очень полезны при сравнении поколений и архитектур. Например, разработчики Vega часто проектируют этапы конвейера для обеспечения более высоких тактовых частот, но за счет сокращения объема работы, выполняемой за цикл, и, как правило, увеличения задержки.

В нашем случае инкрементная природа второго поколения Vega устраняет некоторые из перечисленных проблем, хотя, к сожалению, в настоящее время Wattman не смог понизить частоту памяти, поэтому мы не смогли получить данные для случая, когда обе карты настроены на сопоставимую пропускную способность памяти. Хотя механика повышения производительности GPU Vega означает, что тактовая частота не зафиксирована, обе карты были настроены на частоту 1500 МГц, и в обоих случаях частота колебалась от 1490 до 1500 МГц в зависимости от рабочей нагрузки. Все это означает, что полученные результаты следует понимать как приблизительные, и всё же они полезны для определения значительного прироста или уменьшения. Это также означает, что интерпретировать результаты весьма сложно, но на высоком уровне абстракции, если Radeon VII превосходит RX Vega 64 при заданной нагрузке, не связанной с памятью, мы можем предположить значительные улучшения «работы за цикл», относительно не связанные с количеством CU.

Графики тестов

Потребление, температура и шум

Как обычно, пришло время рассмотреть потребляемую мощность, температуру и шум Radeon VII. Хотя обычно мы опираемся на напряжение и тактовую частоту, с учетом изменений SMU, такой подход впервые невозможен.

На первый взгляд уровень шума карты выглядит удивительно низким. В конечном счете, то, что видим здесь, является следствием применений всех возможных акустический усовершенствований для карты с открытым тройным вентилятором. Переход на новый тип делает шум карты сравнимым с воздуховодом RX Vega 64.

В качестве заключения

Хотя осталось еще много областей для исследования, Radeon VII по-прежнему является первым 7-нм игровым GPU, и это немалое достижение. Но помимо этого, вывод его на потребительский рынок дает покупателям возможность выбора среди производителей; и чем больше возможностей выбора для энтузиастов, тем лучше. Radeon VII может выглядеть продуктом двойного назначения — для профессиональных и игровых приложений, но он все равно остается самой быстрой игровой видеокартой в стеке Radeon.

Рискуя быть назойливым, я все же не могу не подчеркнуть, насколько удивлен и Райан, и я, что эта карта вышла настолько рано. В настоящее время 7-нм технология только делает первые шаги, и до прошлого месяца AMD, казалось, была довольна использованием графического процессора Vega 20 на серверных картах Radeon Instinct. И вот произошло неожиданное слияние факторов, которые позволили AMD представить чип, который, по их собственному признанию, изначально создавался для серверов, как флагман на потребительском рынке. Пусть это очень хороший прецедент для запуска Radeon VII, но это делает ситуацию довольно интересной для технических энтузиастов.

Подводя итоги, поговорим о показателях производительности. От своего основного конкурента, GeForce RTX 2080, Radeon VII отстает на 5-6% в нашем наборе тестов. К сожалению, единственные игры, в которых он показал лучшие результаты, — это Far Cry 5 и Battlefield 1, так что Radeon VII не смог «обменяться ударами» с конкурентом так сильно, как AMD хотела бы видеть. В то же время, в отличие от RTX 2080, AMD не стремится пошатнуть соотношение цены и производительности, поэтому Radeon VII никоим образом не перебивает цены на 2080. Это вполне разумный выбор для AMD, учитывая текущее состояние рынка. Но это еще означает, что, когда карта не работает достаточно быстро, нет ценового преимущества, чтобы покрыть отставание производительности.

Что касается производительности по сравнению с оригинальным RX Vega 64, Radeon VII выглядит даже лучше, чем мы предполагали. По последним данным, новый флагман Radeon на 24% быстрее при 1440p, и на 32% быстрее при 4K разрешении, чем его предшественник. Таким образом, несмотря на интересную конфигурацию ядра, в которой Radeon VII поставляется с меньшим количеством CU, чем RX Vega 64, Radeon VII значительно опережает предшественника.
В общем, AMD запустила продукт, столкнувшись с тяжелой борьбой, как с точки зрения технологии, так и позиционирования продукта. И результаты для AMD неоднозначны. Хотя в современных играх чрезвычайно сложно извлечь выгоду из 16 ГБ видеопамяти, я пока не готов списывать ее со счетов как несущественный фактор. В последние два с половиной года возможности VRAM видеокарт не сильно изменились, возможно, пришло время. Однако в данный момент дополнительная VRAM от AMD мало что полезного принесет геймерам.

Создание контента, с другой стороны, выглядит намного более интересно. В отличие от игр, здесь нет стандартной рабочей нагрузки, поэтому я могу говорить только общими фразами. Radeon VII — это быстрая карта с 16 ГБ видеопамяти; это карта, которая не имеет аналогов на рынке. И если у полупрофессиональных или профессиональных пользователей визуализации, желающих работать с минимальными вложениями, есть рабочая нагрузка, которая действительно требует более 8–11 гигабайт видеопамяти, то на Radeon VII стоит обратить внимание. Не будет лишним вспомнить о преимуществах профессиональной поддержки, профессиональных драйверах AMD и других услугах, которые AMD, несомненно, представит профессиональным пользователям карты Radeon Pro-Grade Vega 20.

Что касается технологических побед AMD, важно отметить то, что Radeon VII показал существенное улучшение Vega. Недостатком же AMD является то, что Radeon VII по-прежнему Vega. Я не хочу много говорить о трассировке лучей или о других игровых моментах, потому что не уверен, что можно добавить что-то существенное к нашим обзорам GeForce. Но в целом Vega 20 представляет собой множество небольших, аккуратных дополнений к архитектуре Vega, даже если они не предназначены для потребителей.

Больше всего беспокоит то, что стратегия AMD по конфигурированию своих карт практически не изменилась по сравнению с RX Vega 64: AMD все еще гонится за производительностью выше всего остального. Это имеет смысл, учитывая позицию AMD, но это также означает, что Radeon VII даже не пытается устранить некоторые недостатки своего предшественника, что особенно заметно на фоне конкурентов. У Radeon VII есть много плюсов, но энергоэффективность не входит в их число.

В целом, Radeon VII делает все возможное, чтобы предложить себя в качестве полупрофессиональной карты с высоким объемом VRAM для создателей игрового контента. И по цене $ 699, это неплохая ниша на рынке. Однако для чистых геймеров сложнее продать эту карту вместо более производительной GeForce RTX 2080 от NVIDIA.

Итак, куда в итоге пришла AMD? К счастью для повстанцев Radeon, их ситуация все же улучшается, даже если общая конкурентная среда не претерпела существенных изменений. Это не победа для AMD, но возможность конкурировать с NVIDIA на новом уровне. AMD все еще конкурентоспособна. Они могут соревноваться в производительности, и благодаря Vega 20 у них появилось множество новых вычислительных функций. Новый продукт продвинет бизнес AMD сегодня, и он поможет AMD подготовится к завтрашнему дню и следующему этапу — Navi. Это все еще тяжелая битва, но с Radeon VII и Vega 20 AMD сделала еще один шаг вверх.

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps до лета бесплатно при оплате на срок от полугода, заказать можно тут.

Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

 
Источник

Читайте также