[Перевод] Монстры после каникул: AMD Threadripper 2990WX 32-Core и 2950X 16-Core (часть 3 — тесты)

03.09.2018

Часть 1>> Часть 2>> Часть 3>> Часть 4
[Перевод] Монстры после каникул: AMD Threadripper 2990WX 32-Core и 2950X 16-Core (часть 3 — тесты)

Тесты HEDT: системные тесты

В разделе «Системные тесты» основное внимание уделяется тестированию в реальных условиях, с которыми сталкивается потребитель. В этом разделе мы рассмотрим время загрузки приложений, обработку изображений, простую физику, эмуляцию, нейронное моделирование, оптимизированные вычисления и разработку трехмерных моделей, с использованием легкодоступного и настраиваемого программного обеспечения. Хотя некоторые из тестов попроще перекрываются возможностями больших пакетов, таких как PCMark, (мы публикуем эти значения в разделе офисных тестов), все же стоит рассмотреть различные перспективы. Во всех тестах мы подробно объясним, что именно тестируется, и как мы проводим тестирование.

Загрузка приложений: GIMP 2.10.4

Одним из наиболее важных аспектов пользовательского опыта и рабочего процесса является скорость реакции системы. Хороший в данном случае тест — проверка времени загрузки приложений. Большинство программ в наши дни хранятся на SSD и загружаются почти мгновенно, однако некоторые офисные инструменты требуют предварительной загрузки активов. В большинстве операционных систем используется кэширование поэтому, когда определенное программное обеспечение загружается часто (веб-браузер, офисные инструменты), его можно инициализировать гораздо быстрее.

В предыдущем пакете тестов мы проверяли, сколько времени необходимо для загрузки большого PDF-документа в Adobe Acrobat. К сожалению, этот тест стал кошмаром в смысле программирования, и отказывался переходить на Win10 RS3 без боя. Тем временем мы обнаружили приложение, которое способно автоматизировать этот тест, погонять им GIMP. GIMP — популярное и бесплатное приложение для редактирования фотографий, это редактор с открытым исходным кодом и главная альтернатива Adobe Photoshop. Мы настроили его для загрузки большого дизайнерского шаблона размером 50 МБ, выполнили нагрузку 10 раз с интервалом 10 секунд между ними. Из-за кэширования первые 3-5 результатов медленнее, чем последующие, время для кэширования может быть непоследовательным. Потому мы выводим среднее значение из последних пяти результатов, чтобы показать обработку ЦП при кэшированной загрузке.

Этот бенчмарк аккуратно разделил конкурсантов на две категории: процессоры с небольшим числом ядер на одной стороне, а топовые десктоп процессоры — на другой. 1920X и 2950X отработали быстро, а 18-ядерный Intel и 32-ядерный AMD — медленнее. Вероятно, это связано с различием в производительности одного ядра, однако, я подозреваю, что на результат могла повлиять задержка памяти.

FCAT: обработка изображений

Программное обеспечение FCAT было разработано для обнаружения микро-залипаний, упавших кадров, запуска графических тестов, когда две видеокарты объединены вместе для рендеринга сцены. Из-за игровых движков и графических драйверов не все комбинации GPU работали идеально, в результате чего программное обеспечение фиксировало цвета для каждого визуализированного кадра и динамически производило RAW запись данных с помощью устройства захвата видео.

Программное обеспечение FCAT принимает записанное видео, в нашем случае это 90 секунд 1440p игры Rise of the Tomb Raider, и преобразовывает данные о цвете в данные времени кадра, поэтому система может отображать «наблюдаемую» частоту кадров и коррелировать с энергопотреблением видео ускорителей. Этот тест, в силу того, насколько быстро он был составлен, является однопоточным. Мы запускаем процесс и в результате получаем время завершения.

Все тестовые системы работают примерно одинаково, однако более быстрая однопроцессорная производительность Intel ставит его выше других процессоров. EPYC 7601 последний в списке из-за низкой частоты одного ядра.

3D Particle Movement v2.1: Броуновское движение

Наш 3DPM-тест — это кастомный бенчмарк, разработанный для моделирования шести различных алгоритмов движения частиц в трехмерном пространстве. Алгоритмы были разработаны как часть моей кандидатской диссертации и, в конечном счете, лучше всего работают на графическом процессоре, дают хорошее представление о том, как потоки команд интерпретируются различными микроархитектурами.

Ключевой частью алгоритмов является генерация случайных чисел — мы используем относительно быструю генерацию, которая завершает реализацию цепочек зависимостей в коде. Главное обновление по сравнению с примитивной первой версией этого кода — была решена проблема False Sharing в кэшах, это было основным узким местом. Мы рассматриваем применение версий AVX2 и AVX512 этого теста для будущих обзоров.

Для этого теста мы запускаем стоковый набор частиц, используя шесть различных алгоритмов в течение 20 секунд с 10-секундными паузами, и сообщаем об общей скорости движения частиц в миллионах операций (движений) в секунду.

Похоже, что 3DPM любит потоки и частоту, а потому четыре первых места занимает AMD. Даже 16-ядерный процессор последнего поколения от AMD превосходит 18-ядерный процессор Intel в этом тесте, используя инструкции, отличные от AVX. Интересно посмотреть на сравнение 2990WX и EPYC 7601 — дополнительная частота на потребительском процессоре помогает повысить производительность на 30% +.

Dolphin 5.0: эмуляция консоли

Один из популярных запрошенных тестов в нашем пакете — это эмуляция консоли. Возможность выбрать игру из устаревшей системы и запустить ее очень привлекательна и зависит от усилий эмулятора: требуется значительно более мощная система x86, чтобы иметь возможность точно эмулировать старую консоль, отличную от x86. Особенно если код для этой консоли была сделан с учетом некоторых физических недоработок и багов оборудования.

Для нашего теста мы используем популярное программное обеспечение для эмуляции Dolphin и запускаем через него вычислительный проект, чтобы определить, насколько точно наши процессоры могут эмулировать консоль. В этом тесте работа под эмуляцией Nintendo Wii будет длиться около 1050 секунд.

Производительность Dolphin, как правило, зависит от однопоточных характеристик, поэтому Intel снова впереди, хотя странно, что последнее место занял R7 2700X. Чтобы исключить ошибочный результат, я должен снова запустить этот тест. Однако на частях TR второго поколения более высокая тактовая частота 2950X позволяет ему обогнать 2990WX на 20 секунд.

DigiCortex 1.20: Моделирование мозга моллюска

Этот бенчмарк был первоначально разработан для моделирования и визуализации активности нейронов и синапсов в мозге. Программное обеспечение поставляется с различными предустановленными режимами, мы выбрали малый бенчмарк, который выполняет симуляцию мозга из 32 тысячи нейронов / 1,8 миллиарда синапсов, что эквивалентно мозгу моллюска.

Любые результаты выше «единицы» подходят для работы в реальном времени. Из двух режимов, режим «без запуска синапсов», который является тяжелым для DRAM, и режим «с запуском синапсов», в котором нагружается процессор, мы выбираем последний. Несмотря на наш выбор, на тест по-прежнему влияет скорость DRAM.

С большим отрывом впереди оказываются четырехматричные процессоры с большим количеством ядер, хотя низкая частота EPYC 7601 помещает его в список лузеров. Похоже, что дополнительная латентность двухмодульной структуры в 2990WX не слишком повредила результатам, есть подозрение, что здесь кроется дополнительная производительность.

y-Cruncher v0.7.6: вычисления, оптимизированные для микроархитектуры

Я как-то слышал об y-Cruncher как инструменте, помогающем вычислять различные математические константы. Но после разговора с его разработчиком Alex Yee (исследователь из NWU и разработчик оптимизации программного обеспечения) я понял, что он оптимизировал программное обеспечение просто невероятным образом, чтобы получить лучшую производительность. Любая симуляция, которая занимает 20+ дней, получит выгоду от 1% прироста производительности! Алекс начал работу с y-Cruncher в качестве проекта еще в средней школе, но и сейчас проект актуален.

Для нашего теста мы запускаем y-Cruncher v0.7.6 через все возможные оптимизированные варианты двоичных, однопоточных и многопоточных вычислений, включая оптимизированные для AVX-512 бинарные файлы. Тест заключатся в том, чтобы вычислить 250 миллионов знаков числа Pi, мы используем однопоточные и многопоточные версии этого теста.

Программное обеспечение Intel хорошо оптимизировано под инструкции AVX2 и AVX512, а мы используем этот набор инструкций в однопоточном тесте. Однако, когда мы нагружаем новые ядра и каналы памяти, оба 32-ядерных процессора AMD выглядят достойными конкурентами Core i9, с учетом стоимости.

Agisoft Photoscan 1.3.3: преобразование 2D-изображения в 3D-модель

Один из ISV, с которым мы работаем в течение нескольких лет, — это Agisoft. Кампания разрабатывает программное обеспечение под названием PhotoScan, которое преобразует ряд 2D-изображений в 3D-модель. Это важный инструмент в разработке и архивировании моделей, и опирается на ряд однопоточных и многопоточных алгоритмов для перехода от одной стороны вычисления к другой.

В нашем тесте мы берем версию 1.3.3 ПО с набором данных большого размера — фотографии 84 x 18 мегапикселей. Мы прогоняем тест по довольно быстрому набору алгоритмов. Тест все же более требователен, чем его праотец 2017 года. В результате мы сообщаем об общем времени завершения процесса.

2990WX остался позади, так как он имеет ядра, которые не в состоянии достаточно быстро получить доступ к памяти. Для сравнения EPYC 7601 с вдвое большим каналом памяти работает почти на 500 секунд (на 20% +) быстрее. Следовательно, если 2990WX получит дополнительные каналы памяти, он сможет возглавить этот список.

Интересно, что TR 1950X обходит TR 2950X, который имеет лучшую латентность кэша и более высокую частоту во всех сценариях. Почему так — загадка.

HEDT Benchmarks: Rendering Tests

В профессиональной среде рендеринг часто является основной задачей для рабочих нагрузок процессора. Он используется в разных форматах: от 3D-рендеринга до растеризации, в таких задачах как игры или трассировка лучей, использует способность программного обеспечения управлять мешами, текстурами, коллизиями, алиасами и физикой (в анимации). Большинство рендереров предлагают код для ЦП, в то время как некоторые из них используют графические процессоры и выбирают окружение, использующее FPGA или специализированные ASIC. Для крупных студий процессоры по-прежнему являются главным аппаратным обеспечением.

Corona 1.3: Performance Render

Улучшенный рендерер, оптимизированный для производительности программного обеспечения, такого как 3ds Max и Cinema 4D, тест Corona рендерит сгенерированную сцену стандарта версии 1.3. Обычно реализация GUI бенчмарка показывает процесс построения сцены, позволяет пользователю видеть результат как «время для завершения».

Мы связались с разработчиком, он дал нам версию командной строки теста, которая обеспечивает прямой вывод результатов. Вместо времени построения сцены, мы сообщаем среднее количество лучей в секунду в течение шести прогонов, ведь соотношение выполненных действий к единицам времени визуально легче понять.

Так вот, AMD порвала наш графический движок. Потому что мы показываем результат теста Corona в лучах в секунду, имея в итоге 12 миллионов, что передает восемь цифр в наш движок, который затем пытается интерпретировать это как экспоненциальное представление числа (1.2 x 10 ^ 7), которое он не может отобразит на графике. Нам пришлось преобразовать этот график в миллионы лучей в секунду, чтобы заставить движок работать.

2990WX вырывается вперед с 32 ядрами благодаря высокой частоте, он намного опережает процессор EPYC. EPYC и Core i9 близки друг к другу, однако TR2950X вдвое дешевле.

Blender 2.79b: 3D Creation Suite

Высококлассный инструмент для рендеринга, Blender — продукт с открытым исходным кодом, имеющий множество настроек и конфигураций, используется многими высококлассными анимационными студиями по всему миру. Недавно организация выпустила тестовый пакет Blender, новый тест может занять более часа. Для получения результатов мы запускаем один из подтестов в этом пакете через командную строку — стандартную сцену «bmw27» в режиме «только CPU», измеряем время завершения рендеринга.

Дополнительные ядра позволяют 2990WX опередить EPYC и Core i9. Дополнительная пропускная способность 2990WX +58% по сравнению с Core i9.

LuxMark v3.1: LuxRender через различные кодовые пути

Существует много разных способов обработки данных рендеринга: CPU, GPU, Accelerator и другие. Кроме того, есть множество фреймворков и API. LuxMark — эталон, разработанный с использованием механизма LuxRender, предлагает несколько различных сцен и API.

взято из Linux версии LuxMark

В нашем тесте мы запускаем простую сцену «Ball» на коде C ++ и OpenCL, но в режиме CPU. Эта сцена начинается с грубого рендеринга и медленно улучшает свое качество в течение двух минут. Взят средний показатель количества «килолучей в секунду».

По некоторым причинам процессоры Intel Skylake-X терпят неудачу в нашем тестировании OpenCL. В тесте C ++ дополнительные контроллеры памяти на процессоре EPYC ставят его над TR2 и Core i9. 2990WX и Core i9 почти равны.

POV-Ray 3.7.1: трассировка лучей

Движок трассировки лучей Persistence of Vision — еще один известный инструмент бенчмаркинга, который какое-то время находился в спячке, пока AMD не выпустила свои процессоры Zen. Внезапно оба Intel и AMD стали пушить код в основную ветку проекта с открытым исходным кодом. Для нашего теста мы используем встроенный тест для всех ядер, вызываемый из командной строки.

Это еще один тест, который любит ядра и частоту, они то и есть у 2990WX. 2990WX способен закончить тест почти за 20 секунд. Возможно, настало время для большего встроенного теста.

HEDT Benchmarks: Office Tests

Набор тестов Office — набор стандартных отраслевых тестов, которые фокусируются на офисных рабочих процессах. Это синтетические тесты, + мы проверяем производительность компилятора в этом разделе. Чтобы оценить оборудование в целом, пользователям важны эти критерии.

PCMark 10: стандарт индустрии

Futuremark, теперь известный как UL, разрабатывал тесты, которые являются отраслевыми стандартами вот уже в течение двух десятилетий. Последним набором системных тестов является PCMark 10. Здесь по сравнению с PCMark 8 улучшено несколько тестов, больше внимания уделено OpenCL, а конкретно в таких случаях, как потоковая передача видео.

PCMark разбивает свои оценки на примерно 14 различных областей, включая запуск приложений, веб-страницы, электронные таблицы, редактирование фотографий, рендеринг, видеоконференции и физику. Мы публикуем все эти данные в нашей базе данных Bench. Ключевым показателем для текущего обзора является общий балл.

Один из недостатков PCMark заключается в том, что он, похоже, собирает все результаты, выдавая некоторое усредненное значение по всем направлениям. Интересно, но процессоры Intel остались позади, 2950X и 2700X — в топе.

Chromium Compile: Windows VC ++ Компиляция Chrome 56

Большое количество читателей AnandTech — это инженеры-программисты, которые смотрят, как работает аппаратное обеспечение. Компиляция ядра Linux является «стандартной» для рецензентов, которые компилируют часто. Но наш тест немного более разнообразен — мы используем инструкции Windows для компиляции Chrome, в частности, сборки Chrome 56 марта 2017 года. Инструкции Google о том, как скомпилировать под Windows, после загрузки 400 000 файлов из репозитория довольно подробны.

В нашем тесте, следуя инструкциям Google, мы используем компилятор MSVC и ninja для управления компиляцией. Как и следовало ожидать, это тест с переменной многопоточностью, с переменными требованиями к DRAM, которые получают выгоду от более быстрых кешей. Результаты теста — это время, затраченное на компиляцию, которое мы конвертируем в количество компиляций в день.

Этот тест является таким приятным сочетанием потоков ST, MT и ограниченной памяти, что действительно интересно увидеть конечный результат. К сожалению, для нашего нового пакета выходные файлы были настроены неправильно, поэтому несмотря на завершение теста, мы получили только несколько результатов. Но даже это демонстрирует интересную метрику: 2950X вырывается вперед 2990WX вместе с Core i9, а вот система EPYC пасет задних из-за своих низких частот.

3DMark Physics: вычисление физики в играх

Наряду с PCMark существует бенчмарк 3DMark, Futuremark (UL) – набор игровых тестов. Каждый игровой тест состоит из одной или двух сцен, тяжелых для графического процессора, а также физического теста, зависящего от того, когда был написан тест и на какую платформу он нацелен. Основными испытуемыми, в порядке приростания сложности, являются Ice Storm, Cloud Gate, Sky Diver, Fire Strike и Time Spy.

Некоторые из подтестов предлагают другие варианты, такие как Ice Storm Unlimited или Fire Strike. Ice Storm Unlimited предназначен для мобильных платформ с внеэкранным рендерингом. Fire Strike Ultra предназначен для высокопроизводительных систем 4K с большим количеством добавленных функций. Стоит заметить, что Time Spy в настоящее время имеет режим AVX-512 (который мы можем использовать в будущем).

Что касается наших тестов, мы отправляем в Bench результаты каждого физического теста, но для обзора берем результаты самых требовательных сцен: Ice Storm Unlimited, Cloud Gate, Sky Diver, Fire Strike Ultra и Time Spy,

В тестах игр не так заметно, что наличие больших процессоров с множеством ядер не особо идет на пользу производительности. Игровая физика явно предпочитает пропускную способность памяти. Мы знаем, что Time Spy не предназначен для масштабирования более чем на 10 ядер, и видим, что 10-ядерный процессор оказался на первом месте. При некоторых запусках теста бенчмарк был сконфигурирован неправильно, поэтому будет интересно посмотреть, что он покажет с другими процессорами среднего и высокого звена.

GeekBench4: Синтетический тест

Общий инструмент для межплатформенного тестирования на мобильных устройствах, ПК и Mac, GeekBench 4 — это идеальное синтетическое испытание системы по целому ряду алгоритмов, требующих максимальной пропускной способности. Тесты включают в себя шифрование, сжатие, быстрое преобразование Фурье, операции с памятью, физику n-тела, операции с матрицами, манипуляцию с гистограммой и пасринг HTML.

Я включаю этот тест по причине популярности запроса, хотя результаты его очень уж синтетические. Многие пользователи часто придают большое значение его результатам из-за того, что он скомпилирован на разных платформах (хотя и разными компиляторами).
Мы записываем оценки основных подтестов (Crypto, Integer, Floating Point, Memory) в нашу базу результатов тестирований, но для обзора публикуем только общие одиночные и многопоточные результаты.

HEDT Benchmarks: Encoding Tests

С ростом количества стримов, видеоблогов и видеоконтента в целом, тесты кодирования и транскодирования приобретают все большее значение. Мало того, что становится число домашних пользователей и геймеров, занятых преобразованием видеофайлов и видеопотоков, растет, так и сервера, обрабатывающие потоки данных, нуждаются в шифровании на лету, компрессии и декомпрессии логов. Наши тесты кодирования нацелены на такие сценарии, и учитывают мнение комьюнити, чтобы обеспечить самые актуальные результаты.

Handbrake 1.1.0: потоковое и архивное транскодирование видео

Популярный инструмент с открытым исходным кодом, Handbrake — программное обеспечение для преобразования видео любым возможным способом, которое, в некотором смысле, является эталоном. Опасность здесь кроется в номерах версии и в оптимизации. Например, последние версии программного обеспечения могут использовать преимущества AVX-512 и OpenCL для ускорения некоторых типов транскодирования и определенных алгоритмов. Версия, которую мы используем, представляет собой чистую работу с CPU, со стандартными вариантами транскодирования.

Мы разделили Handbrake на несколько тестов, используя запись с нативной веб-камеры Logitech C920 1080p60 (по существу, запись стрима). Запись будет преобразована в два типа потоковых форматов и в один для архивирования. Используемые параметры вывода:

720p60 at 6000 kbps constant bit rate, fast setting, high profile
1080p60 at 3500 kbps constant bit rate, faster setting, main profile
1080p60 HEVC at 3500 kbps variable bit rate, fast setting, main profile

Кодирование видео зависит от гремучей смеси многопоточности, задержки памяти и вычислительной мощности. Core i9, обладающий инструкциями AVX2, занимает абсолютное лидерство во всех трех тестах. Результаты AMD, похоже, несколько непостоянны, но 1950X и 2700X все же опережают собратьев. К сожалению, мы не получили результатов работы 2950X в наших первоначальных прогонах, но я предполагаю, что он покажет себя конкурентом Core i9, с учетом того, где расположился 1950X. Однако 2990WX показал не лучший результат.

7-zip v1805: популярный архиватор с открытым исходным кодом

Из всех наших тестов архивации / разархивации 7-zip является наиболее востребованным, и обладает встроенным бенчмарком. В наш тестовый набор мы внесли последнюю версию этого софта, и запускаем бенчмарк из командной строки. Результаты архивации и разархивации выводим как единый общий балл.

В этом тесте хорошо видно, что современные процессоры с несколькими матрицами имеют большое различие в производительности между сжатием и декомпрессией: хорошо проявляют себя в одном и плохо в другом. Кроме того, у нас ведутся активные дискуссии о том, как Windows Scheduler реализует каждый поток. Когда мы получим больше результатов, с удовольствием поделимся своими соображениями на этот счет.

О да, этот набор тестов был очень интересным. Когда мы впервые опубликовали этот обзор, еще без комментариев, результат архивирования на 2990WX, оказавшийся худшим, был распространен в социальных сетях с огромной скоростью, рассказывая о низкой производительности AMD. Он также использовался в сочетании с тестами Phoronix, которые показали гораздо лучшую картину под Linux.

Но меня смущает то, что почти никто не публиковал результат теста разархивации. Здесь 32-ядерные процессоры AMD оказались лучшими, а 16-ти и 18-ти ядерные процессоры заняли следующие места.

Если вы планируете репостить одни результаты, пожалуйста, включите и другие. В противном случае вы представляете только половину картинки.

WinRAR 5.60b3: Архиватор

Когда мне нужен инструмент для сжатия, обычно я выбираю WinRAR. Многие пользователи моего поколения использовали его более двух десятилетий назад. Интерфейс почти не изменился, хотя интеграция с командами right-click в Windows весьма приятный плюс. Он не имеет встроенного бенчмарка, поэтому мы запускаем сжатие каталога, содержащего более 30 60-секундных видеофайлов и 2000 небольших веб-файлов, с нормальной скоростью сжатия.

WinRAR имеет переменную многопоточность, и требователен к кэшированию, поэтому в нашем тесте мы запускаем его 10 раз и вычисляем среднее значение за последние пять прогонов, чтобы проверить только производительность процессора.

Комплект высокочастотных ядер и хорошая память ясное дело важны, но часом более высокая пропускная способность памяти и более низкая латентность оказываются важнее. На вершине находится R7 2700X от AMD, на втором месте — 10-ядерный процессор Intel. Я удивлен, что не вижу в лидерах 8700K, возможно, его шести ядер недостаточно. Большое количество ядер AMD не принесло победу в этом соревновании, 32-ядерные процессоры выполняли задачу дольше всех.

Шифрование AES: защита файлов

Ряд платформ, особенно мобильные устройства, по умолчанию шифруют файловые системы для защиты содержимого. В системах на базе Windows для шифрования данных часто применяется BitLocker от Microsoft (или стороннее программное обеспечение). В тесте шифрования AES мы использовали discontinued TrueCrypt в бенчмарке, который проверяет несколько алгоритмов шифрования непосредственно в памяти.

Данные, полученные в результате этого теста — комбинированная производительность AES для шифрования / дешифрования, измеренная в гигабайтах в секунду. Программное обеспечение использует команды AES, если процессор это позволяет, но не использует AVX-512.

Если имеется много ядер, этот тест показывает хорошие результаты. Но, похоже, двухмодульный характер расположения ядер и контроллеров памяти в 2990WX дает плохой результат. EPYC 7601 с его восемью контроллерами памяти работает лучше, а лидером становится 1950X. 2950X, в котором все ядра имеют равный уровень доступа, показывает себя во всем блеске, значительно превосходя 18-ядерный Core i9 от Intel.

HEDT Benchmarks: веб-тесты и устаревшие тесты

Ввиду направленности на low-end системы или small form factor системы, веб-тесты, как правило, трудно стандартизировать. Современные веб-браузеры часто обновляются, не давая возможности отключить эти обновления, поэтому трудно поддерживать какую-то общую платформу. Быстрый темп развития браузера означает, что версии (и показатели производительности) могут меняться с недели на неделю. Несмотря на это, веб-тесты часто являются важным показателем для пользователей. Наш набор веб-тестов включает несколько тестов, являющихся индустриальным стандартом, а также пару популярных, но несколько устаревших тестов.

Мы включили наши устаревшие, но все еще популярные тесты в этот раздел.

WebXPRT 3: веб-задачи современного мира, включая ИИ

Компания, стоящая за тестовым пакетом XPRT, Principled Technologies, недавно выпустила новейший веб-тест, и вместо того, чтобы добавить год выпуска к названию, его просто назвали «3». Этот новейший тест (по крайней мере, сейчас) разработан на основании таких предшественников: тесты взаимодействия с пользователем, офисных вычислений, построения графиков, сортировки списков, HTML5, манипулирования изображениями, и в некоторых случаях даже тесты ИИ.

Для нашего бенчмарка мы запускаем стандартный тест, который отрабатывает контрольный список семь раз и дает конечный результат. Мы проводим такой тест четыре раза, и выводим среднее значение.

WebXPRT 2015: тестирование HTML5 и Javascript Web UX

Более старая версия WebXPRT — издание 2015 года, в котором внимание уделяется немного другому набору веб-технологий и фреймворков. Это по-прежнему актуальный тест, особенно для пользователей, которые взаимодействуют не с самыми последними веб-приложениями на рынке. Разработка веб-фреймворков происходит в ускоренном темпе. Фреймворки быстро разрабатываются, встраиваются в приложения, используются, закончив с одним продуктом разработчики сразу же переходят к следующему. А вот адаптация приложения под новый фреймворк — сложная задача, особенно с такой скоростью циклов развития. По этой причине множество приложений «застряли во времени» и остаются актуальными для пользователей в течение многих лет.

Как и в случае с WebXPRT3, основной бенчмарк отрабатывает контрольный набор семь раз, выводя окончательный результат. Мы повторяем это четыре раза, выводим среднее значение и показываем окончательные результаты.

Speedometer 2: Javascript Frameworks

Наш новейший веб-тест — Speedometer 2, который проходит по целому ряду фреймворков javascript, чтобы сделать всего три простых вещи: построить список, включить каждый элемент в списке и удалить список. Все фреймворки реализуют одни и те же визуальные сигналы, но, что очевидно, делают это по-разному.

Наш тест проходит весь список фреймворков и дает окончательный балл под названием «rpm», один из внутренних показателей бенчмарка. Мы выводим этот показатель как окончательный результат.

Google Octane 2.0: Core Web Compute

Популярный веб-тест в течение нескольких лет, но теперь уже не обновляемый — Octane от Google. Версия 2.0 выполняет пару десятков задач, связанных с вычислениями, такие как регулярные выражения, криптография, трассировка лучей, эмуляция и вычисление уравнений Навье — Стокса.

Тест дает каждому из подтестов оценку и возвращает среднее геометрическое в качестве конечного результата. Мы проводим полный бенчмарк четыре раза и оцениваем окончательные результаты.

Mozilla Kraken 1.1: Core Web Compute

Еще более старый, чем Octane, перед нами Kraken, на этот раз разработанный Mozilla. Это старый тест, который выполняет относительно однообразную вычислительную механику, такую как обработка звука или фильтрация изображений. Тест Kraken сильно оптимизирован и производит очень нестабильный результат, зависящий от версии браузера.

Основной бенчмарк проходит через каждый из подтестов десять раз и возвращает среднее время завершения для каждого цикла в миллисекундах. Мы запускаем полный бенчмарк четыре раза, замеряем средний результат.

3DPM v1: вариант 3DPM v2.1 с нативным кодом.

Первый «наследованный» тест в пакете — первая версия нашего теста 3DPM. Это конечная нативная версия кода, как если бы она была написана ученым без знания того, как работает компьютерное оборудование, компиляторы или оптимизация (как это и было в самом начале). Тест представляет собой большой объем научного моделирования в дикой природе, где получение ответа более важно, чем скорость вычислений.

В этой версии единственная реальная оптимизация была во флагах компилятора (-O2, -fp: fast): компиляция в релиз режиме и включение OpenMP в основных циклах вычислений. Циклы не были подогнаны под размеры функций, а самым серьезным замедлением работы является false sharing в кэше. Код имеет длинные цепи зависимостей, основанные на генерации случайных чисел, что приводит к снижению производительности на некоторых вычислительных микроархитектурах.

x264 HD 3.0: устаревший тест транскодирования

Этот тест перекодирования очень стар, им пользовался Anandtech еще во времена процессоров Pentium 4 и Athlon II. В нем стандартизованное видео 720p перекодируется с двойным преобразованием, а бенчмарк показывает кадры в секунду каждого прохода. Тест является однопоточным, и в некоторых архитектурах мы упираемся в ограничение IPC — instructions-per-clock.

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

3 месяца бесплатно при оплате новых Dell R630 на срок от полугода — 2 х Intel Deca-Core Xeon E5-2630 v4 / 128GB DDR4 / 4х1TB HDD или 2х240GB SSD / 1Gbps 10 TB — от $99,33 месяц, только до конца августа, заказать можно тут.

Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

Источник

#amd, threadripper 2950x, threadripper 2990wx, процессоры