[Перевод] Два в одном: Intel Optane Memory H10 (часть 2)

Часть 1 >> Часть 2

Тест накопителей AnandTech — The Destroyer

The Destroyer — это чрезвычайно долгий тест, который реплицирует шаблоны доступа приложений с большим объемом ввода-вывода. Как при использовании в реальных условиях, накопители получают время от времени небольшой перерыв, который позволяет использовать фоновые сборки мусора и очистки кешей, но эти простои ограничены 25 мс, так что не нужно тратить всю неделю для проведения одного теста. Тесты AnandTech Storage Bench (ATSB) не включают в себя запуск реальных приложений, которые генерировали рабочие нагрузки, поэтому оценки мало чувствительны к изменениям производительности ЦП и ОЗУ нашего нового тестового стенда, но переход на более новую версию Windows и свежие драйвера могут оказать заметное влияние.

[Перевод] Два в одном: Intel Optane Memory H10 (часть 2)

Мы оцениваем результаты этого теста, сообщая о средней пропускной способности диска, средней задержке операций ввода-вывода и общей энергии, потребляемой приводом во время теста.

Intel Optane Memory H10 на самом деле лучше работает в The Destroyer с отключенным кэшированием, с полностью неактивной стороной Optane. Этот тест не оставляет много времени для фоновой оптимизации размещения данных, и общий объем перемещаемых данных значительно больше, чем вмещает кэш Optane объемом 32 ГБ. У 512 ГБ QLC NAND не хватает производительности для своевременной очистки кеша.

Сторона QLC Optane Memory H10 сама по себе имеет плохие средние баллы задержки 99-го процентиля, а недостаток кэш-памяти только усугубляет ситуацию. Даже жесткий диск 7200RPM показал себя лучше.

Средние задержки чтения для Optane Memory H10 хуже, чем у всех дисков на основе TLC, но намного лучше, чем у HDD с или без кеша Optane перед ним. В случае записи QLC H10 отправляется SSD на последнее место, когда заканчивается кэш SLC.

Кэш-память Optane оказывает положительное влияние на 99-го процентиль задержки чтения H10, приближая диск к SSD-накопителю Crucial MX500, и значительно опережая более крупную QLC-модель объемом всего 1 ТБ 660p. Задержка записи в 99-м процентиле ужасна, но даже с переполнением кеша, вызывающим избыточные записи, H10 не так плох, как DRAMless Toshiba RC100.

Тест накопителей AnandTech – Heavy

Наш тест для тяжелых нагрузок “Heavy” дает пропорционально большую нагрузку записи, чем «Разрушитель», но занимает гораздо меньше времени. Общий объем записанных данных в Heavy тесте недостаточен для заполнения диска, поэтому производительность никогда не падает до устойчивого рабочего состояния. Этот тест гораздо более применим для показателей повседневного энергопотребления, и на его результат в значительной степени влияет пиковая производительность накопителя. Подробные данные о Heavy тесте можно найти в соответствующей статье на AnandTech. Этот тест запускается дважды, один раз на полностью очищенном диске, и один раз после заполнения диска продолжительной записью.

В Heavy тесте кэширование однозначно ускоряет Intel Optane Memory H10, выводя его среднюю скорость передачи данных в диапазон хороших SSD NVMe на основе TLC, если тест выполняется на пустом диске. Производительность полного привода все ещё лучше с кешем, чем без него, но в конечном итоге поведение QLC NAND после заполнения SLC не может быть скрыто Optane. Ни один из накопителей на основе TLC не замедляется при заполнении так же сильно, как накопители QLC.

Средняя и 99-процентная задержка для H10 примерно на уровне других накопителей TLC, только когда тест выполняется на пустом диске. Когда Heavy тест запускается на полном диске, с полным SLC-кешем и простаивающим Optane-кешем, задержка даже хуже, чем у жесткого диска с Optane-кешем. Средняя задержка H10 в случае полного привода все же существенно лучше, чем при использовании только части QLC, но кэш Optane совсем не улучшает показатель 99-го процентиля задержки.

Средние задержки чтения у H10 значительно хуже, когда Heavy тест выполняется на полном диске, но он все же немного лучше, чем у SATA SSD. Средняя задержка записи — это то, где QLC выглядит особенно плохо, с показателем целого H10 хуже, чем у HDD, а с отключенным кэшированием Optane задержка записи в десять раз выше, чем у TLC SSD.

99 – процентиль задержки чтения у H10 без кэширования Optane является серьезной проблемой во время полного тестирования диска, но использование кэша Optane возвращает QoS чтения обратно в приличный диапазон для SSD. 99 – процентиль задержки записи выглядит плохо без кеша Optane, и еще хуже с ним.

Тест накопителей AnandTech — Light

Наш тест накопителей Light имеет относительно больше последовательных сессий и меньшую глубину очереди, чем The Destroyer или Heavy test, и это, безусловно, самый короткий тест в целом. Он основан в основном на приложениях, которые не сильно зависят от производительности накопителя, поэтому результаты теста скорее отображают временя запуска приложений и загрузки файлов. Этот тест можно рассматривать как сумму всех небольших задержек в повседневном использовании, но при сокращении простоев до 25 мс, для его проведения требуется менее получаса. Подробные сведения о Light тесте можно найти в соответствующей статье на AnandTech. Как и в случае теста ATSB Heavy, этот тест запускается дважды: на приводе, который был полностью очищен, и после заполнения диска последовательной записью.

Intel Optane Memory H10 конкурирует с low-end накопителями NVMe, когда тест Light выполняется на пустом диске. Хотя более высокая производительность отдельно взятой части QLC себе указывает на то, что оценка целого H10, возможно, несколько занижена. Производительность полного диска хуже, чем у всех твердотельных накопителей на основе TLC, но все же значительно превосходит HDD без кеша Optane.

Средняя и 99-процентная латентность от Optane Memory H10 являются конкурентоспособными в сравнении с TLC NAND, когда тест выполняется на пустом диске, и даже при полном диске показатели задержки остаются лучше, чем у механического жесткого диска.

Средняя задержка записи при полном накопителе — единственное, что выделяет и идентифицирует H10 как накопитель NVMe выше начального уровня. А DRAMless Toshiba RC100 на базе TLC оказался хуже в этом сценарии.

В отличие от средних задержек, значения 99-процентиля задержек как чтения, так и записи у Optane H10 показывают, что при заполнении он испытывает значительные трудности. Кеша Optane недостаточно, чтобы восполнить недостаток кеша SLC.

Производительность случайного чтения

В первом тесте производительности случайного чтения используются очень короткие пакеты операций, выполняемые по одному, и без очереди. Диски получают достаточно времени простоя между пакетами, чтобы общий рабочий цикл составлял 20%, поэтому термическое регулирование невозможно. Каждый пакет состоит из 32 МБ случайных чтений по 4 КБ, из 16 ГБ данных на диске. Общее количество прочитанных данных составляет 1 ГБ.

При тесте случайного чтения коротких пакетов данные легко помещаются в кэш Optane на Optane Memory H10, поэтому он превосходит все твердотельные накопители на основе flash-памяти, но значительно медленнее, чем устройства хранения с чистым Optane.

Производительность длительного случайного чтения

Тест производительности продолжительного случайного чтения аналогичен тесту из нашего набора тестов 2015 года: проверяются глубины очереди от 1 до 32, а средняя производительность и энергоэффективность по QD1, QD2 и QD4 указываются в качестве основных показателей. Каждая глубина очереди проверяется одну минуту или 32 ГБ переданных данных, что быстрее. После проверки глубины каждой очереди накопителю дается одна минута для охлаждения, поэтому накопление тепла вряд ли повлияет на более высокие глубины очереди. Отдельные операции чтения по-прежнему составляют 4 КБ и занимают 64 ГБ диска.

При длительном тесте случайного чтения, который охватывает больший диапазон диска, чем может выдержать кэш Optane, производительность H10 находится на одном уровне с твердотельными накопителями на основе TLC.

Графики


Intel Optane Memory H10 512GB


Intel SSD 660p 1TB


Intel SSD 760p 512TB


Intel Optane SSD 900P 280GB


Samsung 970 EVO 500GB


Intel Optane Memory H10 512GB (QLC)


Intel Optane Memory H10 512GB (32GB Optane)


Intel Optane Memory M10 64GB


Team MP34 512GB


Crucial MX500 500GB


Intel Optane Memory 32GB


MyDigitalSSD SBX 512GB


Western Digital WD Black 7200RPM 1TB


Intel Optane SSD 800P 118GB


WD Black 1TB 7200RPM + Optane Memory 32GB

Кэш Optane обеспечивает малое преимущество по сравнению с чистым хранилищем QLC на низких глубинах очереди, но на более высоких глубинах H10 с включенным кэшированием начинает проявлять реальное преимущество над частью QLC. К сожалению, показатели всё ещё достаточно низки, и SSD на флэш-памяти превзошли способность произвольного чтения H10.

Производительность произвольной записи

Первый тест производительности случайной записи коротких пакетов структурирован аналогично тесту чтения, но каждый пакет занимает всего 4 МБ, а общая длина теста составляет 128 МБ. Операции произвольной записи 4 КБ распределяются по 16 ГБ диска, и выполняются по одной, без очереди.

Производительность случайной записи коротких пакетов H10 с включенным кэшированием выше, чем может справиться любая половина диска по отдельности, но намного меньше, чем сумма двух его частей. Достаточный кэш SLC на диске TLC все еще лучше, чем кэш Optane поверх QLC.

Как и в случае с тестом непрерывного случайного чтения, наш тест с устойчивой случайной записью 4 КБ выполняется до одной минуты или до 32 ГБ на глубину очереди, охватывая 64 ГБ диска и предоставляя диску до 1 минуты простоя между глубинами очереди, чтобы обеспечить сброс кэшей, и остывание диска.

При длительном тесте произвольной записи, который охватывает гораздо более широкий диапазон, чем может выдержать кэш Optane, Optane Memory H10 отстает от всех конкурентов на основе флэш-памяти. Программное обеспечение для кэширования в конечном итоге создает дополнительную нагрузку, которая дает производительность намного ниже, чем сама часть QLC, используя только кэш SLC.

Графики


Intel Optane Memory H10 512GB


Intel SSD 660p 1TB


Intel SSD 760p 512TB


Intel Optane SSD 900P 280GB


Samsung 970 EVO 500GB


Intel Optane Memory H10 512GB (QLC)


Intel Optane Memory H10 512GB (32GB Optane)


Intel Optane Memory M10 64GB


Team MP34 512GB


Crucial MX500 500GB


Intel Optane Memory 32GB


MyDigitalSSD SBX 512GB


Western Digital WD Black 7200RPM 1TB


Intel Optane SSD 800P 118GB


WD Black 1TB 7200RPM + Optane Memory 32GB

Производительность произвольной записи на Optane Memory H10 нестабильна, но, как правило, имеет тенденцию к снижению с ростом глубины очереди. Два слоя кеширования, пересекающиеся друг с другом, не лучший рецепт для стабильной работы.

Производительность последовательного чтения

В первом тесте производительности последовательного чтения используются короткие пакеты данных по 128 МБ, выданные операциями по 128 КБ без очереди. Тест усредняет производительность по восьми пакетам, в общей сложности для 1 ГБ данных переданных с диска, содержащего 16 ГБ данных. Между каждым пакетом приводу дается достаточно времени простоя, чтобы поддерживать общий рабочий цикл на уровне 20%.

Производительность последовательного чтения Optane Memory H10 намного ниже, чем у высокопроизводительных накопителей на основе TLC, но сравнима с низкоуровневыми накопителями NVMe, которые ограничены PCIe3 x2. Кэширование памяти Optane обеспечивает только увеличение скорости примерно на 10% по сравнению с чистой скоростью QLC, так что это, очевидно, не тот случай, когда драйверы кэширования могут эффективно разделять доступ между Optane и NAND.

Второй тест — продолжительного последовательного чтения — использует глубины очереди от 1 до 32, при этом показатели производительности и мощности вычисляются как среднее значение QD1, QD2 и QD4. Каждая глубина очереди тестируется одну минуту или до 32 ГБ данных, полученных с диска, содержащего 64 ГБ данных. Этот тест запускается дважды: один раз с накопителя, подготовленного последовательной записью тестовых данных, и еще раз после того, как тест с произвольной записью перепутал все, что привело к невидимой для ОС фрагментации внутри SSD. Эти две оценки представляют две крайности реального использования диска, где распределение износа и модификации существующих данных создадут некоторую внутреннюю фрагментацию, которая негативно отразится на производительности, но обычно не до крайней степени, показанной здесь.

В более длительном тесте последовательного чтения кэширование Optane все еще не позволяет эффективно сочетать производительность частей Optane и NAND H10. Однако при чтении данных, которые не были записаны последовательно, кэш Optane оказывается существенной помощью.

Графики


Intel Optane Memory H10 512GB


Intel SSD 660p 1TB


Intel SSD 760p 512GB


Intel Optane SSD 900P 280GB


Samsung 970 EVO 500GB


Intel Optane Memory H10 512GB (QLC)


Intel Optane Memory H10 512GB (32GB Optane)


Intel Optane Memory M10 64GB


Team MP34 512GB


Crucial MX500 500GB


Intel Optane Memory 32GB


MyDigitalSSD SBX 512GB


Western Digital WD Black 7200RPM 1TB


Intel Optane SSD 800P 118GB

В этом тесте Кэш Optane является чем-то вроде помехи последовательному чтению на малых глубинах очереди. Но на уровне QD8 и выше он дает некоторые преимущества по сравнению с использованием только QLC.

Производительность последовательной записи

Пакеты данных для первого теста последовательной записи структурированы идентично тесту последовательного чтения, за исключением направления передачи данных. Каждый пакет записывает 128 МБ как операции 128 КБ, выполненные в QD1. В общей сложности 1 ГБ данных записывается на диск, содержащий 16 ГБ данных.

Скорость последовательной записи коротких пакетов у части Optane сама по себе очень низкая, так что это тот случай, когда сторона QLC NAND значительно помогает Optane H10. Поэтому QLC H10 конкурирует с дисками на основе TLC, но когда программное обеспечение кеширования мешает H10, получается производительность на уровне SATA.

Тест продолжительной последовательной записи структурирован идентично такому же тесту на чтение, за исключением направления передачи данных. Глубина очереди варьируется от 1 до 32, и каждая глубина очереди проверяется одну минуту или до 32 ГБ переданных данных, а затем до одной минуты простоя, когда диск охлаждается и выполняет сборку мусора. Тест ограничен объемом диска 64 ГБ.

Ситуация в целом аналогична предыдущему тесту, хотя здесь некоторые низкоуровневые NVMe упали настолько низко, что оценка Optane Memory H10 уже не выглядит так ужасно. Однако часть QLC сама по себе все еще лучше справляется с продолжительной последовательной записью, чем конфигурация с кэшированием.

Графики


Intel Optane Memory H10 512GB


Intel SSD 660p 1TB


Intel SSD 760p 512GB


Intel Optane SSD 900P 280GB


Samsung 970 EVO 500GB


Intel Optane Memory H10 512GB (QLC)


Intel Optane Memory H10 512GB (32GB Optane)


Intel Optane Memory M10 64GB


Team MP34 512GB


Crucial MX500 500GB


Intel Optane Memory 32GB


MyDigitalSSD SBX 512GB


Western Digital WD Black 7200RPM 1TB


Intel Optane SSD 800P 118GB


WD Black 1TB 7200RPM + Optane Memory 32GB

Нет четкой тенденции в производительности H10 во время теста продолжительной последовательной записи. Он в основном работает между уровнями QLC и Optane, что означает, что программное обеспечение для кэширования мешает, а не позволяет двум половинкам работать вместе и обеспечивать лучшую производительность, чем каждая из них в отдельности. Вполне возможно, что, предоставив больше времени для очистки кешей Optane и SLC, мы увидим совершенно другое поведение.

Производительность при смешанной случайной нагрузке

Тест смешанного случайного чтения и записи включает миксы, варьирующиеся от чистого чтения до чистой записи с шагом 10%. Каждый микс тестируется 1 минуту или 32 ГБ переданных данных. Тест проводится с глубиной очереди 4 и ограничен объемом диска 64 ГБ. В промежутке между каждым миксом приводу дается время простоя до одной минуты, поэтому общий рабочий цикл составляет 50%.

Производительность Optane Memory H10 в тесте смешанного случайного ввода-вывода хуже, чем у любой половины накопителя. Тест охватывает более широкий диапазон, чем может выдержать кэш Optane объемом 32 ГБ, поэтому попытки программного обеспечения кэширования в конечном итоге попросту вредят.

Графики


Intel Optane Memory H10 512GB


Intel SSD 660p 1TB


Intel SSD 760p 512GB


Intel Optane SSD 900P 280GB

Samsung 970 EVO 500GB


Intel Optane Memory H10 512GB (QLC)


Intel Optane Memory H10 512GB (32GB Optane)


Intel Optane Memory M10 64GB


Team MP34 512GB


Crucial MX500 500GB


Intel Optane Memory 32GB


MyDigitalSSD SBX 512GB


Western Digital WD Black 7200RPM 1TB


Intel Optane SSD 800P 118GB


WD Black 1TB 7200RPM + Optane Memory 32GB

Сама по себе QLC-часть H10 работает аналогично конфигурации с кэшем Optane во время нагруженной чтением половины теста, хотя кэширование делает производительность непостоянной. В течение нагрузки записью конфигурация чистого QLC имеет значительную скорость по сравнению с полным устройством H10, пока кэш SLC не исчерпывается в самом конце.

Производительность при смешанной последовательной нагрузке

Тест смешанного последовательного чтения и записи отличается от смешанного теста выполнением последовательного доступа 128 КБ вместо 4 КБ в случайных местах. Также последовательный тест проводится на глубине очереди 1. Диапазон проверяемых миксов одинаков, время и ограничения на передачу данных также такие же, как указано выше.

В тесте последовательного смешанного ввода-вывода Optane Memory H10 в среднем немного лучше, чем SATA SSD, но между H10 и высокопроизводительными TLC-накопителями остается значительный разрыв. Это еще один сценарий, в котором программное обеспечение кэширования Optane не может постоянно помогать, и общая производительность H10 немного ниже, чем у чистого QLC NAND со своим собственным кешем SLC.

Графики


Intel Optane Memory H10 512GB


Intel SSD 660p 1TB


Intel SSD 760p 512GB


Intel Optane SSD 900P 280GB

Samsung 970 EVO 500GB


Intel Optane Memory H10 512GB (QLC)


Intel Optane Memory H10 512GB (32GB Optane)


Intel Optane Memory M10 64GB


Team MP34 512GB


Crucial MX500 500GB


Intel Optane Memory 32GB


MyDigitalSSD SBX 512GB


Western Digital WD Black 7200RPM 1TB


Intel Optane SSD 800P 118GB


WD Black 1TB 7200RPM + Optane Memory 32GB

Программное обеспечение для кэширования приводит к нестабильной производительности Optane Memory H10. Но общая тенденция заключается в снижении производительности, когда рабочая нагрузка становится все более трудоемкой при записи. Часть QLC без дополнительного кеширования может обеспечить большую скорость во второй половине теста, потому что она довольно эффективна при комбинированой записи.

Заключение

Идея, заложенная в Optane Memory H10, довольно интригующая. QLC NAND нуждается в повышении производительности, чтобы стать конкурентоспособным по сравнению с SSD на основе TLC, а память Intel 3D XPoint по-прежнему является самой быстрой энергонезависимой системой хранения на рынке. К сожалению, слишком много факторов снижают потенциал H10. Это два отдельных твердотельных накопителя на одной карте, поэтому на стороне NAND накопителя по-прежнему требуется некоторое количество оперативной памяти, что увеличивает стоимость. Кэширование полностью управляется программным обеспечением, поэтому контроллер SSD NAND и контроллер Optane не могут согласовывать друг с другом, а программное обеспечение Intel для кеширования иногда изо всех сил пытается одновременно использовать обе части диска.

Некоторые из этих проблем усугубляются условиями тестирования; наш набор тестов был разработан с учетом кэширования записи SLC, но не двухуровневого кэша, который иногда функционирует больше как RAID-0. Ни одному из наших синтетических тестов не удалось запустить агрегирование пропускной способности между частями Optane и NAND H10. Intel предупреждает, что они оптимизировали свои алгоритмы кэширования только для реальных шаблонов хранения, и легко увидеть, как некоторые из наших тестов показывают различия, которые могут быть очень значительными. (В частности, многие наши тесты только дают системе возможность использовать только block-level кэширование, но программное обеспечение Intel также может выполнять кэширование на уровне файлов.) Но это только подчеркивает, что Optane Memory H10 не является универсальным решением для всех систем хранения.

Для тяжелых и наиболее интенсивных рабочих нагрузок размещение небольшого кеша Optane перед QLC NAND только откладывает неизбежное падение производительности. В некоторых случаях попытка сохранить правильные данные в кеше вызывает больше проблем с производительностью, чем приносит пользы. Тем не менее, реальные приложения, которые генерируют такое большое количество операций ввода-вывода, вряд ли будут хорошо работать на 15-ваттном процессоре ноутбука. Добавление кеша Optane не смогло волшебным образом превратить низкоуровневый твердотельный накопитель в чемпиона, и Optane Memory H10, вероятно, никогда не станет хорошим выбором для настольных ПК, которые могут легко вместить более широкий диапазон вариантов хранения, чем тонкий ультрабук.

При меньших нагрузках, которые более типичны для ультрабука, Optane Memory H10, как правило, конкурирует с другими бюджетными NVMe и в хороших условиях может быть более отзывчивым, чем любой флеш-накопитель NAND. Для повседневного использования H10, безусловно, предпочтительнее, чем накопитель только на QLC, но по сравнению с накопителями на основе TLC он выглядит слабовато. У нас не было возможности провести подробные измерения потребляемой мощности Optane Memory H10, но маловероятно, что он сможет обеспечить лучшее время автономной работы, чем топовые твердотельные накопители на основе TLC.

Если Intel серьезно настроена на идею кэширования QLC + Optane, и хочет предоставить серьезного конкурента накопителям TLC, им придется сделать что-то лучшее, чем Optane Memory H10. SSD на TLC почти всегда будут иметь более стабильный профиль производительности, чем многоуровневое устройство. Кэш-память Optane на H10 недостаточно эффективна для хорошей работы при тяжелых рабочих нагрузках, а на небольших нагрузках не может повысить производительность достаточно, чтобы дать H10 заметное преимущество перед лучшими накопителями TLC. В идеальных условиях пик производительности даже чистого QLC выглядит очень быстрым благодаря кешированию SLC. И, очевидно, Intel следует сосредоточиться на улучшении работы в наихудшем сценарии, а не на оптимизации вариантов использования, которые и так кажутся почти мгновенными.

Optane достиг большого успеха в некоторых сегментах рынка хранилищ данных, но на потребительском рынке он все еще ищет подходящую нишу. QLC NAND также все еще относительно молод и непонятен, хотя недавно наконец начало выполняться обещание значительного снижения цен. Комбинация QLC и Optane, возможно, еще способна создать впечатляющий потребительский продукт, но от Intel потребуется больше работы, чем для этого SSD, который выглядит сделанным наспех.

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps до лета бесплатно при оплате на срок от полугода, заказать можно тут.

Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

 
Источник

Читайте также