Несмотря на то, что с течением времени на каждом квадратном миллиметре пластин размещают всё больше и больше дорожек, и на то, что головки чтения-записи каждые несколько лет усложняют, надёжность жёстких дисков постоянно растёт. Так, компания Backblaze, которая занимается хранением данных, подготовила отчёт за второй квартал 2020 года, посвящённый жёстким дискам, которые в ней используются. Как оказалось, годовой уровень отказов дисков, в сравнении с прошлым годом, значительно сократился.
Значит ли это, что HDD со временем становятся надёжнее? Как перспективные технологии магнитной записи, вроде MAMR и HAMR, могут повлиять на показатели надёжности жёстких дисков в ближайшие десятилетия?
Путь от «мега» до «тера»
Первый HDD поступил в продажу в 1950-е годы. Это была модель IBM 350 ёмкостью 3,75 Мб. Устройство было заключено в корпус размером 152x172x74 см, в его состав входило 50 дисков диаметром 24 дюйма (610 мм). Если перенестись в наше время, то окажется, что лучший современный жёсткий диск форм-фактора 3,5 дюйма (размером примерно 14.7×10.2×2.6 см) может хранить до 18 Тб данных с использованием технологии обычной (а не черепичной) записи.
Внутренний механизм жёсткого диска IBM 350
В IBM 350 пластины вращались со скоростью 1200 оборотов в минуту. А в последние десятилетия жёсткие диски развиваются в сторону уменьшения диаметра пластин и увеличения скорости их вращения (типичные значения — 5400-15000 оборотов в минуту). Среди других улучшений можно отметить размещение головок чтения/записи ближе к поверхности пластин.
Устройство для хранения данных IBM 1301 DSU (Disc Storage Unit, дисковое запоминающее устройство) вышло в 1961 году. Это была инновационная разработка, где у каждой пластины была собственная головка чтения/записи. Ещё одним новшеством этой модели было то, что головки парили над поверхностью вращающегося диска под действием аэродинамических сил. Это позволило уменьшить зазор между головками и поверхностью диска.
Через 46 лет разработок IBM, в 2003 году, продала свой HDD-бизнес Hitachi. К тому моменту ёмкость жёстких дисков возросла в 48000 раз, а размеры уменьшились в 29161 раз. Энергопотребление снизилось с более чем 2,3 кВт до примерно 10 Вт (для настольных моделей), а цена за мегабайт упала с $68000 до $0,002. В то же время число пластин уменьшилось с десятков до, максимум, двух.
Увеличение плотности хранения данных
Механические и электронные устройства, а так же компьютеры всегда развивались в сторону миниатюризации. Огромные ламповые или релейные компьютеры 1940-х и 50-х превратились в менее громоздкие транзисторные системы, а потом — в современные миниатюрные чудеса техники, основанные на специализированных интегральных микросхемах. Жёсткие диски прошли похожий путь.
Внутреннее устройство 1-дюймового HDD Seagate MicroDrive
Управляющая электроника жёстких дисков испытала на себе все прелести развития VLSI, в них применялись всё более точные и экономичные сервоприводы. Успехи в сфере материаловедения позволили создавать более лёгкие и гладкие пластины (стеклянные или алюминиевые) с улучшенным магнитным покрытием. Росла плотность записи. Создатели жёстких дисков всё лучше разбирались в особенностях их отдельных элементов (микросхем, припоев, приводов, головок чтения/записи) и революционные улучшения их характеристик происходили не сразу, а постепенно, через небольшие усовершенствования.
Шесть открытых жёстких дисков — от 8-дюймового, до 1-дюймового (источник)
Хотя попытки серьёзной миниатюризации жёстких дисков предпринимались, как минимум, дважды, принимая форму 1,3-дюймового HP Kittyhawk в 1992 и 1-дюймового Microdrive в 1999, рынок, в итоге, сделал свой выбор, остановившись на моделях форм-факторов 3,5 и 2,5 дюйма. Диски в форм-факторе Microdrive рекламировали как альтернативу CompactFlash-картам, основанным на NAND-памяти, называя в качестве их сильных сторон более высокую ёмкость и практически неограниченное количество циклов перезаписи, что делало возможным их использование во встраиваемых системах.
Как и в других подобных случаях, физические ограничения на скорость записи и на время случайного доступа к данным в итоге сделали HDD наиболее желанными гостями там, где самое важное — это возможность дёшево и надёжно хранить большие объёмы информации. Это позволило рынку HDD подстроиться под настольные и серверные системы, а так же под нужды сфер видеонаблюдения и создания резервных копий данных (тут они конкурируют с ленточными накопителями).
Причины сбоев жёстких дисков
Хотя механические части жёстких дисков часто считают их самым слабым местом, причинами сбоев жёстких дисков могут быть далеко не только неисправности этих частей. Среди таких причин можно отметить следующие:
- Человеческий фактор.
- Аппаратные сбои (механические, электронные).
- Повреждение прошивки.
- Факторы окружающей среды (температура, влажность).
- Электропитание.
Жёсткие диски испытывают на устойчивость к ударам с выключенным питанием или во время работы (пластины вращаются, головки чтения/записи не припаркованы). Если диск будет подвергнут воздействию, более интенсивному чем то, на которое он рассчитан, может быть повреждён привод, отвечающий за перемещение головок, головки могут столкнуться с поверхностью пластин диска. Если же диск не будет подвергаться подобным воздействиям, то основной причиной его сбоев, вероятнее всего, будет его естественный износ. Производители жёстких дисков указывают для них показатель средней наработки до отказа (MTBF, Mean Time Before Failure), дающий представление о том, сколько может проработать жёсткий диск в нормальных для него условиях.
Показатель MTBF получают путём экстраполирования данных по износу устройства за определённый период времени. Существуют стандарты, в соответствии с которыми вычисляется этот показатель. MTBF для жёстких дисков обычно находится где-то в диапазоне от 100000 до 1 миллиона часов. Поэтому для того чтобы по-настоящему проверить диск, понадобилось бы наблюдать за ним от 10 до 100 лет. При этом производители, указывая для дисков MTBF, исходят из предположения о том, что диск будет работать в рекомендованных условиях. Именно в таких условиях диски работают в компаниях вроде Backblaze, занимающихся хранением данных.
Очевидно, если подвергнуть жёсткий диск очень сильному воздействию (уронить на каменный пол, например), или если произойдёт серьёзный сбой в источнике питания диска (скажем — скачок напряжения), срок жизни HDD сократится. Менее очевидно то, что на надёжность жёстких дисков могут повлиять дефекты производства, которые бывают далеко не только у жёстких дисков. Именно они являются причиной того, что к большинству продуктов применим такой показатель, как «приемлемый коэффициент отказа».
Дело не в пользователе. Дело — в производственной линии
Жёсткие диски демонстрируют высокие показатели MTBF. Компания Backblaze, что понятно, стремится к тому, чтобы почти 130000 её HDD счастливо «дожили» бы до глубокой старости и спокойно отошли бы в лучший мир (обычно — в установку для дробления металлолома). Но даже такая компания, как Backblaze, сообщает, по состоянию на первый квартал 2020 года, о показателе ежегодной вероятности сбоев (AFR, Annual Failure Rate), равном 1,07%. Это, к счастью для них, самый низкий показатель с тех пор, как они, в 2013 году, начали публиковать подобные отчёты. В первом квартале 2019 года, например, их AFR равнялся 1,56%.
В одном из моих материалов говорилось о том, что при производстве устройств, в состав которых входят интегральные микросхемы, в них могут возникать дефекты, которые показывают себя не сразу, а через некоторое время, в ходе эксплуатации устройств. Со временем такие факторы, как электромиграция, тепловое напряжение, механическое напряжение могут приводить к сбоям в микросхемах. Так, могут быть нарушены проводные соединения в корпусах микросхем, электромиграция может повредить паяные соединения и сами микросхемы (особенно — после воздействия на устройство электростатического разряда).
Механические части жёстких дисков зависят от точности соблюдения технологических допусков и от качества смазки движущихся элементов. Раньше встречалась такая проблема, как залипание блока магнитных головок на поверхности жёсткого диска (stiction). Но со временем улучшились характеристики смазочных материалов и блок головок больше не может покинуть парковочную зону. Эта проблема, в результате, в наши дни более или менее решена.
Но, всё же, на каждом шаге процесса производства есть шанс что-то испортить. Это, в итоге, проявляется в виде чего-то такого, что ухудшает красивые показатели MTBF. Жёсткий диск, который дал сбой, попадает на «тёмную» сторону кривой интенсивности отказов. Эта кривая характеризуется высоким пиком в самом начале, указывающим на отказы, появившиеся вследствие серьёзных производственных дефектов. Потом количество дефектов уменьшается и она, до истечения срока жизни устройства, выглядит достаточно спокойно, после чего снова идёт вверх.
Что дальше?
Пришло время HAMR
Жёсткие диски — такие, какими мы их знаем, являют собой пример конечного результата отработанного до мелочей производственного процесса. Многие проблемы, которые были свойственны этим устройствам в последние пять лет, были или исправлены, или смягчены. Сравнительно заметные изменения в производстве HDD, вроде перехода на производство дисков, заполненных гелием, до сих пор не оказали серьёзного влияния на уровень их отказов. Другие изменения, вроде перехода от технологии перпендикулярной магнитной записи (Perpendicular Magnetic Recording, PMR) к термомагнитной записи (Heat-Assisted Magnetic Recording, HAMR), не должны оказать заметного влияния на срок службы жёстких дисков. И это — при условии, что новые технологии не принесут с собой и новых проблем.
В целом, технологическое будущее HDD выглядит, во всех смыслах, довольно-таки скучным. Они будут представлять собой недорогие хранилища большой ёмкости, которые способны нормально проработать как минимум десяток лет. Базовый принцип создания жёстких дисков, в частности, намагничивание маленьких участков пластин, может развиться до такого уровня, когда роль этих «участков» будут играть отдельные молекулы. А если сюда добавить ещё и что-то вроде HAMR, то окажется, что можно ожидать значительного увеличения срока хранения информации на HDD.
У жёстких дисков есть серьёзное преимущество перед NAND-памятью, в которой используются миниатюрные конденсаторы, хранящие заряды, и где для записи данных используется метод, который физически повреждает эти конденсаторы. Физические ограничения такой памяти гораздо серьёзнее, чем ограничения, применимые к жёстким дискам. Это ведёт к усложнению конструкции памяти, например, к созданию накопителей, основанных на ячейках памяти, способных хранить четыре бита (Quad-Level Cell, QLC). При работе с такими ячейками нужно различать 16 уровней напряжения. Из-за такой сложности QLC-памяти оказалось, что соответствующие твердотельные накопители во многих сценариях лишь немного быстрее жёстких дисков на 5400 оборотов в минуту. Особенно это касается задержек доступа к данным.
Итоги
Первый моим жёстким диском был 20- или 30-мегабайтный Seagate, установленный в IBM PS/2 (386SX). Этот компьютер принёс мне с работы отец. Там переходили на новые PC и, вероятно, хотели освободить склады от старой техники. Во времена MS DOS 20-30 Мб было вполне достаточно и для ОС, и для кучи игр, и для WordPerfect 5.1, да и много для чего ещё. Конечно, такой объём памяти к концу 90-х годов выглядел просто смешно. Тогда, говоря о жёстких дисках, оперировали уже не мегабайтами, а гигабайтами.
Несмотря на то, что с тех пор у меня было много настольных компьютеров и ноутбуков, по иронии судьбы единственным накопителем, который, так сказать, умер у меня на руках, был SSD-диск. Это, а ещё публикации о жёстких дисках, вроде отчётов Backblaze, вселяет в меня сильную уверенность в том, что очень далеки те дни, когда перестанут крутиться пластины последнего HDD. Возможно, этот прогноз изменится лишь тогда, когда что-то наподобие технологии 3D XPoint позволит создавать достаточно большие и доступные накопители. А пока пусть всё идёт своим чередом.
Сталкивались ли вы с отказами жёстких дисков?