Почему HDD стали реже выходить из строя

Почему HDD стали реже выходить из строя

Поломки жёстких дисков — одна из главных причин простоя серверов в дата-центрах. Но в последнее время число отказов HDD сокращается. Расскажем, почему так происходит.


Немного ретроспективы

Двадцать лет назад жесткий диск был одним из «слабых мест» компьютера или сервера. Известна история с накопителями IBM Deskstar, которые выходили из строя даже после непродолжительного использования. Эти диски считаются одними из самых ненадежных коммерческих HDD, за что получили нарицательное прозвище Deathstar («Звезда смерти»).

Ситуация с Deskstar отбросила длинную тень на индустрию жестких дисков. Многие производители начали добровольно занижать гарантийные сроки на свои устройства. В ряде случаев они сократились с трех до одного года. Но со временем появлялись новые технологии, повышающие надежность HDD. Согласно исследованию одного из крупных западных облачных провайдеров в 2018 году процент отказов (AFR) жестких дисков в его ЦОД составил 1,25%. Для сравнения: в 2016-м и 2017-м значение AFR равнялось 1,95% и 1,77% соответственно.

Сокращение числа поломок HDD эксперты ИТ-индустрии связывают с развитием технологий как в самих накопителях, так и в дата-центрах. Рассмотрим некоторые из этих решений.


Гелиевые камеры

Некоторые современные HDD производители заполняют гелием. Плотность гелия в семь раз ниже плотности воздуха. Эта особенность уменьшает силу трения, действующую на движущиеся компоненты, и снижает силу газовых потоков, которая влияет на точность позиционирования считывающих головок. Дополнительно технология устраняет риск коррозии элементов HDD, потому что гелиевая среда не содержит водяного пара. Все это увеличивает расчётный цикл жизни жестких дисков.

Согласно исследованию HGST, проведённому несколько лет назад и основанному на статистике компаний Netflix, Huawei и HP, срок службы гелиевых дисков в два раза превышает срок службы классических HDD. По этой причине продажи гелиевых дисков растут год от года, а сами устройства все чаще используются в дата-центрах облачных провайдеров.


Улучшение условий в ЦОД

Еще одной причиной повышения надежности HDD эксперты индустрии называют улучшение условий в дата-центрах. Срок службы жестких дисков напрямую связан с окружающей их температурой. В Seagate отмечают, что оптимальной будет температура в 30°C. Если она будет выше 50°C или ниже 5°C, то количество отказов значительно вырастет.

Поэтому ИТ-компании разрабатывают новые решения для кондиционирования, которые бы поддерживали оптимальную температуру в серверной. Например, в Facebook представили технологию испарительного охлаждения для ЦОД. Вода для системы охлаждается в специальном теплообменнике, испаряясь через особый мембранный слой. Затем эта жидкость используется для снижения температуры воздуха в машинном зале.

Помимо новых систем охлаждения, разрабатываются и решения для управления ими. В частности, на базе машинного обучения. Такие системы используют датчики, собирающие данные о температуре за пределами дата-центра и внутри него. Эта информация затем используется управляющим модулем для настройки вентиляции — он регулирует температуру, забирая больше или меньше воздуха с улицы.


Развитие «внутренних» технологий HDD

На количество отказов HDD также влияет влажность воздуха. Она определяет то, на какой высоте от диска может безопасно находиться считывающая головка, чтобы не повредить магнитную поверхность. Для решения этой проблемы производители дисков внедряют технологии, конфигурирующие движение блока головок в зависимости от условий работы.

Примером такой технологии могут быть RV-сенсоры, или датчики вращательной вибрации. Используя их показания встроенный управляющий модуль меняет характер движения блока головок, специальным образом перераспределяя вибрацию на корпус устройства. Часто RV-сенсоры встречаются в накопителях, предназначенных для работы в дисковых массивах, от компаний Seagate, Toshiba и Western Digital.


О надежности альтернативных накопителей

Главным конкурентом жестких дисков, в том числе в дата-центрах, сегодня являются SSD. По статистике количество отказов твердотельных накопителей меньше, чем у HDD. Однако с возрастом у «твердотельников» число ошибок при чтении растёт вдвое быстрее. Для решения этой проблемы производители SSD развивают методы коррекции ошибок, которые должны повысить надёжность и срок службы устройств.

Один из таких способов — SSD refres. Если к отдельным ячейкам накопителя долгое время не происходит обращений, они начинают терять заряд. Это может привести к утере части данных. Поэтому контроллер накопителя время от времени считывает информацию в неиспользуемых ячейках, оценивает их текущее состояние и «дозаряжает» их.

Ещё одна технология, которая продолжает использоваться в дата-центрах — это магнитная лента. В отчёте Data Storage Trends за 2018 год лента стала четвертым по популярности хранилищем после HDD, SDD и облака (речь идет о различных вариантах хранения данных компаний, не методах хранения как таковых). Магнитные ленты используют в основном благодаря их надежности: ошибки на этом накопителе возникают на четыре–пять порядков реже, чем в HDD.

При этом сегодня по-прежнему разрабатываются новые технологии для продления срока жизни плёнки. В 2017 году IBM и Sony создали магнитную ленту, которую для защиты снабдили дополнительным «смазочным» слоем. Этот слой снижает риск повреждения ленты при её движении на скорости 10 метров в секунду.

Существуют и другие экспериментальные технологии хранения, надежность которых, в теории, способна значительно превысить показатели классических накопителей. Например, большой потенциал в качестве долговечного носителя в ИТ-сообществе пророчат молекулам ДНК.

Создатели ДНК-хранилищ планируют запечатать молекулы в стеклянные капсулы, где они будут изолированы от губительных условий окружающей среды. Это позволит хранить закодированные в них цифровые данные на протяжении тысяч лет без ошибок. Такой носитель информации может стать реальностью уже в ближайшие годы: внедрить ДНК-хранилище в одном из своих ЦОД планировала компания Microsoft.

Но подобные решения пока является экспериментальными и не рассчитаны на широкое использование. Поэтому пока одними из наиболее популярных способов хранения информации в дата-центрах останутся жёсткие диски. А учитывая тот факт, что их надежность растет, HDD останутся с нами еще надолго.

132
RSS
Нет комментариев. Ваш будет первым!
Загрузка...