Главная » Хабрахабр » Естественный износ головок жесткого диска. Обнаружение и оценка

Естественный износ головок жесткого диска. Обнаружение и оценка

Введение

Выход из строя головок жесткого диска – довольно частая проблема, с которой встречаются специалисты по восстановлению данных. Причин выхода головок из строя несколько, наиболее часто встречаются:

  1. Повреждения головок при аварийном завершении работы диска (залипание на поверхности, неправильный заход на парковку и т.п.).
  2. Повреждения головок при физическом воздействии на диск (падение диска, удар по диску, сильные вибрации во время работы и т.п.).
  3. Повреждения головок при электрическом шоке (сгорел блок питания, скачок напряжения в сети электропитания, переполюсовка при подключении питания (не спрашивайте меня как, разъем каким-то образом умудряются другой стороной забить) на накопитель и т.д.).
  4. Заводской брак.
  5. Естественный износ.

В этой статье я хотел бы поговорить о последней причине. Эта причина выхода из строя блока магнитных головок жестких дисков (естественный износ) лично мне кажется наиболее интересной, так как ее довольно сложно диагностировать. Обычно для первых четырех причин все более-менее понятно практически при первом же взгляде на головки, часто – даже без микроскопа. Естественный же износ невооруженным взглядом практически не виден.

Не проще ли, обнаружив, что головки неисправны, просто заменить их и вычитать данные? Для чего это нужно? От того, что именно явилось причиной выхода из строя блока магнитных головок, зависит то, как мы будем подходить к процедурам восстановления доступа к данным. Увы, нет. Поясню на примере.

Нет ли где царапин, сколов? Если головки вышли из строя в результате удара, то прежде, чем устанавливать в диск исправный узел, потребуется детальное исследование магнитных пластин: не пострадали ли они в результате удара? Как следствие – значительно возросший список подготовительных процедур, вплоть до нанесения на повреждения поверхностей специальных химикатов. Не может ли установка нового блока магнитных головок без предварительной подготовки привести к новым повреждениям?

Если головки вышли из строя при неправильной аварийной парковке – то потребуется другое исследование. Другой пример. Соответственно, и порядок работ при восстановлении информации, опять же, будет другим, вплоть до доработки парковочного элемента внутри гермозоны и значительных модификаций микропрограммы накопителя. Потребуется оценить, каким образом повреждены головки, не погнулся ли их слайдер, не привело ли это к потере фрагментов блока внутри гермозоны, и т.п.

Именно поэтому задача определения степени износа блока магнитных головок и видится мне достаточно важной. Ну а если головки вышли из строя в результате естественного износа, то в подавляющем большинстве случаев будет достаточно просто заменить головки и приступить к вычитыванию информации (конечно, при условии, что использованы исправные совместимые запчасти).

Немного теории

Головка жесткого диска – узел, который во время работы накопителя парит над поверхностью диска, используя аэродинамические свойства своего слайдера. Для обеспечения максимальной эффективности аэродинамики поверхность MR-элемента головки выполняется идеально ровной и имеет определенный рисунок из углублений и выпуклостей.

Многие ноутбучные накопители делаются для увеличения энергетической эффективности низкооборотистыми; диски для серверов и высокопроизводительных платформ делаются высокооборотистыми. Скорость вращения шпиндельного двигателя современного жесткого диска может варьировать от 5400 до 15000 оборотов в минуту в зависимости от назначения накопителя. При такой скорости вращения внутри диска образуется мощный воздушный поток, который и используется для аэродинамики головок.

Банальное выветривание, если говорить терминами школьного природоведения. Однако у этого воздушного потока есть и другой эффект – постепенное выбивание из керамических и пластиковых частей блока магнитных головок, находящихся в непосредственном с ним соприкосновении, мелких частиц. Борьба же с микроповреждениями поверхности, которые все-таки произошли, происходит посредством дефект-менеджмента микропрограммы жесткого диска: дефектные сектора заносятся в растущий лист дефектов и переназначаются на исправные сектора из резерва диска. Для того, чтобы эти частицы не повреждали поверхность (хотя, конечно, полностью этого избежать нельзя) в диске устанавливается фильтр-уловитель мелкодисперсной пыли, который находится в таком месте, где он может охватить максимальный объем проходящего воздушного потока.

Естественный износ: как проявляется

Как правило, естественный износ блока магнитных головок начинает проявляться задолго до того, как жесткий диск окончательно выйдет из строя. Не замечают его только те, кто не следит за состоянием своего компьютерного железа в принципе. В жестком диске имеется подсистема SMART, которая накапливает статистику ошибок (переназначенные сектора, неудачные попытки старта, количество попыток переназначить сектор и т.п.), исходя из которой делается примерный прогноз выхода диска из строя. При запуске компьютера подсистема SMART опрашивается, и если все хорошо, то компьютер загружается; если же какой-то из атрибутов SMART «просел» настолько, что вышел за границы нормальности, вы увидите сообщение на втором экране POST BIOS такого типа: Hard Disk Drive XX SMART Status BAD, или похожее по смыслу. Запуск компьютера будет возможен только по нажатию одной из функциональных клавиш (обычно это F1).

В этом случае при запуске машины игнорируются все уведомления, и увидеть, было ли уведомление о плохом SMART-статусе диска при старте, становится невозможно. К сожалению, довольно многие пользователи, имеющие проблемы с первоначальной сборкой компьютера (например, неправильный монтаж CPU FAN), которая приводит к постоянному появлению таких сообщений (что-то типа «CPU FAN speed error») и необходимости нажатия функциональной клавиши для продолжения запуска компьютера, отключают эту функцию в BIOS.

Да и не всегда этот механизм отрабатывает, как показывает практика: довольно часто диски с одним – двумя «просевшими» атрибутами могут не вызывать у Windows никаких подозрений весьма продолжительное время. Правда, операционная система Windows также распознает диски с плохим SMART-статусом, но для фактически уже умирающего диска это может оказаться слишком поздно. Следить за ней можно с помощью массы бесплатных утилит, например – Victoria. Поэтому — смотрите накапливаемую SMART статистику, она полезна.

По истечении определенного времени, когда степень износа достигает определенного, критического, значения, изнашивание переходит из линейного в экспоненциальный рост, и диск переходит в неисправное состояние довольно быстро. Износ диска начинается с момента начала его эксплуатации, но вначале он происходит с низкой интенсивностью.

На финальном этапе износа появляется большое количество дефектных секторов (система дефект-менеджмента уже не может справиться с потоком появляющихся дефектов), серьезные тормоза в работе диска. Основные признаки перехода диска на стадию износа по экспоненте: быстрый рост количества переназначенных секторов в отчете SMART, рост количества ошибок при попытках переназначить сектор, «подтормаживания» диска, появление «тыркающих» звуков при обращении к определенным файлам или папкам. Компьютер перестает загружаться или загружается очень медленно, вы не можете скопировать никакие свои файлы, все жутко тормозит, и, наконец, просто перестает работать. Выход из строя головки (или нескольких головок) по причине износа – апофеоз этого процесса. Головки изношены и больше не могут ничего прочитать. Все.

В этом случае диск отказывается работать (либо не определяется вовсе, либо определяется, но не отдает емкость, либо определяется «заводским» именем, и т.п.). Справедливости ради надо сказать, что у некоторых накопителей активирована система блокировки микропрограммы в случае ее проблем (в том числе – и дефект-менеджмента). Тут только один правильный совет: нести заблокированный диск людям, которые понимают, как вытащить из него данные. Блокировка предотвращает критический износ в случае, если диск подошел непосредственно к этой грани, при условии, что пользователь не будет пытаться «запустить» диск с помощью многократных включений («а вдруг заведется»), танцев с бубном и сомнительных рекомендаций из интернета («на полной луне положите свой диск на системный блок, плюньте три раза в вентилятор процессора и, когда прилетит обратно, произнесите ‘Информация вернись, жесткий диск загрузись’» и тому подобная антинаучная ересь).

Диагностика естественного износа блока магнитных головок с помощью микроскопа

Микроскопирование головок жесткого диска уже давно стало стандартом в индустрии восстановления данных. Обследование головок под микроскопом дает возможность выявить поверхности, на которых имеются серьезные повреждения (пыль на головках, полированная поверхность головки и т.п.), выявить природу происхождения повреждений головок и т.п. Однако общепринятой методики выявления естественного износа головок нет.

Однако при стандартном освещении можно увидеть только крупные изъяны рабочей поверхности MR-элемента; для того, чтобы «проявить» микрорельеф полностью, требуется два источника света: основной, направленный перпендикулярно поверхности, и некое подобие контрового света, направленного под небольшим углом (20 – 30 градусов) к поверхности. С учетом того, что износ головки – это прежде всего выбивание из ее поверхности микрочастиц в результате воздействия сильного тока воздуха (микроповреждения поверхности), вполне логично, что оценить степень износа можно по состоянию ее рельефа. Для усиления «проявления» микрорельефа в качестве основного источника света мы использовали обычный белый свет от кольцевой галогеновой лампы, а в качестве дополнительного («контрового») света использовался светодиод теплого синего свечения.

Установка для исследования, таким образом, состоит из: тринокулярный микроскоп МС-ВП; переходник на байонет Canon EF, камера Canon EOS 5D Mark II, кольцевая лампа Model 2401, источник «контрового» света – штатный осветитель микроскопа с замененным светодиодом.

image
Установка для исследования степени износа блока магнитных головок жесткого диска.

Это и понятно: свет идет сверху вниз под прямым углом, источник света – со всех сторон (кольцевой осветитель); при этом тени практически не отбрасываются. При обычном освещении прямым светом на поверхности MR-элемента заметны только крупные повреждения рельефа. Введение в световую схему «контрового» источника света позволяет увидеть тени от многочисленных микронеровностей поверхности и оценить характер повреждения MR-элемента.

Пример

В качестве примера возьмем два одинаковых достаточно старых накопителя, у которых процесс износа уже идет давно, но один диск находится в критическом («предсмертном») состоянии, а второй в состоянии, когда SMART-статус только начинает предупреждать о возможном скором выходе из строя диска (диск только выходит на экспоненциальный рост износа). Диски Seagate ST3160215AS, семейство Seagate Barracuda 7200.10, емкость 160 Гбайт. В конструкции гермозоны используется 2 головки. Условия съемки одинаковые: ISO 320, выдержка 1/30, F 0 (диафрагма полностью открыта, так как съемка идет через микроскоп).

Диск, SMART которого только начал показывать ошибку, имеет ровный график чтения и менее печальные показатели атрибутов SMART. Диск в «предсмертном состоянии» имеет крайне печальные атрибуты SMART и огромное количество дефектов.

секторов image
График чтения подопытного диска в критическом состоянии износа, первые 3 млн.

image
Атрибуты SMART подопытного диска в критическом состоянии износа

секторов image
График чтения подопытного диска в предкритическом состоянии износа, первые 3 млн.

image
Атрибуты SMART подопытного диска в предкритическом состоянии износа

Поверхность MR-элемента выглядит ровной. Посмотрим на головки сначала при обычном освещении сверху.

image
Общий вид микрорельефа MR-элемента головок диска Seagate ST3160215AS, под прямым источником света

Картинка рельефа преобразилась: там, где у нас при обычном освещении видны углубления, при двойном освещении они выглядят, как выпуклости, а «зернистость» поверхности заметно увеличена. Ну а теперь давайте включим «контровый» свет.

Диск с большей степенью износа обладает относительно более крупной зернистостью и имеет хорошо видимые крупные выбоины на поверхности MR-элемента. У диска с меньшим износом поверхности MR-элемента размер зерна относительно мельче, но самое главное – нет крупных выбоин.

image

image

Разная степень зернистости микрорельефа одного участка поверхности MR-элемента головок накопителей Seagate ST3160215AS c разной степенью износа, масштаб 100%.

image

image
Общи вид микрорельефа поверхности MR-элемента головок накопителей Seagate ST3160215AS c разной степенью износа

Заключение

Использование описанной методики позволяет с высокой степенью достоверности определять головки жесткого диска, вышедшие из строя в результате естественного износа. Мной методика используется для всех дисков, поступающих с диагнозом «неисправный блок магнитных головок», поскольку исследование головок под микроскопом – обязательная часть диагностики. Однако, хочу оговориться: крайне нежелательно в качестве источников основного света использовать точечные лампы, в особенности – яркие светодиоды. Для идеального проявления рельефа поверхности нам требуется равномерное освещение поверхности.


Оставить комментарий

Ваш email нигде не будет показан
Обязательные для заполнения поля помечены *

*

x

Ещё Hi-Tech Интересное!

[Перевод] Python Testing с pytest. Начало работы с pytest, Глава 1

Вернуться Дальше Это уже приносит мне дивиденды в моей компании.Chris ShaverVP of Product, Uprising Technology Я обнаружил, что Python Testing с pytest является чрезвычайно полезным вводным руководством к среде тестирования pytest. 6 и pytest 3. Примеры в этой книге написаны ...

[Перевод] Python Testing с pytest. ГЛАВА 3 pytest Fixtures

Вернуться Дальше Эта книга — недостающая глава, отсутствующая в каждой всеобъемлющей книге Python. Frank RuizPrincipal Site Reliability Engineer, Box, Inc. 6 и pytest 3. Примеры в этой книге написаны с использованием Python 3. pytest 3. 2. 6, 2. 2 поддерживает ...