Что такое плохие сектора и как их исправить? [Часть 2]

Часть 1 этой статьи

рассмотрел аппаратное обеспечение накопителя и то, как контроллер работает за кулисами для обнаружения и устранения проблем с неисправными секторами, которые он обнаруживает при нормальной работе.

В этом заключении к этому обсуждению мы рассмотрим инструменты, доступные в операционной системе, производителях накопителей и других сторонних организациях, которые вы можете использовать для управления и мониторинга накопителей, чтобы поддерживать их как можно более здоровыми.

отказ: Перед выполнением любой из команд в этой статье убедитесь, что у вас есть хорошая резервная копия диска

попытки восстановления поврежденных секторов могут привести к повреждению файловой системы. Это означает, что можно потерять части файлов данных или метаданных, которые используются для поиска файлов и каталогов на томе. Инструменты производителя и сторонних производителей могут быть столь же катастрофическими, как и утилиты операционной системы. Это особенно важно для тех утилит, которые обходят защиту операционной системы и имеют прямой доступ к диску, который именно так что делают многие из этих инструментов.

Сканирование диска на наличие поврежденных секторов

Каждая операционная система имеет инструменты для сканирования диска на наличие поврежденных секторов. Некоторые из них автоматически вызываются во время запуска, если компьютер обнаруживает неправильное завершение работы. Например, Windows поддерживает «грязный бит» в основной таблице файлов (MFT) на томах NTFS или в таблице размещения файлов (FAT) на дисках FAT16 / 32.

Во время загрузки программа autochk ищет это значение и, если оно задано, запускает сокращенную версию действий, выполняемых chkdsk на всех помеченных томах. Аналогичный процесс используется другими современными операционными системами.

Windows

Для тех, кто не боится командной строки Windows, CHKDSK

или же чкдск / б может быть запущен в любое время для поиска поврежденных секторов. Сначала он выполнит другие тесты, чтобы проверить согласованность метаданных накопителя, прежде чем пройти необязательный сбойный сектор. В зависимости от размера рассматриваемого тома и количества каталогов и файлов, это может занять некоторое время. Разница между этими двумя командами заключается в том, что вторая будет переоценивать сектора, которые уже помечены операционной системой как плохие.

В Windows также есть инструмент с графическим интерфейсом, который можно использовать для выполнения тех же проверок. Доступ к нему можно получить, открыв Проводник Windows> щелкните правой кнопкой мыши диск, чтобы проверить> Свойства> Вкладка «Инструменты»> Проверить сейчас… > установите флажок «Сканировать и попытаться восстановить поврежденные сектора»> Пуск.

окна диска проверка

Независимо от того, какой из них вы выберете, если вы сканируете системный или загрузочный диск, ему потребуется эксклюзивный доступ к тому и спросите вас, хотите ли вы запланировать сканирование на следующий перезапуск. Если это не системный диск, сканирование должно начаться немедленно, если другой процесс уже не заблокировал его для монопольного доступа.

Этот инструмент не помечает отдельные сектора как плохие; он помечает весь кластер как неисправный в MFT или FAT и перемещает весь кластер в другой неиспользуемый кластер на диске. Это может произойти, если аппаратное обеспечение диска не может переназначить поврежденный сектор по любой причине, например, из-за того, что его резервный сектор был исчерпан.

Linux

Хотя программа badblocks может использоваться для поиска поврежденных блоков (секторов) в разделе диска в системах Linux, я рекомендую вам использовать e2fsck -c вместо или соответствующий Fsck вариант для файловой системы, которую вы используете. Это гарантирует, что правильные параметры передаются в программу badblocks.

Неправильные параметры могут нанести непоправимый ущерб файловой системе. Параметр выполняет тест только для чтения на томе. Если вы хотите использовать неразрушающий тест чтения-записи, вам нужно указать -куб.см параметр вместо.

e2fsck-полной

Когда используешь или же -куб.см, весь список плохих блоков перестраивается. Если вы хотите сохранить существующие записи в списке и просто добавить новые блоки в список, добавьте (сохранить) вариант. Если вы подозреваете, что был поврежден сам диск и / или файловая система, вы также можете добавить -п (preen) опция, которая будет пытаться автоматически восстановить любой ущерб. Он уведомит вас, если не сможет исправить найденные ошибки.

Инструменты производителя

Производители приводов имеют собственное диагностическое программное обеспечение, которое может использоваться для анализа поверхности и управления функциями, специфичными для их приводов. Western Digital имеет Data Lifeguard для Windows для своих дисков, в то время как Seagate имеет SeaTools для Windows, которую можно использовать для тестирования дисков Seagate, Maxtor и Samsung.

Оба предлагают варианты для тестирования и ремонта связанных дисков, но вы должны быть осторожны с тем, какие тесты являются разрушительными, а какие — неразрушающими. В любом случае у вас должна быть текущая резервная копия

прежде чем продолжить.

данные спасатель

Сторонние инструменты

Существуют также сторонние инструменты, такие как SpinRite от Gibson Research Corporation, которые обращаются к диску ниже уровня операционной системы, чтобы выполнить свою магию. Он обходит BIOS и напрямую взаимодействует с контроллером жесткого диска. Он предназначен главным образом для восстановления данных, но также может использоваться для анализа поверхности и проверки перед вводом в эксплуатацию нового диска.

SpinRite имеет свои ограничения. Поскольку он работает в операционной системе FreeDOS и использует CHS для доступа к диску, он может получить доступ только к первым 228 (268 435 456) секторам. Таким образом, диск, который использует 512-байтовые сектора, будет ограничен 128 ГБ, а диск, использующий 4K-сектора, будет ограничен 1 ТБ.

Установив его на загрузочный диск с помощью интерпретатора команд Windows 98 DOS 7, SpinRite 6 может теоретически протестировать весь диск.

Исправлены ли плохие сектора?

Физические дефекты производства, поломки головок и большинство других неисправностей, обнаруженных контроллером жесткого диска, как правило, не могут быть устранены. Те, которые были изолированы операционной системой, — другая история.

жесткий диск-ремонт

Инструменты операционной системы

Иногда возможно восстановить блоки или кластеры, которые были помечены как плохие операционной системой. Так как кластер обычно состоит из нескольких секторов, а один плохой сектор получает весь кластер, помеченный как плохой, иногда можно восстановить эти кластеры.

Это связано с тем, что контроллер жесткого диска, возможно, не имел дело с неисправным сектором до того, как с ним столкнулась операционная система. Помните, что накопитель, как правило, не знает, что что-то не так, пока не может прочитать сектор, и он не пытается переназначить сектор, если нет многочисленных неудачных чтений или попытки записи в этот сектор после неудачного чтения.

Если контроллер жесткого диска перераспределил поврежденный сектор после того, как операционная система пометила содержащий кластер как неисправный, повторно выполните соответствующую команду для повторной оценки поврежденных блоков (чкдск / б для Windows, e2fsck -cc для Linux — вы не должны использовать Опция здесь, так как он будет хранить текущий список плохих блоков) должен удалить его из списка.

SpinRite

SpinRite — один из инструментов, который утверждает, что способен восстанавливать слабые сектора. Даже после трех десятилетий работы с технологиями я не хочу доверять. Сектор был изначально помечен как неисправный контроллером накопителя (или содержащий кластер был помечен операционной системой), поскольку данные не могли быть надежно прочитаны с него. Даже если его способность сохранять данные может быть улучшена, это, вероятно, будет временным, что должно напомнить пару вопросов.

  1. Насколько временен этот ремонт?
  2. Готовы ли вы доверить свои данные этому сектору?

Лично это одна из областей, где я не хочу идти. Большая часть моих данных слишком важна.

Мониторинг статуса привода

Один из двух лучших способов защитить данные, которые вы сохранили на своих дисках, — если вы не обнаружили их в предыдущих комментариях, — это убедиться, что вы реализовали надежный план резервного копирования.

Другой использует программное обеспечение для мониторинга состояния ваших дисков. Современные жесткие диски включают в себя технологию самоконтроля, анализа и отчетности (

УМНЫЙ)

помочь определить работоспособность накопителя и предсказать сбои.

Ubuntu, RedHat и их производные имеют утилиту Disks как часть их установки по умолчанию. Это позволяет получить доступ к наиболее важным счетчикам SMART, а также запустить как короткие, так и расширенные SMART-тесты. Есть также инструменты командной строки, такие как smartctl

который может быть использован для автоматизации проверки и отчетности о состоянии диска.

Windows не предоставляет эту возможность, поэтому нам нужны сторонние инструменты, такие как CrystalDiskInfo

и жесткий диск Sentinel

справиться с работой.

СМАРТ Счетчики

Не волнуйтесь, когда увидите значения, о которых сообщают эти инструменты. Пороговое значение устанавливается производителем, чтобы указать, когда оно будет считаться проблемой. Текущее нормализованное значение, вероятно, будет выше чем худшее сообщаемое значение, и для большинства счетчиков это ожидается. Нормализованные значения в диапазоне от 1 до 253, хотя некоторые производители выбирают начальную точку 100 или 200 для некоторых атрибутов, уменьшаются с более высокой начальной точки с течением времени, и это не обязательно проблема, пока она не опустится ниже порогового значения.

HDD-сторожевой-неудача привод

Независимо от того, какой инструмент вы выберете для мониторинга своих устройств хранения данных, существует краткий список счетчиков, которые вам следует учитывать, если ваш накопитель поддерживает их:

  • Счетчик 5 (Количество перераспределенных секторов) — это общее количество секторов, которые были перераспределены и помещены в G-LIST с момента его ввода в эксплуатацию. Это не включает сектора, которые были отмечены на заводе. Необработанные данные — это истинный счет, поэтому чем ниже, тем лучше
  • Счетчик 10 (счетчик повторных попыток) указывает, сколько раз диск должен был попытаться раскрутить диск, пока он не достиг рабочей скорости, если первая попытка была неудачной. Увеличение этого атрибута указывает на механические проблемы с приводом или возможные проблемы с питанием.
  • Счетчик 187 (сообщается о неисправимых ошибках) количество ошибок ECC, которые не могут быть исправлены контроллером привода. Чем ниже, тем лучше, если смотреть на необработанное значение.
  • Счетчик 188 (Тайм-аут команды) количество прерванных операций на устройстве. Обычно это происходит из-за проблем с питанием или проблемами с кабелем передачи данных. Опять же, значение необработанных данных должно быть низким.
  • Счетчик 195 (аппаратный ECC восстановлен) является специфичной для поставщика реализацией, поэтому значения могут не всегда представлять идентичные условия. Обычно это количество попыток исправления ECC для возврата правильных данных с привода.
  • Счетчик 196 (количество событий перераспределения) представляет количество раз, когда секторы инициировали событие переотображения контроллером. Он учитывает как успешные, так и неудачные попытки переназначения секторов. Это поддерживается не всеми производителями.
  • Счетчик 197 (текущий сектор, ожидающий подсчета) это число секторов, которые в данный момент помечены как нестабильные и будут переназначены, если следующая попытка чтения будет успешной или когда будет записана следующая запись. Этот счетчик уменьшается, как только сектор был успешно переназначен.
  • Счетчик 198 (не корректируемый счетчик секторов в автономном режиме) общее количество ошибок при чтении или записи секторов. Если это начинает расти, возникает проблема с поверхностью диска или механической подсистемой.

Сами по себе многие из имеющихся счетчиков не дают большого представления об общем состоянии ваших дисков. Но когда они собраны вместе, уделяя особое внимание перечисленным выше, вы, скорее всего, заметите негативные тенденции, чтобы подготовиться к неизбежной кончине привода.

Заключение

Несмотря на то, что существуют инструменты, помогающие предсказать, сколько времени может остаться на ваших устройствах хранения данных, это не устраняет необходимость в надежном, проверенном плане резервного копирования. Существует доказательство того, что большое количество дисков выйдет из строя без единой ошибки SMART, появляющейся во всей его истории. В том же отчете также показана высокая корреляция между некоторыми из перечисленных выше ошибок SMART и чрезвычайно сокращенным сроком службы устройства.

Например, поврежденные сектора, указанные на изображении выше, принадлежат жесткому диску Sentinal Pro, который, по оценкам, имеет оставшийся 21 день жизни. Два месяца назад он сообщал о 30 днях, и я все еще жду, чтобы узнать, как долго он продлится, прежде чем попадет в рай для данных. Таким образом, он показывает, что прогнозный анализ, хотя и указывает на то, что данные находятся в опасности, все еще не может точно дать надежное представление о сколько времени это осталось.

Несмотря на то, что количество поврежденных секторов не увеличивалось в течение нескольких месяцев, и использование регенератора жесткого диска на диске, чтобы посмотреть, сможет ли он восстановить эти 77 поврежденных секторов, не помогло, общее состояние здоровья все еще несколько снизилось. Будет интересно посмотреть, как долго он выживет.

Мне интересно услышать, был ли у кого-то еще подобный опыт использования инструментов мониторинга SMART? Успешно ли вы сохранили свои данные от катастрофы, используя их? Разве они не работают на вас вообще? Как насчет инструментов для восстановления поврежденных секторов, таких как SpinRite или HDD Regenerator? Позвольте мне знать в комментариях ниже!

Ссылка на основную публикацию
Adblock
detector