Как проверить смартом sas диск через smartctl?

Привет,
Имеется контроллер lsi logic sas3041e подключенный в пк и к нему подключен SAS диск. Когда пытаюсь проверить диск смартом, то отображается не вся информация, скриншот прилагается. Можно ли сделать так, чтоб выводилась вся информация по смарту диска. Спасибо
- Вопрос задан более двух лет назад
- 799 просмотров
Комментировать
Решения вопроса 0
Ответы на вопрос 1

Проф. восстановление данных ▪ Вопрос? См. профиль
У SCSI и SAS-дисков нет СМАРТ в «классическом» понимании этого слова.
Однако, у СКАЗИ и САС-винчестеров есть свои показатели состояния и отслеживания здоровья. На их основе можно эмулировать привычную таблицу атрибутов.
Утилиты для тестирования HDD SAS
Имею в серверном парке SAS диски Seagate и Hitachi. В боевую они работают через RAID контроллеры Adaptec или LSI.
Бывает такое, что появляется на диске на media error.
Если провести медиа сканирование с помощью, например, Adaptec Storage Manager, то эта media error в свойствах диска исчезает.
В smart-е показывает, что все ок — одной строчкой.
Маловато информации показывает этот софт.
Хотелось бы внимательно посмотреть на smart диска и провести дополнительное сканирование поверхности, перепрошить прошивку
Оставляю один Seagate диск на контроллере LSI 92618i, не конфигурирую его никак.
Seatool for DOS видит other контроллер, из пераметром диска только обьем, на диске можно сделать только диагностическое сканирование.
Seatool for windows видит диск MR9261-81, на диске можно сделать только диагностическое сканирование, прошивка обламывается
Seatool Enterprise не видит контроллер.
Пытался запустить DFT for dos c драйвером LSI 320x — не видит контроллер.
Поделитесь, пожалуйста, рабочими вариантами сочетания ПО и контроллеров.
С уважением,
Александр
Лис Junior member Сообщения: 1 Зарегистрирован: 24 мар 2013, 04:18 Откуда: Красноярск
Re: Утилиты для тестирования HDD SAS
Сообщение Лис » 24 мар 2013, 04:29
HDD Scan 3.3 использую. Попробуй.
shab2 Junior member Сообщения: 7 Зарегистрирован: 24 ноя 2009, 20:59 Откуда: Москва
Re: Утилиты для тестирования HDD SAS
Сообщение shab2 » 25 мар 2013, 10:03
Запустил. Диск видится как LSI. Smart не показывает. Тестирование выполняет.
А как у тебя?
Stranger03 Сотрудник Тринити
Сообщения: 12979 Зарегистрирован: 14 ноя 2003, 16:25 Откуда: СПб, Екатеринбург Контактная информация:
Re: Утилиты для тестирования HDD SAS
Сообщение Stranger03 » 25 мар 2013, 10:21
shab2 писал(а): Запустил. Диск видится как LSI. Smart не показывает. Тестирование выполняет.
А как у тебя?
Здесь принято общаться на вы. Скачайте утилиты тестирования от производителей дисков, подключите их к обычному САС ХБА и протестируйте.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru
shab2 Junior member Сообщения: 7 Зарегистрирован: 24 ноя 2009, 20:59 Откуда: Москва
Re: Утилиты для тестирования HDD SAS
Сообщение shab2 » 25 мар 2013, 11:07
Stranger03 писал(а):
shab2 писал(а): Запустил. Диск видится как LSI. Smart не показывает. Тестирование выполняет.
А как у тебя?
Здесь принято общаться на вы. Скачайте утилиты тестирования от производителей дисков, подключите их к обычному САС ХБА и протестируйте.
Ответ на ты адресовался не Вам. Если Вы модератор, прошу дать ссылку на пункт правил, где запрещается обращение на ты.
По существу темы: Все использованные утилиты упомянуты. Если Вы знаете о других, скажите. Кроме контроллера LSI SAS 9261 использовался LSI SAS 8208XLP. Однако разницы в поведении программ не было. «Взять любой SAS HBA» — это платить деньги. Хотелось бы заранее знать модель с которой утилиты производителей умеют работать.
С уважением, Александр
Stranger03 Сотрудник Тринити
Сообщения: 12979 Зарегистрирован: 14 ноя 2003, 16:25 Откуда: СПб, Екатеринбург Контактная информация:
Re: Утилиты для тестирования HDD SAS
Сообщение Stranger03 » 26 мар 2013, 08:50
«shab2»
Получите предупреждение. За второе нарушение получите бан.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru
shab2 Junior member Сообщения: 7 Зарегистрирован: 24 ноя 2009, 20:59 Откуда: Москва
Re: Утилиты для тестирования HDD SAS
Сообщение shab2 » 26 мар 2013, 10:08
И уберите из подписи — «С уважением»
Helium Junior member Сообщения: 19 Зарегистрирован: 20 янв 2010, 11:25 Откуда: Москва
Re: Утилиты для тестирования HDD SAS
Сообщение Helium » 28 мар 2013, 00:08
Hd sentinel попробуйте.
Она видит смарт дисков (в т.ч. САС), подключенных к hardware контроллерам.
brass Advanced member Сообщения: 201 Зарегистрирован: 29 авг 2007, 11:21 Откуда: Ростов-на-Дону
Re: Утилиты для тестирования HDD SAS
Сообщение brass » 28 мар 2013, 10:02
Helium писал(а): Hd sentinel попробуйте.
Она видит смарт дисков (в т.ч. САС), подключенных к hardware контроллерам.
Не вводите людей в заблуждение, через рейд контроллер ни одна утилита ничего не увидит. imho
Как проверить и чем, уже давно написали, без хост контроллера никак.
Stranger03 Сотрудник Тринити
Сообщения: 12979 Зарегистрирован: 14 ноя 2003, 16:25 Откуда: СПб, Екатеринбург Контактная информация:
Re: Утилиты для тестирования HDD SAS
Сообщение Stranger03 » 28 мар 2013, 10:21
shab2 писал(а): И уберите из подписи — «С уважением»
Бан на 2-е недели за хамство.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru
Umlyaut Advanced member Сообщения: 370 Зарегистрирован: 09 июл 2010, 11:23 Откуда: Москва
Re: Утилиты для тестирования HDD SAS
Сообщение Umlyaut » 31 мар 2013, 16:03
Stranger03 писал(а):
shab2 писал(а): И уберите из подписи — «С уважением»
Бан на 2-е недели за хамство.
Геннадий, а Вы точно не перегибаете палку?
Да, по поводу подписи у shab2 вышло резко, возможно даже неуважительно резко — но всё же до хамства, на мой взгляд, никак не дотягивает (кстати, как давний и регулярный посетитель и участник данного форума я неоднократно замечал за Вами не менее резкие ответы, однако Вас никто не одёргивал и не банил).
Другое дело, что Вы, как мне кажется, вольно или невольно форсировали развитие довольно таки безобидной ситуации, доведя её до модераториала.
Ув.Лис обратился к ув.shab2 на «ты». Ув.shab2 мог проигнорировать (ответив на «Вы»), мог возмутиться (мол, я с Вами , сударь, на брудершафт не пил»). Однако он ответил в том же ключе (на «ты»), не заморачиваясь формой. Ситуация замкнулась «сам на сам».
Вы же не преминули сделать замечание (почему-то топикстартеру, а не первому «тыкнувшему»), притом что никто из них не возражал против такого обращения; ну а кроме того «принято»(на «Вы») <> «обязательно»(на «Вы») — в правилах форума нигде ничего такого действительно не регламентировано.
В этой связи непонятны причины, побудившие Вас сделать ув.shab2 замечание и пригрозить баном — его (развёрнутый) ответ Вам не выходит, как мне кажется, за рамки приличий. Да, без расшаркиваний, но по-большому счёту всё правильно — нет запрета, нет и повода для одёргиваний.
Ув.shab2 мне, конечно, не сват, не брат, однако не хотелось бы создания грустного прецедента типа «попала шлея под мантию» (никогда не знаешь, что и в какой момент придётся Вам не по вкусу).
Плюс к тому подобное реагирование с Вашей стороны может изрядно подпортить Ваше реноме. В конце концов, Ваши ответы по техническим вопросам неплохо характеризуют Вас как специалиста, тогда как подобные эксцессы могут создать о Вас впечатление уже как о человеке — и не самое благоприятное.
Про то, что кто-то может просто не захотеть лишний раз иметь дело с фирмой, сотрудники которой ведут себя как высокомерные снобы и самодуры, уж и упоминать-то неудобно.
С уважением,
Umlyaut.
P.S. Полагаю, просить о пересмотре решения о бане ув.shab2 будет уместно.
Как проверить sas диск
Часто задаваемый вопрос: «есть ли у SAS-дисков SMART и как его посмотреть?»
Да, в некотором виде есть, в виде лог-страниц с различной полезной информацией. В статье будет рассказано о том, как эту информацию получить и интерпретировать.
Хочется подчеркнуть что, речь ниже пойдет не о домашних пользователях, для которых регулярная проверка здоровья и производительности родного железа может быть чем-то вроде хобби. Да и в случае появления признаков неисправности на том же HDD первой мыслью будет не «немедленно списать и заменить», а «сколько он еще протянет и нельзя ли как-нибудь его починить?». Такой подход вполне имеет право на жизнь, ведь ценность «домашних» данных и объем IT-бюджета, как правило, не очень высоки.
Ситуация в корпоративном секторе или в гарантийном отделе поставщика (как раз наш случай) будет немного другой. Хорошему администратору совершенно не должно быть интересно, к примеру, значение SMART-атрибута Seek_Error_Rate на диске. Логика действий проста: получив информацию от RAID-контроллера о проблемах с диском, выкинуть его из массива и запустить ребилд на новый диск (эту процедуру можно и оптимизировать). Подробности сбоя и «нельзя ли как-нибудь его починить?» никого не интересуют — стоимость потери данных и/или возможного простоя просто не позволяют адекватному сотруднику тратить время на подобные вопросы.
И все же дальнейшая судьба сбойнувшего диска — диагностика. В ней может быть заинтересован либо владелец (например, с целью пристроить более-менее живой диск для каких-либо «небоевых» нужд) и, конечно, гарантийный отдел поставщика — при этом диски могут поступать не по 1-2, а десятками. А проверить нужно в ограниченные сроки, т.е. одновременно по нескольку штук, так что времени на последовательную проверку через MHDD, HDDScan, различные утилиты от производителей и format/verify средствами контроллера просто нет.
- Изначально разрабатывался под Linux, но на данный момент портирован на большое количество платформ, включая различные *BSD и Windows. Кстати, для тех, кто предпочитает GUI — под Linux/FreeBSD/Windows есть отличный фронтенд GSmartControl
- Выводит подробную информацию о диске, включая не только SMART-атрибуты (с расшифровкой многих нестандартных атрибутов), но и страницы с логами ошибок.
- Позволяет запускать поддерживаемые современными ATA и SCSI дисками внутренние тесты самодиагностики (short selftest и long selftest).
- Может работать как при прямом подключении диска, так и через различные USB и Firewire конвертеры. Версии под Linux и FreeBSD позволяют «достучаться» до дисков, подключенных к различным RAID контроллерам (3ware, Areca, HighPoint, HP Smart Array, LSI MegaRAID).
- Может выводить в удобочитаемом виде некоторые лог-страницы SCSI-дисков (к которым, естественно, относится и SAS) — что нам и нужно.
- sg_logs — выводит лог-страницы устройства в более подробном виде, чем smartctl. Пример вывода с разъяснениями будет ниже
- sg_format — выполняет форматирование диска. При очень большом желании можно изменить объем и даже размер сектора.
- sg_verify — выполняет недеструктивную проверку выбранных блоков командой SCSI VERIFY.
- sg_reassign — ручной ремап нужных блоков через SCSI-команду REASSIGN BLOCKS с помещением в Grown defect list
- sg_senddiag — отправка команд на запуск встроенных тестов (то же, что и smartctl —selftest для ATA дисков).
Проверяем
Пациент номер один: относительно 300ГБ старый U320-SCSI диск Fujitsu MAW3300NC. Подключаем и определяем, где его искать (через lsscsi или sg_scan). Далее можно посмотреть на вывод smartctl или sg_logs. Начнем со smartctl:
# smartctl -a /dev/sdb
Vendor: FUJITSU Product: MAW3300NC Revision: 0104 User Capacity: 300,000,000,000 bytes [300 GB] Logical block size: 512 bytes Serial number: DA00P8B037VT Device type: disk Transport protocol: Parallel SCSI (SPI-4) Local Time is: Fri Oct 14 16:35:21 2011 MSK Device supports SMART and is Disabled Temperature Warning Disabled or Not Supported SMART Health Status: FIRMWARE IMPENDING FAILURE TOO MANY BLOCK REASSIGNS [asc=5d, ascq=64] Current Drive Temperature: 26 C Drive Trip Temperature: 65 C Manufactured in week 45 of year 2008 Specified cycle count over device lifetime: 10000 Accumulated start-stop cycles: 8 Elements in grown defect list: 8191 Error counter log: Errors Corrected by Total Correction Gigabytes Total ECC rereads/ errors algorithm processed uncorrected fast | delayed rewrites corrected invocations [10^9 bytes] errors read: 0 39965378 3599 0 0 345061.500 3599 write: 0 9 0 0 0 45798.649 0 verify: 0 210 1 0 0 0.026 1 Non-medium error count: 25 No self-tests have been logged Long (extended) Self Test duration: 6325 seconds [105.4 minutes]
Примерно тоже можно было бы получить, запустив sg_logs -a, для SAS дисков — с добавкой в виде страницы Protocol Specific port log page for SAS SSP, где перечислены оба phy SAS диска (если он 2-портовыйСразу в глаза бросаются огромное количество ошибок чтения, большое кол-во ремапов (Elements in grown defect list) и предупреждение «SMART Health Status: FIRMWARE IMPENDING FAILURE TOO MANY BLOCK REASSIGNS [asc=5d, ascq=64]«. Последнее хранится на странице Informational exceptions в логах диска и говорит нам о том, что дальше его можно и не тестировать: алгоритм, заложенный в firmware уже сделал вывод о предсмертном состоянии диска по большому количеству ремапов.
Отличное от нуля значение счетчика Non-medium error count не всегда указывает на проблемы с диском. Было несколько случаев с SAS-дисками и контроллером Adaptec, когда причиной был некачественный noname кабель.
Можно еще немного помучить диск, запустив самодиагностику, например «длинный» фоновый тест:
# sg_senddiag —selftest=2 /dev/sdb
Тест прерывается с ошибкой о найденных бэдах, о чем можно узнать, запустив
# sg_logs -a /dev/sdb
и посмотрев на соответствующую страницу:
Self-test results page Parameter code = 1, accumulated power-on hours = 20912 self-test code: background extended [2] self-test result: another segment in self test failed [7] self-test number = 3 sense key = 0x6, asc = 0x5d, asq = 0x64
Собственно, при помощи smartctl со SCSI/SAS дисками можно сделать то же, что при запуске sg_logs и sg_senddiag — посмотреть логи и запустить self-test’ы.
Следующий шаг — форматирование. Запускаем
# sg_format —format /dev/sdb
и ждем окончания. Собственно форматированием занимается firmware диска, для SCSI/SAS данная процедура является самым верным способом заставить диск заремапить все сбойные сектора. Именно ту же процедуру выполняет, например, контроллер Adaptec при выборе в меню пункта «Format disk», только в данном случае мы имеем информацию о ходе выполнения и, что самое важное — возможность форматировать несколько дисков. Многие современные диски SAS (например, Hitachi) понимают некоторые SCSI команды и могут работать с утилитами sg_format и sg_verify, только вот ручной ремап через sg_reassign не воспринимают (его можно сделать при помощи hdparm).
В данном случае форматирование завершилось успешно (сообщение FORMAT COMPLETE после 99%), смотрим в логи и видим, что счетчик Elements in grown defect list уменьшился до 166 (просто данные о ремапах были перенесены в p-list). Нужен еще один тест поверхности. Вместо selftest’а можно попробовать что-нибудь наглядное, например badblocks в деструктивном режиме:
# badblocks -svw /dev/sdb
При запуске с этими ключами badblocks совершит 4 пары проходов по диску, записывая и считывая различные паттерны. Занимает очень много времени (5,5 часов для этого диска и почти двое суток для 2ТБ диска).
Итак — 13 бэдов, снова смотрим в логи, видим растущее количество ремапов ошибок чтения. Для очистки совести можно запустить еще раз badblocks или внутренний тест и убедиться в том, что диск по-прежнему находится в совершенно плачевном состоянии. Можно его остановить перед отключением командой
Интерпретация результатов б/у SAS дисков
Так как информации по этим дискам через стандартный SMART очень мало, решил воспользоваться программой R.tester. Видно что программа может очень много, но страшно запускать то, что не понимаешь. Скажу сразу, что на дисках пока нет информации, поэтому могу запускать и те тесты, которые могут разрушать данные (если такие будут необходимы)
Выкладываю SMART, который получил при помощи R.tester и дампы.
Буду очень благодарен, если поможете в интерпретации.
линк на скачивание дампов (диска 2, дампа 4, потому что сделаны из разных мест программы, не знаю сильно ли они отличаются):
[url=https://app.box.com/s/w0quukpph8ha1syu4u3kz68b0aq4nsi9]https://app.box.com/s/w0quukpph8ha1syu4u3kz68b0aq4nsi9[/url]
Поправьте если не прав. Диски явно были откуда-то переставлены, не стояли они вместе в RAID. Разное количество циклов. Разное количество записаных данных. Но важно не это. Мне нужно понять можно ли эти диски использовать или они скоро посыпятся? Стоит ли их объединять в MIRROR или «не да бог» 🙂 в STRIPE. Или лучше по отдельности. Или в ведро?
0 G-LIST — это видимо хорошо. С ошибками записи мне менее понятно.
================================
; Model: WD WD6001BKHG-50D22
; Serial: WXU1E83NFCK9
; Firmware: SFX9
;
0 G-LIST Number of reallocated sectors (pCHS) ** GROWN **
1930 P-LIST Number of Primary defects (pCHS) ** FACTORY **
00-00 PFA Status: ** GOOD **
35’C T Current Temperature
35’C T Current Temperature
69’C T Reference Temperature
213 CSS Accumulated Start/Stop Cycles
453127 WRITE Error Corrected Without Substantial Delay
842 WRITE Error Corrected With Possible Delays
844 WRITE Total Error Corrected With Retries
453969 WRITE Total Error Corrected
842 WRITE Total Times Correction Algorithm Processed
24373917970432 WRITE Total Bytes Processed ( 22.17 Tb )
0 WRITE Total Uncorrected Errors
14695 READ Error Corrected Without Substantial Delay
26 READ Error Corrected With Possible Delays
57 READ Total Error Corrected With Retries
14721 READ Total Error Corrected
26 READ Total Times Correction Algorithm Processed
7845358983168 READ Total Bytes Processed ( 7.14 Tb )
0 READ Total Uncorrected Errors
0 VERIFY Error Corrected Without Substantial Delay
0 VERIFY Error Corrected With Possible Delays
0 VERIFY Total Error Corrected With Retries
0 VERIFY Total Error Corrected
0 VERIFY Total Times Correction Algorithm Processed
0 VERIFY Total Bytes Processed
0 VERIFY Total Uncorrected Errors
287616 — Recoverable Non-Medium Error Events
===========
; Model: SEAGATE ST600MM0006
; Serial: S0M1C2LJ
; Firmware: 6102
;
0 G-LIST Number of reallocated sectors (pCHS) ** GROWN **
1408 P-LIST Number of Primary defects (pCHS) ** FACTORY **
00-00 PFA Status: ** GOOD **
35’C T Current Temperature
68’C T Reference Temperature
225d 17h POH Power-On Time (325042 minutes)
35’C T Current Temperature
68’C T Reference Temperature
702 CSS Accumulated Start/Stop Cycles
0 WRITE Error Corrected With Possible Delays
0 WRITE Total Error Corrected With Retries
0 WRITE Total Error Corrected
0 WRITE Total Times Correction Algorithm Processed
3308097849856 WRITE Total Bytes Processed ( 3.01 Tb )
0 WRITE Total Uncorrected Errors
2079063422 READ Error Corrected Without Substantial Delay
0 READ Error Corrected With Possible Delays
0 READ Total Error Corrected With Retries
2079063422 READ Total Error Corrected
0 READ Total Times Correction Algorithm Processed
2018569198080 READ Total Bytes Processed ( 1.84 Tb )
0 READ Total Uncorrected Errors
0 VERIFY Error Corrected Without Substantial Delay
0 VERIFY Error Corrected With Possible Delays
0 VERIFY Total Error Corrected With Retries
0 VERIFY Total Error Corrected
0 VERIFY Total Times Correction Algorithm Processed
0 VERIFY Total Bytes Processed
0 VERIFY Total Uncorrected Errors
2228 — Recoverable Non-Medium Error Events