Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Witam
Od jakiś 2 miesięcy mam w intranetowej serwerowni HP ProLianta z 2ma dyskami SATA, od HP. Jest tam zimno raczej, okno cały czas otwarte i tylko pare kompów, także nie sądzę, aby temperatura miała tu jakiś wpływ. Niemniej jednak, od jakiegoś czasu logwatch daje mi info o smarcie. Dziś przyszedł bąd Prefailure, no i zaczełem się obawiac o dane. Mam tam radia 1 softwarowego. Obawia mnie głownie to, że te błędy są takie same na obu dyskach, także raid na nic mi się nie zda teraz jeśli pierdzielnie wsio. Co o tym myślicie? Pozatym smart chyba nie obsługuję softwarowego raida coś mi się kojarzy
/dev/sda : Prefailure: Seek_Error_Rate (7) changed to 68, Usage: Airflow_Temperature_Cel (190) changed to 68, 69, Usage: Temperature_Celsius (194) changed to 32, 31, /dev/sdb : Prefailure: Raw_Read_Error_Rate (1) changed to 83, Usage: Airflow_Temperature_Cel (190) changed to 68, 69, 68, 69, Usage: Hardware_ECC_Recovered (195) changed to 28, Usage: Temperature_Celsius (194) changed to 32, 31, 32, 31,
W raidzie nie mam żadnych błędów. Ba, kiedy zrestartowałem smarta,to w logach nie pluje się nic:
Jun 29 10:44:18 hp1 smartd[2890]: smartd received signal 15: Terminated Jun 29 10:44:18 hp1 smartd[2890]: smartd is exiting (exit status 0) Jun 29 10:44:18 hp1 smartd[20297]: smartd version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen Jun 29 10:44:18 hp1 smartd[20297]: Home page is http://smartmontools.sourceforge.net/#012 Jun 29 10:44:18 hp1 smartd[20297]: Opened configuration file /etc/smartd.conf Jun 29 10:44:18 hp1 smartd[20297]: Configuration file /etc/smartd.conf parsed. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, opened Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, not found in smartd database. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, is SMART capable. Adding to "monitor" list. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, opened Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, not found in smartd database. Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, is SMART capable. Adding to "monitor" list. Jun 29 10:44:18 hp1 smartd[20297]: Monitoring 2 ATA and 0 SCSI devices Jun 29 10:44:19 hp1 smartd[20299]: smartd has fork()ed into background mode. New PID=20299. Jun 29 10:44:19 hp1 smartd[20299]: file /var/run/smartd.pid written containing PID 20299
A tutaj smartcrtl:
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 083 064 044 Pre-fail Always - 212055273 3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 52 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 068 060 030 Pre-fail Always - 6790814 9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 1973 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 52 184 Unknown_Attribute 0x0033 100 100 099 Pre-fail Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 068 066 045 Old_age Always - 32 (Lifetime Min/Max 25/33) 194 Temperature_Celsius 0x0022 032 040 000 Old_age Always - 32 (0 20 0 0) 195 Hardware_ECC_Recovered 0x001a 044 036 000 Old_age Always - 212055273 196 Reallocated_Event_Count 0x0033 100 100 036 Pre-fail Always - 0 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
Ostatnio edytowany przez Grzeslaw (2009-06-30 15:06:04)
Offline
Grzeslaw napisał(-a):
Od jakiś 2 miesięcy mam w intranetowej serwerowni [...] Jest tam zimno raczej, okno cały czas otwarte i tylko pare kompów, także nie sądzę, aby temperatura miała tu jakiś wpływ
nie ma to jak profesjonalne chodzenie serwerowni :-D
co do smarta to on obsluguje fizyczne urzadzenie (nie partycje, nie raidy, nie kontrolery, ale fizyczny dysk)
pozatym bledy masz rozne dla poszczegolnych dyskow, a to ze temp. wacha sie pomiedzy 32 a 31 to raczej malo alarmujace (aczkolwiek nie powinna przekroczyc 33)
Offline
Okey thxi, wsio jasne!
Offline
Nie wszystko jest takie jasne:
5 Reallocated_Sector_Ct 0x0033 100 100 036
196 Reallocated_Event_Count 0x0033 100 100 036
36 Bad sectorów realokowanych do zapasowej puli.
Kolejnych do realokowania brak:
197 Current_Pending_Sector 0x0012 100 100 000
ale przyglądaj się czasem paratmetrom 197 to sektory bad przygotowane do realokowania i miej oko na 5 i 196. Jak przekroczy Ci wartość 100 to wyczerpie się pula zapasowych sektorów i dysk zacznie śmiecić bad sectorami na dysku.
Jak to dysk z serwera to powoli szykuj się do jego wymiany. Takiemu typowi co zaczyna bady łapać nie można ufać.
Offline
Zamów sobie Cron'em nocne sprawdzanie SMART'a z porannym raportem na maila :) i bedziesz wiedział gdy padnie.
Offline
ano. ale masakra dyski nowe hp 2miechy moze maja - i co juz zaczynaja swirowac [;
Zresztą co ciekawe, to dzieje sie na zmiane, raz jeden raz dugi raz oba.
A co o raportów to mam je w mailach z logwatcha codzień.
Offline