Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#1  2009-06-29 10:50:11

  Grzeslaw - Użytkownik

Grzeslaw
Użytkownik
Zarejestrowany: 2008-02-12

[SOLVED] Info SMARTa - czy się przejmować?

Witam

Od jakiś 2 miesięcy mam w intranetowej serwerowni HP ProLianta z 2ma dyskami SATA, od HP. Jest tam zimno raczej, okno cały czas otwarte i tylko pare kompów, także nie sądzę, aby temperatura miała tu jakiś wpływ. Niemniej jednak, od jakiegoś czasu logwatch daje mi info o smarcie. Dziś przyszedł bąd Prefailure, no i zaczełem się obawiac o dane. Mam tam radia 1 softwarowego. Obawia mnie głownie to, że te błędy są takie same na obu dyskach, także raid na nic mi się nie zda teraz jeśli pierdzielnie wsio. Co o tym myślicie? Pozatym smart chyba nie obsługuję softwarowego raida coś mi się kojarzy

Kod:

 /dev/sda :
    Prefailure: Seek_Error_Rate (7) changed to 
      68, 
    Usage: Airflow_Temperature_Cel (190) changed to 
      68, 69, 
    Usage: Temperature_Celsius (194) changed to 
      32, 31, 
 
 /dev/sdb :
    Prefailure: Raw_Read_Error_Rate (1) changed to 
      83, 
    Usage: Airflow_Temperature_Cel (190) changed to 
      68, 69, 68, 69, 
    Usage: Hardware_ECC_Recovered (195) changed to 
      28, 
    Usage: Temperature_Celsius (194) changed to 
      32, 31, 32, 31,

W raidzie nie mam żadnych błędów. Ba, kiedy zrestartowałem smarta,to w logach nie pluje się nic:

Kod:

Jun 29 10:44:18 hp1 smartd[2890]: smartd received signal 15: Terminated
Jun 29 10:44:18 hp1 smartd[2890]: smartd is exiting (exit status 0)
Jun 29 10:44:18 hp1 smartd[20297]: smartd version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Jun 29 10:44:18 hp1 smartd[20297]: Home page is http://smartmontools.sourceforge.net/#012
Jun 29 10:44:18 hp1 smartd[20297]: Opened configuration file /etc/smartd.conf
Jun 29 10:44:18 hp1 smartd[20297]: Configuration file /etc/smartd.conf parsed.
Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, opened
Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, not found in smartd database.
Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sda, is SMART capable. Adding to "monitor" list.
Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, opened
Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, not found in smartd database.
Jun 29 10:44:18 hp1 smartd[20297]: Device: /dev/sdb, is SMART capable. Adding to "monitor" list.
Jun 29 10:44:18 hp1 smartd[20297]: Monitoring 2 ATA and 0 SCSI devices
Jun 29 10:44:19 hp1 smartd[20299]: smartd has fork()ed into background mode. New PID=20299.
Jun 29 10:44:19 hp1 smartd[20299]: file /var/run/smartd.pid written containing PID 20299

A tutaj smartcrtl:

Kod:

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   083   064   044    Pre-fail  Always       -       212055273
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       52
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   068   060   030    Pre-fail  Always       -       6790814
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       1973
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       52
184 Unknown_Attribute       0x0033   100   100   099    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       1
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   068   066   045    Old_age   Always       -       32 (Lifetime Min/Max 25/33)
194 Temperature_Celsius     0x0022   032   040   000    Old_age   Always       -       32 (0 20 0 0)
195 Hardware_ECC_Recovered  0x001a   044   036   000    Old_age   Always       -       212055273
196 Reallocated_Event_Count 0x0033   100   100   036    Pre-fail  Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

Ostatnio edytowany przez Grzeslaw (2009-06-30 15:06:04)

Offline

 

#2  2009-06-29 14:03:42

  bercik - Moderator Mamut

bercik
Moderator Mamut
Skąd: Warszawa
Zarejestrowany: 2006-09-23
Serwis

Re: [SOLVED] Info SMARTa - czy się przejmować?

Grzeslaw napisał(-a):

Od jakiś 2 miesięcy mam w intranetowej serwerowni [...] Jest tam zimno raczej, okno cały czas otwarte i tylko pare kompów, także nie sądzę, aby temperatura miała tu jakiś wpływ

nie ma to jak profesjonalne chodzenie serwerowni :-D

co do smarta to on obsluguje fizyczne urzadzenie (nie partycje, nie raidy, nie kontrolery, ale fizyczny dysk)

pozatym bledy masz rozne dla poszczegolnych dyskow, a to ze temp. wacha sie pomiedzy 32 a 31 to raczej malo alarmujace (aczkolwiek nie powinna przekroczyc 33)


"Wszyscy wiedzą, że czegoś zrobić nie można. Ale przypadkowo znajduje się jakiś nieuk, który tego nie wie. I on właśnie robi odkrycie." (A.Einstein)

Offline

 

#3  2009-06-30 15:05:44

  Grzeslaw - Użytkownik

Grzeslaw
Użytkownik
Zarejestrowany: 2008-02-12

Re: [SOLVED] Info SMARTa - czy się przejmować?

Okey thxi, wsio jasne!

Offline

 

#4  2009-07-01 07:47:05

  Mery - Użytkownik

Mery
Użytkownik
Skąd: Bytom
Zarejestrowany: 2008-08-04

Re: [SOLVED] Info SMARTa - czy się przejmować?

Nie wszystko jest takie jasne:

5 Reallocated_Sector_Ct   0x0033   100   100   036
196 Reallocated_Event_Count 0x0033   100   100   036

36 Bad sectorów realokowanych do zapasowej puli.
Kolejnych do realokowania brak:
197 Current_Pending_Sector  0x0012   100   100   000

ale przyglądaj się czasem paratmetrom 197 to sektory bad przygotowane do realokowania i miej oko na 5 i 196. Jak przekroczy Ci wartość 100 to wyczerpie się pula zapasowych sektorów i dysk zacznie śmiecić bad sectorami na dysku.
Jak to dysk z serwera to powoli szykuj się do jego wymiany. Takiemu typowi co zaczyna bady łapać nie można ufać.


Debian Squeeze x64

Offline

 

#5  2009-07-01 09:00:20

  Zbooj - Dark Sith

Zbooj
Dark Sith
Skąd: Siedziba Wszelkiego Zła
Zarejestrowany: 2005-07-28

Re: [SOLVED] Info SMARTa - czy się przejmować?

Zamów sobie Cron'em nocne sprawdzanie SMART'a z porannym raportem na maila :) i bedziesz wiedział gdy padnie.

Offline

 

#6  2009-07-04 07:15:57

  Grzeslaw - Użytkownik

Grzeslaw
Użytkownik
Zarejestrowany: 2008-02-12

Re: [SOLVED] Info SMARTa - czy się przejmować?

ano. ale masakra dyski nowe hp 2miechy moze maja - i co juz zaczynaja swirowac [;
Zresztą co ciekawe, to dzieje sie na zmiane, raz jeden raz dugi raz oba.

A co o raportów to mam je w mailach z logwatcha codzień.

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
Nas ludzie lubią po prostu, a nie klikając w przyciski ;-)