Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#1  2012-04-06 08:41:35

  Grzeslaw - Użytkownik

Grzeslaw
Użytkownik
Zarejestrowany: 2008-02-12

Sprawdzanie poprawności pracy dysków (SAS) i RAID'a na serwerku DELL'a

Witam,

Mam serwerek Dell PowerEdge 1950, w środku 2 dyski SAS 146GB..
Raida robiłem za pomocą PERC 6/i Integrated BIOS Configuration Utiity...
Ostatnio przy serwerku było słychać nierówną pracę dysków, i zaczełęm się zastanawiać, co może być przyczyną, bo to niezbyt fajne..

Jak sprawdzić, czy dyski SAS są ok? SATOWE dyski sprawdzałęm smartem, z pakietu smartmontools i w razie czego informował mnie mailem o nieprawidłowościach.. Jak to jest z dyskami SAS? Poniżej wynik smarta dla obu dysków:


Kod:

(root@0151 ~)# smartctl -a -d megaraid,1 /dev/sda
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

Device: FUJITSU  MAX3147RC        Version: D207
Serial number: DQ03P7A0CRVR
Device type: disk
Transport protocol: SAS
Local Time is: Fri Apr  6 08:38:59 2012 CEST
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: OK

Current Drive Temperature:     22 C
Drive Trip Temperature:        65 C
Manufactured in week 41 of year 2007
Specified cycle count over device lifetime:  10000
Accumulated start-stop cycles:  19
Elements in grown defect list: 0

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0     1249         0         0          0      70291.224           0
write:         0        1         0         0          0       5941.395           0
verify:        0      341         0         0          0      27896.464           0

Non-medium error count:       13

SMART Self-test log
Num  Test              Status                 segment  LifeTime  LBA_first_err [SK ASC ASQ]
     Description                              number   (hours)
# 1  Background long   Completed                   -       0                 - [-   -    -]
# 2  Background short  Completed                   -       0                 - [-   -    -]

Long (extended) Self Test duration: 1793 seconds [29.9 minutes]
(root@0151 ~)# smartctl -a -d megaraid,0 /dev/sda
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

Device: FUJITSU  MAX3147RC        Version: D207
Serial number: DQ03P7A0CRNE
Device type: disk
Transport protocol: SAS
Local Time is: Fri Apr  6 08:39:07 2012 CEST
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: OK

Current Drive Temperature:     18 C
Drive Trip Temperature:        65 C
Manufactured in week 41 of year 2007
Specified cycle count over device lifetime:  10000
Accumulated start-stop cycles:  19
Elements in grown defect list: 0

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0      218         0         0          0      68421.273           0
write:         0        6         0         0          0       5795.461           0
verify:        0       59         0         0          0      27896.463           0

Non-medium error count:       11

SMART Self-test log
Num  Test              Status                 segment  LifeTime  LBA_first_err [SK ASC ASQ]
     Description                              number   (hours)
# 1  Background short  Completed                   -   27208                 - [-   -    -]
# 2  Background long   Completed                   -       0                 - [-   -    -]
# 3  Background short  Completed                   -       0                 - [-   -    -]

Long (extended) Self Test duration: 1793 seconds [29.9 minutes]

Jak sprawdzić, czy RAID mirroruje się dobrze (w moim przypadku to akurat RAID1) najlepiej bez restartu serwera?

Z góry dzięki za odp.

Ostatnio edytowany przez Grzeslaw (2012-04-06 09:03:46)

Offline

 

#2  2012-04-15 22:31:04

  fenix79 - Nowy użytkownik

fenix79
Nowy użytkownik
Zarejestrowany: 2012-04-15

Re: Sprawdzanie poprawności pracy dysków (SAS) i RAID'a na serwerku DELL'a

Grzeslaw
np tak:

Kod:

smartctl -a -d megaraid,11 /dev/sdb
smartctl --test=long -d megaraid,11 /dev/sdb

gdzie 11 to "Device Id:" brane z megacli

Odnośnie regularnego sprawdzania dysków w macierzy na megacli lepiej chyba korzystać z megacli -ldinfo -Lall -Aall -NoLog i sprawdzać wartość pola State, oprócz uszkodzenia dysków pokaże też rozjechaną macierz, a jeszcze lepiej skorzystać z gotowego pluginu do nagiosa.

Offline

 

#3  2012-04-16 21:24:49

  Grzeslaw - Użytkownik

Grzeslaw
Użytkownik
Zarejestrowany: 2008-02-12

Re: Sprawdzanie poprawności pracy dysków (SAS) i RAID'a na serwerku DELL'a

Mhh.. Nagiosa nie używam, ale może zainstaluje.. Anyway.. chodzi mi bardziej o konfiguracje smartctl.confa by powiadamial mi mailowo jak jest nie halo..

Oto wynik tego co zaparoponwales.. Pierwsze to sam ci wkleilem. ale drugie:

Kod:

# smartctl --test=long -d megaraid,1 /dev/sda
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

Long (extended) offline self test failed [Input/output error]

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
To nie jest tylko forum, to nasza mała ojczyzna ;-)