Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Strony: 1
Witam,
Ostatnio niepokojąco często pada mi serwerek na Debianie Squeeze (kernel 3.2.0-0.bpo.4-686-pae). Padają po kolei wszystkie ważne procesy: snmpd, nmbd, ntpd i na końcu nawet ifconfig. Jako że łączę się z serwerem przez SSH, pozostaje mi tylko twardy reset serwera. Na sewerze działa hostap i zauważyłem że przed tymi "cyrkami" rozłączani są wszyscy klienci wifi... Proszę o pomoc w interpretacji poniższych logów i wskazówki:
/var/log/syslog
May 14 21:40:02 debian snmpd[1855]: Connection from UDP: [127.0.0.1]:58173->[127.0.0.1] May 14 21:40:02 debian snmpd[1855]: Connection from UDP: [127.0.0.1]:57735->[127.0.0.1] May 14 21:42:47 debian hostapd: wlan1: STA 00:1c:XX:XX:XX:XX IEEE 802.11: disassociated due to inactivity May 14 21:42:48 debian hostapd: wlan1: STA 00:13:XX:XX:XX:XX IEEE 802.11: disassociated due to inactivity May 14 21:42:48 debian hostapd: wlan1: STA 00:1c:XX:XX:XX:XX IEEE 802.11: deauthenticated due to inactivity May 14 21:44:52 debian kernel: [1306321.340118] INFO: task snmpd:1855 blocked for more than 120 seconds. May 14 21:44:52 debian kernel: [1306321.340158] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:44:52 debian kernel: [1306321.340201] snmpd D c130cd20 0 1855 1 0x00000000 May 14 21:44:52 debian kernel: [1306321.340219] ef55b760 00200082 c10ecde5 c130cd20 efa98ec0 00000000 efa98ec0 35d68000 May 14 21:44:52 debian kernel: [1306321.340242] c141be00 c1498b00 ef55b910 c1498b00 ef55b760 c1498b00 c1498b00 f4c51dc0 May 14 21:44:52 debian kernel: [1306321.340265] f6cc668c f692c628 c1230bde 00000004 c110f0e9 00000000 c11163b9 efa98ec0 May 14 21:44:52 debian kernel: [1306321.340288] Call Trace: May 14 21:44:52 debian kernel: [1306321.340313] [<c10ecde5>] ? seq_open+0x4f/0x6b May 14 21:44:52 debian kernel: [1306321.340333] [<c1230bde>] ? dev_seq_open+0xc/0xe May 14 21:44:52 debian kernel: [1306321.340351] [<c110f0e9>] ? proc_reg_open+0x8c/0xeb May 14 21:44:52 debian kernel: [1306321.340369] [<c11163b9>] ? single_release_net+0x20/0x20 May 14 21:44:52 debian kernel: [1306321.340389] [<c10d6c46>] ? __dentry_open+0x1ab/0x263 May 14 21:44:52 debian kernel: [1306321.340408] [<c12d674e>] ? __mutex_lock_common+0xda/0x12a May 14 21:44:52 debian kernel: [1306321.340423] [<c12d67af>] ? __mutex_lock_slowpath+0x11/0x14 May 14 21:44:52 debian kernel: [1306321.340438] [<c12d6845>] ? mutex_lock+0x17/0x23 May 14 21:44:52 debian kernel: [1306321.340450] [<c12d6845>] ? mutex_lock+0x17/0x23 May 14 21:44:52 debian kernel: [1306321.340465] [<c1234020>] ? dev_ioctl+0x2b/0x59d May 14 21:44:52 debian kernel: [1306321.340484] [<c112e788>] ? security_sk_alloc+0xd/0xf May 14 21:44:52 debian kernel: [1306321.340499] [<c12288f3>] ? sk_prot_alloc+0x7d/0xf5 May 14 21:44:52 debian kernel: [1306321.340519] [<c12716d9>] ? udp_getsockopt+0x35/0x35 May 14 21:44:52 debian kernel: [1306321.340534] [<c1278909>] ? inet_ioctl+0x94/0x97 May 14 21:44:52 debian kernel: [1306321.340553] [<c1225645>] ? sock_ioctl+0x1bb/0x1dd May 14 21:44:52 debian kernel: [1306321.340567] [<c122548a>] ? kernel_sendmsg+0x35/0x35 May 14 21:44:52 debian kernel: [1306321.340581] [<c10e2ed1>] ? do_vfs_ioctl+0x46c/0x4b7 May 14 21:44:52 debian kernel: [1306321.340594] [<c12264fe>] ? sock_alloc_file+0x97/0xeb May 14 21:44:52 debian kernel: [1306321.340608] [<c10d5d2b>] ? fd_install+0x1b/0x38 May 14 21:44:52 debian kernel: [1306321.340620] [<c122656d>] ? sock_map_fd+0x1b/0x20 May 14 21:44:52 debian kernel: [1306321.340632] [<c1226f91>] ? sys_socket+0x42/0x56 May 14 21:44:52 debian kernel: [1306321.340644] [<c1227021>] ? sys_socketcall+0x7c/0x1de May 14 21:44:52 debian kernel: [1306321.340656] [<c10e2f60>] ? sys_ioctl+0x44/0x64 May 14 21:44:52 debian kernel: [1306321.340674] [<c12dbc5f>] ? sysenter_do_call+0x12/0x28 May 14 21:45:01 debian /USR/SBIN/CRON[24372]: (cacti) CMD (/usr/bin/php /var/www/cacti/poller.php > /dev/null 2>&1) May 14 21:46:52 debian kernel: [1306441.340098] INFO: task cupsd:1294 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.340139] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.340181] cupsd D f4fe0840 0 1294 1 0x00000000 May 14 21:46:52 debian kernel: [1306441.340199] ef4c8ea0 00000082 00200200 f4fe0840 efaaa080 00000000 00000000 35d68000 May 14 21:46:52 debian kernel: [1306441.340222] c10e3c0e c1498b00 ef4c9050 c1498b00 ef4c8ea0 c1498b00 c1498b00 efa44ec0 May 14 21:46:52 debian kernel: [1306441.340245] c127198d f6fe3700 000000a7 ef7c5d24 000000a7 00000000 ef7c5ecc f6fe3700 May 14 21:46:52 debian kernel: [1306441.340267] Call Trace: May 14 21:46:52 debian kernel: [1306441.340292] [<c10e3c0e>] ? __pollwait+0x9e/0x9e May 14 21:46:52 debian kernel: [1306441.340314] [<c127198d>] ? udp_send_skb+0x25e/0x2ae May 14 21:46:52 debian kernel: [1306441.340331] [<c1272a66>] ? udp_sendmsg+0x483/0x654 ... May 14 21:46:52 debian kernel: [1306441.340712] INFO: task nmbd:1764 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.340743] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.340783] nmbd D ef59fca4 0 1764 1 0x00000000 May 14 21:46:52 debian kernel: [1306441.340798] ef41c180 00000082 ef59fcf8 ef59fca4 c11f85c4 00000000 ef59fd6a 35d68000 May 14 21:46:52 debian kernel: [1306441.340820] 00000000 c1498b00 ef41c330 c1498b00 ef41c180 c1498b00 c1498b00 00000000 May 14 21:46:52 debian kernel: [1306441.340841] 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 May 14 21:46:52 debian kernel: [1306441.340861] Call Trace: May 14 21:46:52 debian kernel: [1306441.340878] [<c11f85c4>] ? extract_buf+0x8c/0x11b May 14 21:46:52 debian kernel: [1306441.340895] [<c12d674e>] ? __mutex_lock_common+0xda/0x12a ... May 14 21:46:52 debian kernel: [1306441.341184] INFO: task snmpd:1855 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.341214] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.341255] snmpd D c130cd20 0 1855 1 0x00000000 May 14 21:46:52 debian kernel: [1306441.341270] ef55b760 00200082 c10ecde5 c130cd20 efa98ec0 00000000 efa98ec0 35d68000 May 14 21:46:52 debian kernel: [1306441.341292] c141be00 c1498b00 ef55b910 c1498b00 ef55b760 c1498b00 c1498b00 f4c51dc0 May 14 21:46:52 debian kernel: [1306441.341314] f6cc668c f692c628 c1230bde 00000004 c110f0e9 00000000 c11163b9 efa98ec0 May 14 21:46:52 debian kernel: [1306441.341336] Call Trace: May 14 21:46:52 debian kernel: [1306441.341350] [<c10ecde5>] ? seq_open+0x4f/0x6b May 14 21:46:52 debian kernel: [1306441.341366] [<c1230bde>] ? dev_seq_open+0xc/0xe ...May 14 21:46:52 debian kernel: [1306441.342133] INFO: task ifconfig:24369 blocked for more than 120 seconds. May 14 21:46:52 debian kernel: [1306441.342163] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. May 14 21:46:52 debian kernel: [1306441.342204] ifconfig D 00000000 0 24369 24368 0x00000000 May 14 21:46:52 debian kernel: [1306441.342219] ef606900 00200082 b77b4000 00000000 c14235c0 00000000 f4ee2600 35d68000 May 14 21:46:52 debian kernel: [1306441.342241] c109dec4 c1498b00 ef606ab0 c1498b00 ef606900 c1498b00 c1498b00 ef78f580 May 14 21:46:52 debian kernel: [1306441.342263] 00000070 00000000 f4d03a70 f68a4c4c efa55e7c f68a4cac 00000000 00000000 May 14 21:46:52 debian kernel: [1306441.342284] Call Trace: May 14 21:46:52 debian kernel: [1306441.342303] [<c109dec4>] ? find_get_page+0x19/0x65 May 14 21:46:52 debian kernel: [1306441.342318] [<c10b6c33>] ? __do_fault+0x3ee/0x42b
Ostatnio edytowany przez dave88 (2013-05-14 22:51:45)
Offline
Na innym kernelu próbowałeś?
Ja bym zaktualizowal to stabilne wydanie do stabilnego wydania - czyli do Wheezy.
Przydało by się też memtest zrobić, bo jak większa liczba uslug zdycha, to może być coś z pamiecią.
Względnie byl kiedyś taki bląd w kernelu:
http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=517586
Na początek radzę inne jajo dla próby, najlepiej jakieś dużo mlodsze.
I zastanowić się, czy ten serwerek, i jego pamięć są wystarczające do tego, co mają robić.
Pozdrawiam
;-)
Offline
Jacekalex napisał(-a):
Na innym kernelu próbowałeś?
Poprzednio miałem jądro serii 2.6 coś (nie pamiętam dokładnie). Działy się podobne cyrki, serwer potrafił się nawet wyłączyć...
Jacekalex napisał(-a):
Ja bym zaktualizowal to stabilne wydanie do stabilnego wydania - czyli do Wheezy.
Też o tym myślałem, tylko jaką mam gwarancję że żadna z usług mi się nie posypie (nie poleci żaden konfig)?
Jacekalex napisał(-a):
Przydało by się też memtest zrobić, bo jak większa liczba uslug zdycha, to może być coś z pamiecią.
Memtest robiłem jakiś czas temu, RAM 100 % sprawny.
Jacekalex napisał(-a):
I zastanowić się, czy ten serwerek, i jego pamięć są wystarczające do tego, co mają robić.
Serwerek oparty na VIA C7 1000MHz oraz RAM 1GB DDR2 533. Jednak usług mam odpalone znacznie więcej niż te zawarte w logu... Myślisz że zwyczajnie nie daje rady?
Pozdrawiam
Dawid
Offline
@dave88:
Z mojego doświadczenia raczej ciężko jest "zarżnąć" kompa - a i objawy niezbyt pasują, natomiast podobne do powyższego zdarzało mi się na jednej przegrzewającej się karcie WIFi - czy sprzęt posiada jakieś chłodzenie i czy ono działa? Kiedy ostatni był czyszczony sprężonym powietrzem z kurzu i pyłu, do tego pytanko - zasilasz to czymś markowym, czy noname?
Offline
Jeśli chodzi o kartę wifi to jest to model TL-WN722N podpięty przez usb. Nie grzeje się przy tym prawie w ogóle, wykluczam raczej ten element, gdyż przed jej instalacją również następowały zwisy. Serwerek pracuje w prawie sterylnych warunkach (zamknięty w szafie) i oczywiście jest chłodzony aktywnie, temperatury istotnych elementów nie przekraczają 37 st. Zasilanie realizuję za pomocą zasilacza buforowego 12V + aku 5Ah więc ze stabilnością napięć nie mam problemów. Wydaje mi się (chociaż brak 100% powtarzalności), że problemy pojawiają się kiedy zmuszam serwer do przerutowania dużego ruchu (pełni funkcje NAT). Z tym że nie dzieje się to od razu lecz, po kilkunastu minutach (przynajmniej ostatnio tak było).
Ostatnio edytowany przez dave88 (2013-05-16 20:13:58)
Offline
A to nie jest jakiś terminal hp ? np 5720 ? Poszukaj w BIOSie opcji dot oszczędzania energii i je wyłącz.
Offline
Zgadza się to terminal, dokładnie IGEL 4210LX Winestra. Wydaje mi się, że dezaktywowałem wszelkie opcje dot. oszczędzania energii, ale sprawdzę to przy okazji.
Offline
Strony: 1