Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Cześć,
Mam tak problem - komputer jest w miarę nowy. Bebechy ma takie:
00:00.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1450 00:00.2 IOMMU: Advanced Micro Devices, Inc. [AMD] Device 1451 00:01.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:01.3 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1453 00:02.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:03.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:03.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1453 00:04.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:07.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:07.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1454 00:08.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:08.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1454 00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller (rev 59) 00:14.3 ISA bridge: Advanced Micro Devices, Inc. [AMD] FCH LPC Bridge (rev 51) 00:18.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1460 00:18.1 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1461 00:18.2 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1462 00:18.3 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1463 00:18.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1464 00:18.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1465 00:18.6 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1466 00:18.7 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1467 03:00.0 USB controller: Advanced Micro Devices, Inc. [AMD] Device 43bb (rev 02) 03:00.1 SATA controller: Advanced Micro Devices, Inc. [AMD] Device 43b7 (rev 02) 03:00.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b2 (rev 02) 04:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02) 04:01.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02) 04:04.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02) 05:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 02) 1e:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 15) 20:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Caicos [Radeon HD 6450/7450/8450 / R5 230 OEM] 20:00.1 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] Caicos HDMI Audio [Radeon HD 6450 / 7450/8450/8490 OEM / R5 230/235/235X OEM] 21:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 145a 21:00.2 Encryption controller: Advanced Micro Devices, Inc. [AMD] Device 1456 21:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Device 145c 22:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 1455 22:00.2 SATA controller: Advanced Micro Devices, Inc. [AMD] FCH SATA Controller [AHCI mode] (rev 51) 22:00.3 Audio device: Advanced Micro Devices, Inc. [AMD] Device 1457
Procesor:
AMD Ryzen 5 1600 Six-Core Processor
6 rdzeni.
Problem jest w tym, że maszyna mi się od czasu do czasu wiesza. Nie połączysz się zdalnie z maszyną, fizycznie będąc przy niej można ją wyłączyć tylko resetem lub z guzika trzymanego przez 5 s.
Po ponownym odpaleniu pracuje normalnie przez dwa,trzy dni, czasem tydzień. I tak od nowa.
W logach nie ma nic -> kern.log; syslog
Podejrzewam (bo to komputer z przetargu) że chłopcy włożyli do środka jakąś badziewną płytę główną i ona stwarza problemy, bo zwiecha występuje bez względu na to czy środowisko graficzne jest odpalone czy też nie.
Rozwiązaniem dla mnie byłoby jakieś polecenie które wykrywając bug w systemie, albo jakiś wredny proces - spowoduje restart maszyny.
Teoretycznie mogę np. teraz zrobić tak, aby w cronie wklepać polecenie restartu co 24 godziny. Tylko po co ? jak ona wtedy dobrze chodzi...
Offline
Jeśli płyta i procesor są zgodne z zainstalowanym kernelem (więc nie powinny sprawić problemu), przyczyna może być bardziej na "zewnątrz".
Pytanie o jakość zasilacza, o jakość sieci do której jest podpięty (wyobrażam sobie potencjalny losowy glitch robiący jakieś kuku).
Jeśli internet podpięty skrętką, to może spróbować wi-fi'kiem?
Nie wiem czy da się to zrobić (sam już komputerów używam tylko w pracy do klikania, w domu włączam lapka tylko aby zrobić update),
gdybyś wymusił permanentnie wolny zegar i/lub obniżył zasilanie?
Jeszcze mi po głowie chodzi pamięć. Czy pamięć jest wyspecyfikowana do pracy z aktualnym zegarem (standard standardem ale nie każdy interfejs łyknie każde pasmo ze standardu).
Softwerowo, spróbowałbym zapisywać do logów wartość sensorów (temp/supply) i może dokorelowałbym do tego load systemu.
Offline
Hej, dzięki za rady :)
Na dzień dobry odpaliłem klimę na całą dobę. W czasie pracy (7.00 - 14.00) temperatura jest ok. Ale wieczorem dochodzi do 32 oC (klima wyłączona, okno zachodnie, obok dach z papy).
Co do podzespołów:
Warunki przetargów są jakie są - nie wolno mi podać modelu płyty, tylko socket na jakim siedzi procesor. Co z automatu wymusza procesor :) Musiałem tylko zaznaczyć ile rdzeni.
Pamięci też nie specyfikowałem tylko podałem wielkość w GB.
Kurcze, gdybym sam sobie składał, to miałbym maszynę marzenie, a tak to d***a blada.
W poniedziałek będę grzebał dalej.
Offline
Oprócz RAM, to warto sprawdzić z którego tygodnia produkcji jest procesor. Kiedyś już Bodzio narzekałeś na forum na Ryzen'a jakiegoś i chyba tam coś pisałem o tych tygodniach produkcji.
Poza tym chyba to też warto przeczytać https://utcc.utoronto.ca/~cks/space/blog/linux/RyzenApparentlyStable && https://utcc.utoronto.ca/~cks/space/blog/linux/KernelRcuNocbsMeaning
Ostatnio edytowany przez ciastek1981 (2019-09-01 10:53:15)
Offline
Do /etc/sysctl.conf
dopisz
kernel.panic = 20 kernel.panic_on_io_nmi = 1 kernel.panic_on_oops = 1
zresetuj kompa
to będzie powodowało restrart komputera jak wystąpi problem
i teraz na spokojnie będzie można szukać przyczyny, dodatkowo pasowało by zainstalować jakieś narzędzie do monitorowania systemu
Offline
Mam tego procka i przechodziłem to samo - losowe zwiechy systemu niezależnie od obciążenia czy temperatury. Po wyłączeniu w UEFI C-State Control problem zniknął ;) Rozwiązanie znalazłem tutaj: https://community.amd.com/thread/215773?start=1765&tstart=0
Jest też do tego jakiś skrypt: https://github.com/r4m0n/ZenStates-Linux ale nie próbowałem.
Offline
Dzięki wielkie :)
Za kilka dni wypróbuję - u mnie w robocie wielkie remonty teraz ;)
Offline
@yaros - na razie zrobiłem jak radzisz. zobaczę czy działa.
Offline
Jak na razie wszystko ok. Obie opcje mam włączone, tzn. myk @yaros oraz na cronie ustawiony reboot na 23.00
Offline
Nie wiem jak utrudniony masz dostęp do tego komputera, ale jeżeli masz możliwość wciśnięcia reseta, albo ktoś może zrobić to za Ciebie, to zaryzykowałbym testy z wyłączonym rebootem... ;)
Offline
yaros napisał(-a):
Nie wiem jak utrudniony masz dostęp do tego komputera, ale jeżeli masz możliwość wciśnięcia reseta, albo ktoś może zrobić to za Ciebie, to zaryzykowałbym testy z wyłączonym rebootem... ;)
Mam fizyczny i zdalny. Ale nie chcę tego robić przed weekendem. Potrzebuję dostęp do strony w niedzielę jak będę daleko od domu.
Ale dzięki - sprawdzę po niedzieli.
Offline
Tor napisał(-a):
I co? Pomogło?
Jak najbardziej
Offline