Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#1  Dzisiaj 21:20:33

  Pavlo950 - człowiek pasjonat :D

Pavlo950
człowiek pasjonat :D
Zarejestrowany: 2012-02-20
Serwis

losowy freeze systemu na tty

Cześć!

Borykam się - od jakiegoś czasu - z losowymi freeezami / zamrożeniem systemu (no, powiedzmy). Początkowo myślałem, że to jakiś problem z xorgiem (bo podobny problem miałem na innym sprzęcie), ale chyba nie do końca.
Po wyłączeniu menedżera logowania i przełączeniu się na tty1 po jakimś czasie (kilka / kilkanaście godzin w idle'u) nie mogę ani się przełączyć na żadne inne tty (zakładając, że zostawiam system na tty1) ani tym bardziej zalogować się na aktualne tty. Objawia się to tak, że system "odpowiada" na klawiaturę itd ale jakby nie mógł odczytać danych z dysku.
Jak kliknę przycisk wyłączania to wywala komunikaty od journalctl o niemożności zapisania danych na dysku.

Zakładam więc, że automagicznie rozłącza się dysk. Pytanie czy problem jest w płycie głównej, procesorze czy może w kontrolerze dysku?
Losowo tzn komp może chodzić dwie doby i jest ok a czasami wywali się po niecałej dobie. Ostatnie zapisane logi dotyczą fwupd (wywaliłem gdyby się okazało że to on powodował problemy).
Jedyne ze zmian w uefi to mam wyłączone energy star i coś tam innego (chyba cec?) od oszczędzania energii przez co procek chodzi na stałych 2600MHz. Wolałbym tego nie ruszać, bo w razie gdyby zwieche złapał jak mnie nie będzie, to mi sfajczy płytę główną (kiepskie chłodzenie, zaraz dojdę do tego).

Komputerek to Asus PB62 w USFF z chłodzeniem jak od laptopa. Sprzęt mam, zdaje się, że od 2023 i generalnie poza zwiechami sprawuj się idealnie. Asus chwali się że testy obciążeniowe i w ciężkich warunkach 24/7 niby przechodził... XD

SMART żadnych błędów odnośnie relokowanych sektorów itd nie wyrzuca, obydwa dyski nvme mają przepracowane przeszło 4k godzin. Jedyne co to mam coś takiego:

Kod:

NVMe Non-Persistent Error Information Log: 

Non-Persistent Error Log Size: 256
Number of Error Log Entries Read: 256

Error 1375    Command ID: 0014    LBA: 00000000000000000000    Invalid Field in Command

Problem w tym, że mam to na dwóch różnych dyskach nvme :D
Opcje kernela:

Kod:

quiet iwlwifi.power_save=0 pcie_aspm=off intel_pstate=disable

Profilaktycznie wywalę pcie_aspm bo i tak do niczego mi to nie jest potrzebne.
Czy problem zaczął się od instalacji fwupd, albo dodania pcie_aspm tego nie wiem bo wszystkie logi niedawno wywaliłem :D ale może być że jedno albo drugie mogłoby byś z problemem powiązane.
Jak go trzasnę z prądu, odczekam chwilę i załączę zasilanie to odpala normalnie bez błędów. Generalnie od razu, chociaż dziś chciałem od razu go odpalić to miał 3 sekundowę zwiechę i dopiero bios się załadował.

System to Debian 13 (stable w chwili pisania tego posta).
Najnowsze paczki z repo. i5-11400 / 64GB ramu. Problemy z ramem wykluczam (zupełnie inne objawy, czyszczę bufory przez przejściem na tty1). Z usług w tle to tylko vsftpd, ssh, avahi, network-manager, cups ale 'czysty', coś od bluetooth i tyle.
Mogę go teraz obciążyć np na 2 godziny i będzie wszystko ok. Problem z zasilaniem też raczej nie ten bo łapał by restarty.
Temperatury w normie, na stałym 2600MHz i chłodzeniu laptopowym, jak mam przeglądarkę odpaloną z YT i kilkunastoma kartami + jedna maszyna wirtualna, ewentualnie coś tam innego w tle, jest około 55 stopni. W całkowitym idle'u zejdzie do około 40 - 42.

Jak podejść do tematu dalszej diagnostyki?

Ostatnio edytowany przez Pavlo950 (Dzisiaj 21:49:22)

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
To nie jest tylko forum, to nasza mała ojczyzna ;-)