Компьютер зависает после нескольких минут бездействия
UPD: я начинаю подозревать, что проблема в моём wifi-адаптере, который я купил совсем недавно (месяцев 2-3 назад).
UPD: я вообще уже без понятия, в чем может быть проблема, потому что оно опять вылетело. и главная проблема, что ошибок в журнале я не наблюдаю.
Сторожевых таймеров 2: аппаратный и программный:Agentium:nowatchdog и вот уже как 24 часа ничего не зависало
nmi_watchdog=0 - отключает аппаратный сторожевой таймер
nowatchdog - отключает оба сторожевых таймера - программный и аппаратный
Параметр nowatchdog может не работать для некоторых модулей watchdog, например, для аппаратного сторожевого таймера Intel TCO. В этом случае модуль ядра для TCO можно отключить с помощью параметра modprobe.blacklist=iTCO_wdt
PS - у меня
dmesg | grep watchdog
[ 0.162341] NMI watchdog: Enabled. Permanently consumes one hw-PMU counter.systemctl status watchdog.service
Unit watchdog.service could not be found.ls -l /etc/watchdog*
ls: невозможно получить доступ к '/etc/watchdog*': Нет такого файла или каталогаls -l /dev/watchdog*
ls: невозможно получить доступ к '/dev/watchdog*': Нет такого файла или каталогаОшибки не исчезают с опытом - они просто умнеют
Вот именно. Как раз из списка "дебильных" инструкций.vasek:systemctl status watchdog.service
Unit watchdog.service could not be found.
неа. Это не тот watchdog)vasek:nmi_watchdog=0 - отключает аппаратный сторожевой таймер
Вот аппаратный: https://archlinux.com.ru/forum/viewtopi ... 440#p11440
🖥 AsRock B550M Pro4 :: AMD Ryzen 5 3600 :: 16 GB DDR4 :: AMD Radeon RX 6600 :: XFCE
💻 HP EliteBook 745 G6 :: AMD Ryzen 5 PRO 3500U :: 8 GB DDR4 :: AMD Radeon Vega 8 :: XFCE
точнее: nmi_watchdog=0 - отключает жесткой сторожевой таймерvasek:nmi_watchdog=0 - отключает аппаратный сторожевой таймер
MAH: To turn the hardlockup detector off, use: nmi_watchdog=0
(чтобы отключить детектор жесткой блокировки, используйте: nmi_watchdog=0)
PS - Справочник по параметрам ядра
nmi_watchdog=[KNL,BUGS=X86]
Отладочные функции для ядер SMP.
Формат: [panic,][nopanic,][num]
Допустимые num: 0 или 1.
0 - выключает детектор hardlockup в nmi_watchdog.
1 - включает детектор hardlockup в nmi_watchdog.
Когда указано panic, активируется паника ядра при таймауте NMI watchdog ('nopanic' отменяет это значение по умолчанию). Для запрета обоих детекторов, аппаратных и программных, см. 'nowatchdog'. Это полезно, когда Вы используете panic=... таймаут и нужно быстро заново поднять систему.
PS-2 - Аппаратный сторожевой таймер (HWDT) производит сброс микроконтроллера при своём переполнении, что является средством против зависания системы и зацикливания программного обеспечения.
Ошибки не исчезают с опытом - они просто умнеют
Аппаратный сторожевой таймер просто ребутает всю систему, по истечению заданного времени.
🖥 AsRock B550M Pro4 :: AMD Ryzen 5 3600 :: 16 GB DDR4 :: AMD Radeon RX 6600 :: XFCE
💻 HP EliteBook 745 G6 :: AMD Ryzen 5 PRO 3500U :: 8 GB DDR4 :: AMD Radeon Vega 8 :: XFCE
не спорюALiEN:NMI - это не аппаратный сторожевой таймер! Просто "надсмотрщик" у процессора.
Аппаратный сторожевой таймер просто ребутает всю систему, по истечению заданного времени.
DOC
NMI (Non-Maskable Interrupt) — немаскируемое прерывание в Linux. Это аппаратное прерывание, которое не может быть проигнорировано или подавлено процессором.
watchdog - функция, которая позволяет обнаруживать сбои в работе системы.
nmi_watchdog - функция, которая позволяет обнаруживать сбои в работе ядра.
Некоторые особенности работы nmi_watchdog:
- обнаружение мягких блокировок. Это ошибки, из-за которых ядро работает в режиме ядра более 20 секунд, не давая возможности выполняться другим задачам.
- обнаружение жёстких блокировок. Это ошибки, из-за которых процессор работает в режиме ядра более 10 секунд, не давая возможности выполняться другим прерываниям.
Ошибки не исчезают с опытом - они просто умнеют
Благодарю ВАС и других за интересное обсуждение, расширил кругозор благодаря вам.vasek:Сторожевых таймеров 2
CPU AMD Phenom(tm) II X4 955 3200МГЦ, 10ГБ ДДР2, GA-MA770-UD3 (Rev. 1.0), АМД Sapphire Radeon HD 4670, hdd ide ata5 120GB+200GB, net rtl8169, audio Creative Labs CA0106.
Дальше написано то, что не относится к решению проблемы и является просто обращением к тем, кому достало что я несу бред, и поэтому его можно не читать
Cкрытый текст
journalctl -b0 -p4 https://termbin.com/y9siALiEN: К аппаратному watchdog (которого кстати у вас нет) это отношения не имеет.
Типичные источники:
предполагаю, что :
из-за ошибок APIC ID mismatch прерывание от видеокарты не доходит до нужного ядра процессора.
Оттуда "Я занята" при попытках усыпить.
укороченная цитата:
kernel No irq handler for 1.55
kernel: [Firmware Bug]: CPU 2: APIC ID mismatch. CPUID: 0x0003 APIC: 0x0002
kernel: No irq handler for 2.55
kernel: [Firmware Bug]: CPU 3: APIC ID mismatch. CPUID: 0x0002 APIC: 0x0003
office kernel: No irq handler for 3.55
office kernel: ACPI Error: AE_NOT_FOUND, While resolving a named reference package element - LNKC (20250807/dspkginit-438)
...#
~# grep 'microcode' /proc/cpuinfo
microcode : 0x10000af
microcode : 0x10000af
microcode : 0x10000af
microcode : 0x10000af
# journalctl --grep lockup
-- Boot 821b10bc28354673b88e7b120ddfbffb --
-- Boot 68a97a3fb48b4c1ebb7c7cf19230daa8 --
-- Boot 8bf22123c616453bb205ad4ca29c0573 --
мар 24 17:41:26 office rtkit-daemon[1025]: Recovering from system lockup, not allowing further RT threads.
мар 24 17:41:45 office rtkit-daemon[1025]: Recovering from system lockup, not allowing further RT threads.
мар 25 16:33:13 office rtkit-daemon[1025]: Recovering from system lockup, not allowing further RT threads.
мар 25 16:33:40 office rtkit-daemon[1025]: Recovering from system lockup, not allowing further RT threads.
мар 25 16:33:43 office rtkit-daemon[1025]: Recovering from system lockup, not allowing further RT threads.
мар 25 16:33:46 office rtkit-daemon[1025]: Recovering from system lockup, not allowing further RT threads.
cat /etc/mkinitcpio.conf |grep -vE '^#|^$'MODULES+=(zstd lz4 zsmalloc) # compress
MODULES+=(pata_atiixp pata_acpi ata_generic sg sr_mod vhba) # storage
MODULES+=(radeon) # video
MODULES+=(usbhid xhci_hcd) # usb
MODULES+=(snd_ca0106 snd snd-pcm snd-ac97-codec snd-rawmidi) # audio
BINARIES=(fsck fsck.ext4 e2fsck fsck.btrfs btrfs btrfsck)
FILES=(/etc/vconsole.conf /etc/modprobe.d/usbhid.conf)
HOOKS=(base udev autodetect microcode modconf kms keyboard keymap consolefont block resume filesystems fsck)
[/code]
при дампах я обнаружил автоматическое включение во все отверстия модуля sp5100_tco ,
который отвечает за ватчдог(watchdog), которого у меня физически нет на плате.
система к нему обращается и здрасте висяк.
cat /sys/power/mem_sleep
s2idle [deep]
отредактировал /etc/systemd/sleep.conf
cat /etc/systemd/sleep.conf |grep -vE '^#|^$'
[Sleep]
AllowSuspend=yes
AllowHibernation=yes
AllowSuspendThenHibernate=yes
AllowHybridSleep=yes
SuspendState=mem #standby disk
HibernateMode=platform # shutdown suspend test_resume #cat /sys/power/disk [platform] shutdown reboot suspend test_resume
MemorySleepMode=deep #mem s2idle shallow # /sys/power/mem_sleep [s2idle] shallow
HibernateDelaySec=180 # Only used by systemd-suspend-then-hibernate.service(8)
SuspendEstimationSec=180min # Only used by systemd-suspend-then-hibernate.service(8)
предполагаю попробовать в syslinux.cfg
добавить к APPEND
pci=noacpi acpi_sleep=nonvs
и , может быть,
radeon.modeset=1
сейчас
cat /sys/module/radeon/parameters/modeset
-1 # в параметрах modeset означает «авто»
lsmod | grep radeon;lsmod | grep amd
тк предполагаю, что они могут конфликтовать
Я ошибаюсь или нет ?
CPU AMD Phenom(tm) II X4 955 3200МГЦ, 10ГБ ДДР2, GA-MA770-UD3 (Rev. 1.0), АМД Sapphire Radeon HD 4670, hdd ide ata5 120GB+200GB, net rtl8169, audio Creative Labs CA0106.