收起左侧

不定期的死机的发现

18
回复
1488
查看
[ 复制链接 ]

1

主题

11

回帖

0

牛值

江湖小虾

2025-12-13 14:22:25 显示全部楼层 阅读模式

我的系统也经常会不定期死机,折腾内核日志终于找到罪魁祸首panic卡死。

死机现象复现:

SSH下执行

确认SysRq启用

echo 1 | sudo tee /proc/sys/kernel/sysrq

触发panic

echo c | sudo tee /proc/sysrq-trigger

注意,这时候系统会自动重启,如果你的机器自动重启成功,请绕道。你的死机原因绝不是这个。

如果系统直接卡死,不会自动重启。那么99%,你的死机原因就是这个。

下面是解决方法:

检查acpi

dmesg | grep -i "acpi" | grep -i "error|fail|warning" | tail -10

如果输出有大量错误,代表当前的acpi于bios固件存在兼容性问题。可以先禁用。

添加acpi=off内核参数

sudo sed -i 's/GRUB_CMDLINE_LINUX_DEFAULT="/&acpi=off /' /etc/default/grub
sudo update-grub
sudo reboot

重启之后,再次确认

确认SysRq启用

echo 1 | sudo tee /proc/sys/kernel/sysrq

触发panic

echo c | sudo tee /proc/sysrq-trigger

如果触发panic,系统能正常重启,那么问题就解决了,如果还是触发就卡死。

需要卸载看门狗

1. 卸载看门狗模块

sudo modprobe -r iTCO_wdt

2. 防止自动加载

echo "blacklist iTCO_wdt" | sudo tee /etc/modprobe.d/blacklist-watchdog.conf

3. 禁用NMI watchdog

echo 0 | sudo tee /proc/sys/kernel/nmi_watchdog

4. 检查是否禁用成功

lsmod | grep -i watchdog

最后,在进行一次重启测试

echo 5 | sudo tee /proc/sys/kernel/panic

echo c | sudo tee /proc/sysrq-trigger

重启正常,故障排除。如果你的是这个问题,可以找我要永久禁用的方法。避免下次内核升级之后又打开。

收藏
送赞 3
分享

1

主题

11

回帖

0

牛值

江湖小虾

2025-12-13 15:14:49 楼主 显示全部楼层
显卡硬件解码恢复(acpi=noirq代替acpi=off)
按这个配置了,但是飞牛影视里面的的GPU加速还是没恢复,还有别的办法么?  详情 回复
2025-12-30 23:53

0

主题

8

回帖

0

牛值

江湖小虾

2025-12-13 17:41:08 显示全部楼层
我就是之前看电影,看着看着就死机。最后底层换成PVE,又虚拟飞牛,没事了。

3

主题

5

回帖

0

牛值

江湖小虾

2025-12-30 23:39:41 显示全部楼层

谢谢楼主,好像是能解决问题了。

3

主题

5

回帖

0

牛值

江湖小虾

2025-12-30 23:53:33 显示全部楼层
Jeff_COlmn 发表于 2025-12-13 15:14
显卡硬件解码恢复(acpi=noirq代替acpi=off)

按这个配置了,但是飞牛影视里面的的GPU加速还是没恢复,还有别的办法么?

4

主题

22

回帖

0

牛值

江湖小虾

2026-1-3 12:29:31 显示全部楼层

试了下,好像可以了。求怎么永久禁用,大佬,发你私信了

1

主题

6

回帖

0

牛值

江湖小虾

2026-2-10 23:09:36 显示全部楼层

怎么永久禁止啊

0

主题

5

回帖

0

牛值

江湖小虾

2026-2-15 11:02:20 显示全部楼层

码住,节后我也试试

2

主题

40

回帖

0

牛值

江湖小虾

2026-3-1 09:47:44 显示全部楼层

按此方法 已达成重启

2

主题

23

回帖

0

牛值

江湖小虾

已按楼主方法达成重启,显卡硬件解码也正常,现在就是观察测试,过两天来反馈,谢谢楼主

acpi=noirq代替acpi=off,但如果你地一次的参数是acpi=off,你在写一次acpi=noirq并不能覆盖,而是两个参数并存,并且系统启动会变很慢,启动后cpu一直占用很高,核显也调用不了,必须先清楚所有参数,重新写入,写  详情 回复
4 天前
好兄弟硬解如何恢复的,我试了貌似不太行  详情 回复
4 天前

0

主题

3

回帖

0

牛值

江湖小虾

阿飞穆 发表于 2026-4-9 03:04
已按楼主方法达成重启,显卡硬件解码也正常,现在就是观察测试,过两天来反馈,谢谢楼主
...

好兄弟硬解如何恢复的,我试了貌似不太行

2

主题

23

回帖

0

牛值

江湖小虾

阿飞穆 发表于 2026-4-9 03:04
已按楼主方法达成重启,显卡硬件解码也正常,现在就是观察测试,过两天来反馈,谢谢楼主
...

acpi=noirq代替acpi=off,但如果你地一次的参数是acpi=off,你在写一次acpi=noirq并不能覆盖,而是两个参数并存,并且系统启动会变很慢,启动后cpu一直占用很高,核显也调用不了,必须先清楚所有参数,重新写入,写入时替换成acpi=noirq
确实出现了,cpu 动不动 100% 的情况,请问如何重新覆盖  详情 回复
4 天前

2

主题

23

回帖

0

牛值

江湖小虾

到目前为止稳定运行了12小时,算是打破纪录了,继续观察

0

主题

3

回帖

0

牛值

江湖小虾

阿飞穆 发表于 2026-4-9 16:16
acpi=noirq代替acpi=off,但如果你地一次的参数是acpi=off,你在写一次acpi=noirq并不能覆盖,而是两个参 ...

确实出现了,cpu 动不动 100% 的情况,请问如何重新覆盖
具体步骤我也没记录,都是根据当时出现的情况一步一步来,要根据具体情况看,我的现在稳定运行了20多个小时,算是近半个月来最高纪录了,继续观察  详情 回复
4 天前

2

主题

23

回帖

0

牛值

江湖小虾

墨闻x 发表于 2026-4-9 19:55
确实出现了,cpu 动不动 100% 的情况,请问如何重新覆盖

具体步骤我也没记录,都是根据当时出现的情况一步一步来,要根据具体情况看,我的现在稳定运行了20多个小时,算是近半个月来最高纪录了,继续观察
好的,我现在也不死机了,但同时 gpu 调用不行了,不知道哪里有重启调用 gpu 的方法  详情 回复
前天 07:07

0

主题

3

回帖

0

牛值

江湖小虾

阿飞穆 发表于 2026-4-9 23:19
具体步骤我也没记录,都是根据当时出现的情况一步一步来,要根据具体情况看,我的现在稳定运行了20多个小 ...

好的,我现在也不死机了,但同时 gpu 调用不行了,不知道哪里有重启调用 gpu 的方法

0

主题

2

回帖

0

牛值

江湖小虾

我的用不了1天nas就死机 开机acpi报错,b365主板,升级bios还是

0

主题

2

回帖

0

牛值

江湖小虾

多久能更新解决这个问题?硬盘都要重启得冒烟了

2

主题

23

回帖

0

牛值

江湖小虾

我现在已经稳定运行超过60小时了

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则