近期开始我的飞牛开始相对频繁的崩溃宕机，求助各位

jipenglin · 2026-4-14 10:44:51

最近一段时间，我装在老游戏本上的飞牛开始崩溃次数增多。最开始的半年基本不存在崩溃（当然也存在我频繁更新，单次开机时间都比较短的缘故，即使有崩溃也是不嫌麻烦重启了）最近小半年都是可更可不更的情况，因此单次开机时长都会一二十天往上，也是在最近出现了相对频繁的宕机。

上次卡死前没拍照，重启后日志也没有记录什么，看起来正常，应该是内核挂了，也问了AI，试了查找几条命令也没查出什么来。（有需求可以查看以下AI链接）

https://aistudio.google.com/app/prompts?state=%7B%22ids%22:%5B%221Ap1WQ5Cygz_-w6BWHKdTPt9ssbWAuPXP%22%5D,%22action%22:%22open%22,%22userId%22:%22113644052824312169589%22,%22resourceKeys%22:%7B%7D%7D&usp=sharing, https://drive.google.com/file/d/1B8JWWKsWjImmc0oX4Tw7fVPlqd1wAjtH/view?usp=sharing, https://drive.google.com/file/d/1_eQrghfCYjVNKmInn7NcJBIVm80aCLly/view?usp=sharing

物理机：拯救者R720 i5 7300HQ 16G DDR4 2400 GTX 1050Ti
系统版本：1.1.26

这次强制重启也没记录日志，但我提前留了照片

这次同样问了AI，依旧一无所获

https://chatgpt.com/share/69ddaafe-8020-839b-96d2-780084bb0cc2

如果可以的话希望各位大佬，可以帮我指点一下，我会尽可能提供我能提供的操作，感谢！

largebo · 2026-4-14 14:47:07

我觉得AI分析的很清楚，你参考下：

看到你提供的信息和照片，这确实是一个非常典型的 Linux Kernel Panic（内核恐慌）。照片底部的 Fatal exception in interrupt（中断处理中的致命异常）和 page_fault_oops（页错误）指出了问题的核心：内核在处理硬件中断或系统调度时，试图访问一个非法的内存地址。

根据你描述的“半年内基本没问题”到“开机时间长了就崩溃”，结合 R720 这款老机器的硬件特性，我为你梳理了排查思路：

1. 核心诱因分析

从崩溃堆栈看，涉及到了 nvidia_uvm 和 nvidia 驱动模块。

显卡驱动与功耗管理： 老款笔记本（GTX 1050Ti）作为 NAS 使用时，如果显卡长时间处于低功耗/休眠状态，或者内核更新后与老旧的 NVIDIA 驱动不兼容，极易在中断切换时导致 page_fault。
内存老化/压力： 你提到的 16G DDR4 2400。当系统运行 10-20 天后，由于 Docker 容器（如 Immich、Jellyfin 等）频繁读写交换内存，如果某条内存颗粒在高位地址存在不稳定性，就会触发这种随机的崩溃。
pstore 报错： 日志中显示 pstore: backend (efi_pstore) writing error (-28)，这说明内核想把崩溃日志存入主板 NVRAM 时失败了（通常是空间满了）。这解释了为什么你重启后查不到日志。

2. 建议的操作步骤

A. 屏蔽 NVIDIA 显卡（首选建议）

既然是作为飞牛 NAS 使用，除非你依赖这块 1050Ti 进行 Jellyfin 硬件转码，否则建议在 BIOS 中彻底禁用显卡，或在系统中将其黑名单化。

理由： 显卡驱动是 Linux 内核不稳定的最大来源之一。
操作： 尝试在 /etc/modprobe.d/ 中加入黑名单，或者在飞牛的设置中确认是否开启了不必要的 GPU 任务。

B. 调整内核启动参数

针对老旧笔记本的电源管理问题，可以在 GRUB 中尝试添加以下参数来提高稳定性：

编辑配置文件：sudo nano /etc/default/grub
在 GRUB_CMDLINE_LINUX_DEFAULT 中加入： intel_idle.max_cstate=1 pcie_aspm=off
更新 GRUB：sudo update-grub

目的： 防止 CPU 或 PCIe 设备进入过深的省电模式导致唤醒时心跳丢失或中断异常。

C. 内存压力测试 (Memtest86+)

鉴于你提到的“运行久了才崩”，这符合硬件疲劳或特定内存地址受损的特征。

建议制作一个启动 U 盘运行 Memtest86+，至少跑满 2 个 Pass。
如果是双条内存，可以尝试拔掉一根交叉运行测试。

D. 修复 pstore 无法记录日志的问题

为了下次能看到重启后的日志，你需要清理 EFI 存储空间：

执行 ls /sys/fs/pstore/ 查看是否有旧的 dump 文件。
可以尝试挂载并清理：mount -t pstore pstore /sys/fs/pstore 然后删除里面的内容，这样下次崩溃时内核才能写进去。

3. 针对飞牛系统的特别提醒

飞牛（FnOS）底层是基于 Debian/Ubuntu 的。你提到的版本 1.1.26 如果内核较新，而 R720 的 BIOS 较老（2017/2018年的机器），建议去联想官网看下有没有 BIOS 更新。很多时候内核对 ACPI 的处理需要 BIOS 的微码配合，老机器跑新内核经常在这种细节上翻车。

总结建议： 先通过禁用 NVIDIA 显卡驱动观察一个周期（10天+）。如果不再崩溃，基本可以断定是驱动与当前内核的兼容性问题。

一西啊 · 2026-4-14 19:35:35

加入内测组了吗？有新的英伟达驱动更新。你这是之前装的英伟达驱动吧

jipenglin · 2026-4-14 22:38:17

一西啊发表于 2026-4-14 19:35
加入内测组了吗？有新的英伟达驱动更新。你这是之前装的英伟达驱动吧

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 560.28.03             Driver Version: 560.28.03    CUDA Version: 12.6    |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                Persistence-M | Bus-Id       Disp.A | Volatile Uncorr. ECC |
| Fan  Temp Perf       Pwr:Usage/Cap |          Memory-Usage | GPU-Util  Compute M. |
|                                        |                      |             MIG M. |
|=========================================+========================+======================|
| 0  NVIDIA GeForce GTX 1050 Ti    Off | 00000000:01:00.0 Off |                N/A |
| N/A 35C P8          N/A / ERR!  |    0MiB / 4096MiB |    0%    Default |
|                                        |                      |                N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU GI CI       PID Type Process name                            GPU Memory |
|       ID ID                                                             Usage    |
|=========================================================================================|
|  No running processes found                                                          |
+-----------------------------------------------------------------------------------------+

没加内测组，驱动是飞牛商店里面下的，1.0.24
这个是GP107 N17P-G1-A1 （M1050Ti 4G）能用的吗？我听说最新的适配50系的驱动已经不能给10系卡用了？

一西啊 · 2026-4-15 20:05:48

jipenglin 发表于 2026-4-14 22:38
+-----------------------------------------------------------------------------------------+
| NVID ...

英伟达linux支持的版本，支持的显卡就行，飞牛驱动也是英伟达的

		自动登录	找回密码
密码			立即注册

近期开始我的飞牛开始相对频繁的崩溃宕机，求助各位

本帖子中包含更多资源

1. 核心诱因分析

2. 建议的操作步骤

A. 屏蔽 NVIDIA 显卡（首选建议）

B. 调整内核启动参数

C. 内存压力测试 (Memtest86+)

D. 修复 pstore 无法记录日志的问题

3. 针对飞牛系统的特别提醒

点评

点评

fnOS1.0上线纪念勋章

社区共建团荣誉勋章

EVO2产品纪念

AMD适配纪念勋章

飞牛百度网盘玩家