收起左侧

近期开始我的飞牛开始相对频繁的崩溃宕机,求助各位

3
回复
56
查看
[ 复制链接 ]

1

主题

5

回帖

0

牛值

江湖小虾

悬赏190飞牛币未解决

最近一段时间,我装在老游戏本上的飞牛开始崩溃次数增多。最开始的半年基本不存在崩溃(当然也存在我频繁更新,单次开机时间都比较短的缘故,即使有崩溃也是不嫌麻烦重启了)最近小半年都是可更可不更的情况,因此单次开机时长都会一二十天往上,也是在最近出现了相对频繁的宕机。

上次卡死前没拍照,重启后日志也没有记录什么,看起来正常,应该是内核挂了,也问了AI,试了查找几条命令也没查出什么来。(有需求可以查看以下AI链接)

https://aistudio.google.com/app/prompts?state=%7B%22ids%22:%5B%221Ap1WQ5Cygz_-w6BWHKdTPt9ssbWAuPXP%22%5D,%22action%22:%22open%22,%22userId%22:%22113644052824312169589%22,%22resourceKeys%22:%7B%7D%7D&usp=sharing, https://drive.google.com/file/d/1B8JWWKsWjImmc0oX4Tw7fVPlqd1wAjtH/view?usp=sharing, https://drive.google.com/file/d/1_eQrghfCYjVNKmInn7NcJBIVm80aCLly/view?usp=sharing

  • 物理机:拯救者R720 i5 7300HQ 16G DDR4 2400 GTX 1050Ti
  • 系统版本:1.1.26

这次强制重启也没记录日志,但我提前留了照片

image.png

这次同样问了AI,依旧一无所获

https://chatgpt.com/share/69ddaafe-8020-839b-96d2-780084bb0cc2

如果可以的话希望各位大佬,可以帮我指点一下,我会尽可能提供我能提供的操作,感谢!

附件: 您需要 登录 才可以下载或查看,没有账号?立即注册
收藏
送赞
分享

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

14

主题

39

回帖

0

牛值

初出茅庐

我觉得AI分析的很清楚,你参考下:

看到你提供的信息和照片,这确实是一个非常典型的 Linux Kernel Panic(内核恐慌)。照片底部的 Fatal exception in interrupt(中断处理中的致命异常)和 page_fault_oops(页错误)指出了问题的核心:内核在处理硬件中断或系统调度时,试图访问一个非法的内存地址。

根据你描述的“半年内基本没问题”到“开机时间长了就崩溃”,结合 R720 这款老机器的硬件特性,我为你梳理了排查思路:

1. 核心诱因分析

从崩溃堆栈看,涉及到了 nvidia_uvmnvidia 驱动模块。

  • 显卡驱动与功耗管理: 老款笔记本(GTX 1050Ti)作为 NAS 使用时,如果显卡长时间处于低功耗/休眠状态,或者内核更新后与老旧的 NVIDIA 驱动不兼容,极易在中断切换时导致 page_fault
  • 内存老化/压力: 你提到的 16G DDR4 2400。当系统运行 10-20 天后,由于 Docker 容器(如 Immich、Jellyfin 等)频繁读写交换内存,如果某条内存颗粒在高位地址存在不稳定性,就会触发这种随机的崩溃。
  • pstore 报错: 日志中显示 pstore: backend (efi_pstore) writing error (-28),这说明内核想把崩溃日志存入主板 NVRAM 时失败了(通常是空间满了)。这解释了为什么你重启后查不到日志。

2. 建议的操作步骤

A. 屏蔽 NVIDIA 显卡(首选建议)

既然是作为飞牛 NAS 使用,除非你依赖这块 1050Ti 进行 Jellyfin 硬件转码,否则建议在 BIOS 中彻底禁用显卡,或在系统中将其黑名单化。

  • 理由: 显卡驱动是 Linux 内核不稳定的最大来源之一。
  • 操作: 尝试在 /etc/modprobe.d/ 中加入黑名单,或者在飞牛的设置中确认是否开启了不必要的 GPU 任务。

B. 调整内核启动参数

针对老旧笔记本的电源管理问题,可以在 GRUB 中尝试添加以下参数来提高稳定性:

  1. 编辑配置文件:sudo nano /etc/default/grub
  2. GRUB_CMDLINE_LINUX_DEFAULT 中加入: intel_idle.max_cstate=1 pcie_aspm=off
  3. 更新 GRUB:sudo update-grub
  • 目的: 防止 CPU 或 PCIe 设备进入过深的省电模式导致唤醒时心跳丢失或中断异常。

C. 内存压力测试 (Memtest86+)

鉴于你提到的“运行久了才崩”,这符合硬件疲劳或特定内存地址受损的特征。

  • 建议制作一个启动 U 盘运行 Memtest86+,至少跑满 2 个 Pass。
  • 如果是双条内存,可以尝试拔掉一根交叉运行测试。

D. 修复 pstore 无法记录日志的问题

为了下次能看到重启后的日志,你需要清理 EFI 存储空间:

  • 执行 ls /sys/fs/pstore/ 查看是否有旧的 dump 文件。
  • 可以尝试挂载并清理:mount -t pstore pstore /sys/fs/pstore 然后删除里面的内容,这样下次崩溃时内核才能写进去。

3. 针对飞牛系统的特别提醒

飞牛(FnOS)底层是基于 Debian/Ubuntu 的。你提到的版本 1.1.26 如果内核较新,而 R720 的 BIOS 较老(2017/2018年的机器),建议去联想官网看下有没有 BIOS 更新。很多时候内核对 ACPI 的处理需要 BIOS 的微码配合,老机器跑新内核经常在这种细节上翻车。

总结建议: 先通过禁用 NVIDIA 显卡驱动观察一个周期(10天+)。如果不再崩溃,基本可以断定是驱动与当前内核的兼容性问题。

2

主题

2492

回帖

630

牛值

共建版主

fnOS1.0上线纪念勋章社区共建团荣誉勋章EVO2产品纪念

昨天 19:35 显示全部楼层
加入内测组了吗?有新的英伟达驱动更新。你这是之前装的英伟达驱动吧
+-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 560.28.03 Driver Version: 560.28.03 CUDA Version: 12.6 | |---------------  详情 回复
昨天 22:38

1

主题

5

回帖

0

牛值

江湖小虾

昨天 22:38 楼主 显示全部楼层
一西啊 发表于 2026-4-14 19:35
加入内测组了吗?有新的英伟达驱动更新。你这是之前装的英伟达驱动吧

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 560.28.03              Driver Version: 560.28.03      CUDA Version: 12.6     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce GTX 1050 Ti     Off |   00000000:01:00.0 Off |                  N/A |
| N/A   35C    P8             N/A / ERR!  |       0MiB /   4096MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

没加内测组,驱动是飞牛商店里面下的,1.0.24
这个是GP107 N17P-G1-A1 (M1050Ti 4G)能用的吗?我听说最新的适配50系的驱动已经不能给10系卡用了?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则