以下是飞牛应用商店部署的龙虾的死机监控报告
飞牛 fnOS 死机 BUG 报告
报告日期: 2026-04-06
设备型号: fnMU
fnOS 版本: 1.1.26
报告人: 阿飞穆
问题概述
系统频繁死机,每天 2-3 次,死机时完全无响应,必须手动重启或等待看门狗重启。
死机记录
| 日期 |
时间 |
触发条件 |
恢复方式 |
停机时长 |
| 2026-04-04 |
13:00 |
空闲状态 |
手动重启 (14:55) |
~95 分钟 |
| 2026-04-06 |
10:00 |
空闲状态 |
手动重启 (10:23) |
~23 分钟 |
| 2026-04-06 |
15:00 |
空闲状态 |
手动重启 (15:54) |
~54 分钟 |
共同特征:
- 死机前系统处于空闲/待机状态,无高负载任务
- 死机前最后一刻监控日志显示一切正常
- 死机后无任何错误日志(内核 panic、硬件错误等均未记录)
- 死机时系统完全无响应(SSH、Web、本地键盘均无效)
监控日志分析
第一次死机 (2026-04-06 10:00)
[2026-04-06 10:00:01] ✅ Web 服务正常
↓ 日志空白 25 分钟(死机时段)
[2026-04-06 10:25:01] ✅ Web 服务正常(重启后)
第二次死机 (2026-04-06 15:00)
[2026-04-06 15:00:02] ✅ Web 服务正常
↓ 日志空白 55 分钟(死机时段)
[2026-04-06 15:55:01] ✅ Web 服务正常(重启后)
结论: 死机前没有任何异常预兆,系统瞬间失去响应。
系统日志分析
执行 journalctl -b 0 --no-pager | grep -iE "error|fail|warn|panic|hardware" 后:
发现的错误(均为重启后产生,与死机无关):
- Docker DNS 查询超时 - 网络问题
- exim panic log 无法打开 - 邮件服务配置问题
- SMART 硬盘计数变化 - 正常工作的 ECC 校正计数,非故障
未发现:
- ❌ 内核 Panic 日志
- ❌ MCE(机器检查异常)
- ❌ CPU 错误
- ❌ 内存错误
- ❌ 硬件故障日志
硬件环境
| 组件 |
型号/状态 |
| 主板 |
待确认 |
| CPU |
待确认 |
| 内存 |
待确认 |
| 硬盘 |
多块 HDD(SMART 正常) |
| 电源 |
待确认 |
对比测试:
- 同一网络环境下,群晖 NAS 运行稳定
- 同一网络环境下,其他 Linux 系统运行稳定
- 仅飞牛 fnOS 频繁死机
已尝试的解决方案
| 方案 |
结果 |
| BIOS 禁用节能选项 |
❌ 无效,仍然死机 |
| 安装硬件看门狗 |
两次死机,都未能触发 |
| Web 服务监控脚本 |
⚠️ 仅对假死有效,真死机无法处理 |
初步结论
问题定位:飞牛 fnOS 系统级 BUG
证据:
- 死机前无硬件错误预兆
- 死机时内核瞬间锁死,无法写入错误日志
- 同一硬件环境下其他系统正常
- BIOS 设置调整后问题依旧
- 死机触发条件不明确(空闲状态也会发生)
可能原因:
- 内核驱动冲突(网卡/存储控制器?)
- 内存管理 BUG
- 电源管理模块问题
- 文件系统锁死
建议官方排查方向
- 内核日志增强 - 增加 panic 日志持久化配置
- 驱动兼容性测试 - 特别是网卡和存储控制器
- 内存压力测试 - 排查内存管理问题
- 电源管理模块 - 检查 ACPI/C-state 相关代码
- 文件系统锁检测 - 增加死锁检测和日志
临时缓解措施
用户已配置以下自动恢复机制:
-
硬件看门狗 - 60 秒不喂狗自动重启
- 服务:
fnos-watchdog.service
- 超时:60 秒
-
Web 服务监控 - 每 5 分钟检查
- 脚本:
/vol1/@apphome/trim.openclaw/data/workspace/monitor/fnos_auto_restart.sh
- 策略:假死时重启 Web 服务,真死机由看门狗处理
附件
- 监控日志:
/vol1/@apphome/trim.openclaw/data/workspace/monitor/fnos_monitor.log
- 重启历史:
/vol1/@apphome/trim.openclaw/data/workspace/monitor/restart_history.log
- 系统日志:
journalctl -b 0(重启后可见)