收起左侧

零刻ME mini N200 黑屏宕机重启问题

2
回复
157
查看
[ 复制链接 ]

1

主题

2

回帖

0

牛值

江湖小虾

2025-10-13 16:43:28 显示全部楼层 阅读模式

设备环境:虚拟机, 局域网, 系统版本 FNOS 0.9.29, 未使用移动端; 配置: 零刻官方随机附赠的2T固态一根(型号: CT2000P3PSSD8), 自己购买的5根 (型号: KIOXIA-EXCERIA PLUS G3 SSD)

BUG现象:

  1. FNOS一开始是安装在物理机上的, 系统应用仅安装了百度网盘, 飞牛同步, 文件快照, 但是未作配置和使用; 开启了了SSH服务, SMB共享(强制加密)和docker服务, docker上挂了几个数据库和redis服务; 其他主机通过局域网访问FNOS上的文件和数据库;就这么运行着一两天后系统莫名黑屏(用HDMI线缆接屏幕)按键盘没反应; 系统不断重启键盘操作没有反应, 偶尔能进入系统, 但会迅速重启, 来不及做任何操作;
  2. 上述问题折腾无果后无奈安装了PVE 8.4.14系统到通过USB外接的SATA固态上; PVE开启直通emmc和固态给虚拟机, 虚拟机上安装了FNOS, CPU为host模式, 内存8G, 另外虚拟了一块硬盘通过dd命令给emmc做冷备份;FNOS的系统服务配置参考BUG现象1中的配置; FNOS虚拟化后就开放其他主机的服务访问SMB共享和docker服务; 一夜后FNOS再次黑屏, PVE也黑屏阵亡了;
  3. PVE黑屏后可以进入BIOS设置重启, 重启后PVE系统正常, FNOS虚拟机重启后能够正常进入系统, 为了排查问题对 emmc 进行镜像, 期间发现CPU负载超过60% - 70%时网卡会出现断流的情况无法通过SSH完成dd备份; 无奈通过PVE的VNC进入FNOS的tty1控制台进行备份, 期间在tty2查看内核日志有网卡重启的情况, 见下图; 然后FNOS再次黑屏关机, 万幸PVE没有宕机;
    FNOS问题.png
  4. 重试多次dd备份后几乎必定触发黑屏关机的情况, 期间外部主机也都停止访问FNOS共享的SMB服务和docker服务, 直到发帖前才完成一次dd备份, 无奈只能在社区发帖求助, 请项目组帮忙排查问题! 谢谢!
  5. 补充信息: 原本以为是主机的电源功率不够, 但是通过智能插座查看, 电源功率最高不超过20w, 一般稳定在15w左右

出现频率:必现

联系方式:
mmqrcode1760344263216.png

日志文件:https://pan.baidu.com/s/1T58Mvmxm2TqGQyGY3gO6UQ?pwd=akxu 提取码: akxu

收藏
送赞
分享

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

1

主题

2

回帖

0

牛值

江湖小虾

4 天前 楼主 显示全部楼层

补充信息:今天使用PVE虚拟机运行FNOS运行一段时间后宿主机突然死机重启,之后再多次启动都会导致宿主机死机重启,问题排查期间发现上述遗漏了PVE直通了一个物理网卡给FNOS,现在移除直通网卡,挂载虚拟网卡后FNOS可以正常启动.

1

主题

2

回帖

0

牛值

江湖小虾

昨天 14:07 楼主 显示全部楼层

问题更新: 宕机问题似乎解决了?
这两天把系统从PVE8升级到PVE9.0.11, 期间虽然在PVE的控制台内核日志中仍会出现下面的日志

Oct 25 01:29:30 PM-N200-PVE kernel: perf: interrupt took too long (2522 > 2500), lowering kernel.perf_event_max_sample_rate to 79000
Oct 25 01:34:40 PM-N200-PVE kernel: perf: interrupt took too long (3186 > 3152), lowering kernel.perf_event_max_sample_rate to 62000
Oct 25 01:41:51 PM-N200-PVE kernel: perf: interrupt took too long (4190 > 3982), lowering kernel.perf_event_max_sample_rate to 47000
Oct 25 01:53:32 PM-N200-PVE kernel: perf: interrupt took too long (5458 > 5237), lowering kernel.perf_event_max_sample_rate to 36000
Oct 25 02:51:03 PM-N200-PVE kernel: perf: interrupt took too long (6901 > 6822), lowering kernel.perf_event_max_sample_rate to 28000

但是FNOS虚拟机中再没有出现过像之前那样网卡断连的现象.
所以问题似乎是解决了?
再观察几天吧....

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则