收起左侧

关于远程挂载SMB外部访问会导致的OOM问题反馈

1
回复
52
查看
[ 复制链接 ]

1

主题

1

回帖

0

牛值

江湖小虾

系统版本:X86 虚拟机,fnOS v1.1.3107,内核 Linux 6.18.18-trim

设备环境:
ESXi 虚拟机环境。宿主机为 VMware ESXi 8.0.3,虚机名称 fnOS2,虚机 IP 为 192.168.31.144。该 fnOS 虚机主要作为应用服务入口使用,本机不承担实际存储功能,数据目录通过局域网 CIFS/SMB 挂载远程 NAS 共享目录。当前环境为局域网访问,非公网、非反代、非 P2P。
虚机配置约为 8 vCPU、8GB 内存,并挂载多个远程 CIFS 目录,例如 /vol02/1000-0-91f78dcb、/vol02/1000-0-2fc151ff、/vol02/1000-0-0245b193。媒体库、缩略图、trim-media 等服务正常启用。

BUG现象:
fnOS 虚机在连续运行约 14 天后,出现 Web、媒体、Samba/文件相关服务完全无法访问的情况。
当时从客户端访问 fnOS 服务无响应,后续在 ESXi 控制台手动对虚机执行关机/开机后恢复。因此 2026-06-14 18:11-18:12 左右的 PowerOff/PowerOn 是人工恢复操作,不是问题根因。

排查后发现,真正异常发生在 2026-06-14 17:48:30 左右。系统日志中出现 OOM 记录,内核杀死了 nmbd 和 trim-media 相关进程。关键日志如下:

2026-06-14T17:48:30 core kernel: Mem-Info:
2026-06-14T17:48:30 core kernel: slab_reclaimable:9192 slab_unreclaimable:413815
2026-06-14T17:48:30 core kernel: Free swap  = 2440384kB
2026-06-14T17:48:30 core kernel: Total swap = 4194300kB
2026-06-14T17:48:30 core kernel: cifs_request 958KB 958KB
2026-06-14T17:48:30 core kernel: oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=mediasrv.service,mems_allowed=0,global_oom,task_memcg=/system.slice/nmbd.service,task=nmbd,pid=1529,uid=0
2026-06-14T17:48:30 core kernel: Out of memory: Killed process 1529 (nmbd) total-vm:392860kB, anon-rss:408kB, file-rss:2244kB, shmem-rss:0kB, UID:0 pgtables:756kB oom_score_adj:0
2026-06-14T17:48:30 core kernel: systemd invoked oom-killer
2026-06-14T17:48:30 core kernel: oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=init.scope,mems_allowed=0,global_oom,task_memcg=/system.slice/trim_app_center.service,task=trim-media,pid=3619324,uid=0

同时,重启/恢复阶段 cloud_storage_dav 有远程挂载卸载失败记录:

time="2026-06-14T18:08:45+08:00" level=error msg="All unmount attempts failed for: /vol02/1000-0-2fc151ff"
time="2026-06-14T18:08:45+08:00" level=error msg="All unmount attempts failed for: /vol02/1000-0-0245b193"
time="2026-06-14T18:08:45+08:00" level=error msg="All unmount attempts failed for: /vol02/1000-0-91f78dcb"

初步怀疑:
在长期挂载远程 CIFS/SMB 目录,并开启媒体库扫描、缩略图、trim-media 等服务的情况下,可能存在内核 slab 不可回收内存持续增长或 CIFS/文件服务资源堆积的问题,最终触发 OOM,导致 fnOS 服务不可访问。
OOM 时普通用户态进程 RSS 并不明显异常,但 slab_unreclaimable 约 413815 页,折算约 1.6GB,不可回收内核内存偏高。

希望官方协助确认:

  1. fnOS 在 CIFS/SMB 远程目录长期挂载并被媒体库/缩略图/trim-media 扫描时,是否有已知内存泄漏或 slab 增长问题。
  2. cloud_storage_dav 远程挂载卸载失败是否可能导致资源堆积。
  3. 是否有推荐的 CIFS 挂载参数或 fnOS 设置方式,适合“fnOS 只作为应用入口,数据全部在远程 SMB 共享”的场景。
  4. 是否建议在系统中增加远程挂载异常、slab 异常、媒体扫描异常的监控或自动恢复机制。

出现频率:
目前表现为运行一段时间后出现,最近一次约连续运行 14 天后复现。不是每次启动立即必现,属于周期性/长时间运行后复现。

联系方式:
可留空或填写:你的手机号 / 粉丝群昵称

日志文件:
已整理本地日志与分析报告,可作为附件上传:
fnOS2-OOM问题反馈报告.md
另外建议同步上传系统诊断日志:进入“日志应用 - 更多 - 系统诊断日志”导出后上传社区。

收藏
送赞
分享

感谢反馈!这个场景涉及远程 SMB 挂载、媒体扫描和内核 OOM,我先转给相关技术同学看看。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则