收起左侧

esxi虚拟机安装fnos 内存溢出问题

18
回复
1401
查看
[ 复制链接 ]

1

主题

2

回帖

0

牛值

江湖小虾

2025-1-3 17:02:49 显示全部楼层 阅读模式

设备环境:ESXI6.7虚拟化环境 4G内存+2*CPU

BUG现象:虚拟机启动后,内存占用从2G逐渐升高,一般4-5天之后占满,7天之后系统hang死。重启后恢复。系统资源管理里看,所有进程占用都很小。论坛不止一个用户遇到这个问题,怀疑是内存溢出导致。目前我的解决方法是手动重启系统,如果开发团队暂时无法解决这个问题,可不可以在下一个版本增加一个定时重启系统功能,免去反复手动重启系统的麻烦。感谢!

出现频率:必现

联系方式:71群-轩

收藏
送赞 7
分享

1

主题

2

回帖

0

牛值

江湖小虾

2025-1-3 17:04:48 楼主 显示全部楼层
更新下硬件配置,宿主机是J4125CPU+12GRAM,核显UHD600直通给fnos使用。

2

主题

30

回帖

0

牛值

江湖小虾

2025-1-13 23:33:56 显示全部楼层
这都几个月了 有在跟吗还是这个问题

0

主题

1

回帖

0

牛值

江湖小虾

2025-2-7 15:37:53 显示全部楼层
感觉官方根本不想让用虚拟机安装  这个问题都几个月了  一点进展都没有  没办法只能洗了个脚本内存低了就自动重启

1

主题

2

回帖

0

牛值

江湖小虾

2025-2-11 17:38:46 楼主 显示全部楼层
因为fnos系统下命令行重启有点麻烦,我是用ESXI宿主机定时重启fnos虚拟机:
1、vim-cmd vmsvc/getallvms 获取虚拟机id
2、测试重启虚拟机:vim-cmd vmsvc/power.reset 65(假设我的虚拟机id是65)
3、编写重启脚本,假设放置在根目录:vi /resetfnos.sh
#!/bin/sh
vim-cmd vmsvc/power.reset 65
4、wq保存脚本
5、编写cron任务:/bin/echo “0 19 * * * /resetfnos.sh”  >>  /var/spool/cron/crontabs/root  (建议vi编辑,方便格式对齐)
注意:我设置的是每天凌晨3点重启,但是esxi是UTC时间,所以这里设置的是19
6、查看crond进程pid:cat /var/run/crond.pid
7、杀死crond:kill #pid
8、重启crond:/usr/lib/vmware/busybox/bin/busybox crond

2

主题

30

回帖

0

牛值

江湖小虾

2025-2-14 08:27:49 显示全部楼层
这问题不打算解决了吗

3

主题

3

回帖

0

牛值

江湖小虾

2025-2-20 13:43:03 显示全部楼层
都几个月了这个问题还没解决

4

主题

12

回帖

0

牛值

江湖小虾

2025-2-21 18:45:26 显示全部楼层
我的fnos是在2024年9月份在ESXI 8.0上装的虚拟机,以前一直不存在内存被占用不释放的问题,但在2025年春节前设置了显卡(Intel UHD Graphics)直通给fnos使用,用GPU来处理视频转码。此后就出现了平均3-4天,内存利用率逐步升高到80%-90%的问题,重启各种服务,均无法释放内存。
针对这个现象,我怀疑会不会是显卡驱动存在问题
补充一点,我当时还重装了一次系统,事先直通显卡的话会导致无法正常安装,只有安装完成后,才可以操作直通显卡。  详情 回复
2025-2-23 13:58
听你这么一说好像是这么回事,在直通显卡给fnOS之前,我也并没有遇见过内存泄漏问题。 直通了显卡给fnOS之后,发现内存持续增长,重启docker高占用的容器内存也无法释放。  详情 回复
2025-2-23 13:53
fnosadmin@fnOS-NAS:~$ dmesg | grep UHD dmesg: read kernel buffer failed: Operation not permitted fnosadmin@fnOS-NAS:~$ sudo dmesg | grep UHD [sudo] password for fnosadmin: fnosadmin@fnOS-NAS:~$ sudo  详情 回复
2025-2-21 18:46

4

主题

12

回帖

0

牛值

江湖小虾

2025-2-21 18:46:38 显示全部楼层
fnosadmin@fnOS-NAS:~$ dmesg | grep UHD
dmesg: read kernel buffer failed: Operation not permitted
fnosadmin@fnOS-NAS:~$ sudo dmesg | grep UHD
[sudo] password for fnosadmin:
fnosadmin@fnOS-NAS:~$ sudo dmesg | grep intel
[    0.890601] agpgart-intel 0000:00:00.0: Intel 440BX Chipset
[    0.891100] agpgart-intel 0000:00:00.0: AGP aperture is 256M @ 0x0
[    0.893167] intel_pstate: CPU model not supported
[    4.258832] intel_rapl_msr: PL4 support detected.
[    5.264899] WARNING: CPU: 2 PID: 459 at drivers/gpu/drm/i915/display/intel_display.c:7426 assert_port_valid+0x54/0x70 [i915]
[    5.265087] Modules linked in: openvswitch(E) nsh(E) nf_conncount(E) nf_nat(E) nf_conntrack(E) nf_defrag_ipv6(E) nf_defrag_ipv4(E) rfkill(E) qrtr(E) sunrpc(E) binfmt_misc(E) intel_rapl_msr(E) intel_rapl_common(E) ghash_clmulni_intel(E) sha512_ssse3(E) sha512_generic(E) sha256_ssse3(E) sha1_ssse3(E) aesni_intel(E) libaes(E) crypto_simd(E) cryptd(E) rapl(E) i915(E+) snd_pcsp(E) vmw_balloon(E) snd_pcm(E) drm_buddy(E) snd_timer(E) drm_display_helper(E) cec(E) i2c_algo_bit(E) snd(E) video(E) wmi(E) soundcore(E) ac(E) vmwgfx(E) drm_ttm_helper(E) ttm(E) drm_kms_helper(E) button(E) vmw_vmci(E) sg(E) joydev(E) evdev(E) serio_raw(E) msr(E) bonding(E) drm(E) efi_pstore(E) loop(E) fuse(E) configfs(E) ip_tables(E) x_tables(E) autofs4(E) ext4(E) crc16(E) mbcache(E) jbd2(E) btrfs(E) blake2b_generic(E) efivarfs(E) raid10(E) raid456(E) async_raid6_recov(E) async_memcpy(E) async_pq(E) async_xor(E) async_tx(E) xor(E) raid6_pq(E) libcrc32c(E) crc32c_generic(E) raid0(E) linear(E) hid_generic(E) usbhid(E) hid(E) dm_mod(E) raid1(E)
[    5.265137]  sr_mod(E) cdrom(E) md_mod(E) sd_mod(E) t10_pi(E) crc64_rocksoft(E) crc64(E) crc_t10dif(E) crct10dif_generic(E) crct10dif_pclmul(E) crct10dif_common(E) ata_generic(E) ahci(E) crc32_pclmul(E) uhci_hcd(E) ehci_pci(E) psmouse(E) crc32c_intel(E) ata_piix(E) libahci(E) ehci_hcd(E) vmw_pvscsi(E) libata(E) usbcore(E) scsi_mod(E) vmxnet3(E) usb_common(E) scsi_common(E)
[    5.265880]  ? __pfx_intel_ddi_init+0x10/0x10 [i915]
[    5.266031]  intel_ddi_init+0xcc/0x1030 [i915]
[    5.266171]  ? __pfx_intel_ddi_init+0x10/0x10 [i915]
[    5.266305]  intel_bios_for_each_encoder+0x31/0x50 [i915]
[    5.266463]  intel_setup_outputs+0x37c/0x8a0 [i915]
[    5.266612]  intel_display_driver_probe_nogem+0x148/0x210 [i915]
[    6.948646] BTRFS info (device dm-0): using crc32c (crc32c-intel) checksum algorithm

2

主题

5

回帖

0

牛值

江湖小虾

2025-2-23 13:53:59 显示全部楼层
听你这么一说好像是这么回事,在直通显卡给fnOS之前,我也并没有遇见过内存泄漏问题。

直通了显卡给fnOS之后,发现内存持续增长,重启docker高占用的容器内存也无法释放。
可以做个测试,在ESXI中取消直通显卡,观察一周,看看内存会不会被耗尽。  详情 回复
2025-2-26 20:04

2

主题

5

回帖

0

牛值

江湖小虾

2025-2-23 13:58:03 显示全部楼层
补充一点,我当时还重装了一次系统,事先直通显卡的话会导致无法正常安装,只有安装完成后,才可以操作直通显卡。

0

主题

1

回帖

0

牛值

江湖小虾

2025-2-24 19:39:32 显示全部楼层
曾经在esxi下直通过显卡给fedora上的jellyfin,每天都有大量的i915显卡接口报错,但不影响使用,但是报错记录却一直增加,但是这种记录不会占用内存。飞牛的内核debian应该也是一样的机制

4

主题

12

回帖

0

牛值

江湖小虾

2025-2-26 20:04:54 显示全部楼层
可以做个测试,在ESXI中取消直通显卡,观察一周,看看内存会不会被耗尽。
不用测试了,就是这样的,只要直通核显就会出现这种问题,我的是直通核显给飞牛两三天后必死机,不只是飞牛虚拟机死机,它会导致esxi都不能关机重启,虽然esxi后台还能正常进但是就是无法关机,只能强制断 电才能解  详情 回复
2025-3-29 00:16

1

主题

3

回帖

0

牛值

江湖小虾

2025-3-25 14:47:14 显示全部楼层
一模一样,频繁卡死。

1

主题

2

回帖

0

牛值

江湖小虾

2025-3-28 10:32:44 显示全部楼层
还没有给个解决方案呀

6

主题

32

回帖

0

牛值

初出茅庐

2025-3-28 22:20:22 显示全部楼层
一样,,不知道啥时候能好啊

1

主题

11

回帖

0

牛值

江湖小虾

2025-3-29 00:16:07 显示全部楼层
vlookuptest 发表于 2025-2-26 20:04
可以做个测试,在ESXI中取消直通显卡,观察一周,看看内存会不会被耗尽。

不用测试了,就是这样的,只要直通核显就会出现这种问题,我的是直通核显给飞牛两三天后必死机,不只是飞牛虚拟机死机,它会导致esxi都不能关机重启,虽然esxi后台还能正常进但是就是无法关机,只能强制断 电才能解决,总不能为了这个玩意耗费我的硬盘寿命,出现两次后,就把所有资料和硬盘转移给unraid虚拟机了,目前unraid负责影片的影视存储,核显直通给unraid,在unraid安装emby和jellyfin还有plex使用核显都完美,根本不会出现死机的问题,都已经快一个月没关机了。飞牛不把硬盘的休眠策略改变(进飞牛后台啥也不干就把所有硬盘唤醒)还有虚拟机核显直通死机问题解决,不考虑做主力,只拿来做相册,目前只给了一块sata固态给飞牛,原先相册是在群晖,后来看着飞牛有ai相册了才想着转移过来,没想到有这种死机的问题,现在也懒得在转移过去了,就这样先用着,相册文件夹设置每天备份到unraid的机械盘内

5

主题

5

回帖

0

牛值

江湖小虾

2025-3-30 18:26:03 显示全部楼层
这问题快100年了也没解决,官方根本是不想让你用虚拟机装飞牛
这其实也是优化的问题,和让你用物理机,不让用虚拟机的关系不大,群晖和unraid人家也不是为了让你去装虚拟机使用他们的系统的呀,但是人家的系统运行在虚拟机内是没有任何问题的  详情 回复
2025-3-31 17:55

1

主题

11

回帖

0

牛值

江湖小虾

2025-3-31 17:55:16 显示全部楼层
本帖最后由 w7758 于 2025-3-31 18:03 编辑
皮皮粑粑 发表于 2025-3-30 18:26
这问题快100年了也没解决,官方根本是不想让你用虚拟机装飞牛

我觉得和让你用物理机,不让用虚拟机的关系不大,可能是系统存在bug,没去修复,群晖和unraid人家也不是为了让你去装虚拟机使用他们的系统的呀,但是人家的系统运行在虚拟机内直通核显是不会出现这种问题的,我觉得他们也没有单独针对系统安装到虚拟机直通核显这些去优化过。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则