相册AI人脸识别模型不支持FP16和INT8，实质不支持P4等推理显卡

pkoko · 2026-1-5 15:47:38

FP

NAS（飞牛OS 1.1.8）最近加了一块专门的AI推理显卡tesla P4，指望人脸识别的速度能提高。安装后表面看都正常：驱动安装成功，AI相册启用GPU正常。但经过测试发现效果很差（几乎没有效果），分析飞牛人脸识别的相关文件，发现目前的模型仅针对FP32进行了配置和优化。没有对FP16,INT8的支持和优化。

恳请官方支持FP16,INT8等模型，以支持这些推理卡。或大佬们又没好的解决办法？

1、对比测试

机器A：(pve虚拟机) AMD1700X + 8GRAM +1070TI（显存8G）（直通），人脸识别很快，约1小时1万张图片

机器B ：E52680V4 + 16GRAM + tesla P4 （显存 8G），人脸识别很慢，约1小时2.5K张。约为机器A的四分之一

机器A（1070Ti）识别时，GPU的使用情况：

机器B（tesla P4）识别时，GPU的使用情况

从对比看，大部分时间P4根本没有工作

2、查看AI人脸识别配置文件中，全是FP32的配置项，没找到FP16,INT8的配置项

-rw-rw---- 1 admin Users 167724 Jul 3 2025 det.xml
-rw-rw---- 1 admin Users 88922 Jul 3 2025 genderage.xml
-rw-rw---- 1 admin Users 200093 Jul 3 2025 rec.xml

3、1070TI和P4主要技术参数对比。由于人脸识别模型不支持FP16,INT8，因此P4无法发挥任何功能，更谈不上优势。

pkoko · 2026-1-6 14:24:10

借助DeepSeek分析了一下（分析过程较长，略），它给出的结论是，“这仅是CPU推理，没使用P4”，这跟观察的现象一致。

驱动安装正常，GPU启动看起来也是成功的，但实际上GPU并未发挥作用。这就极具迷惑性！！！

pkoko · 2026-1-7 18:07:29

在nas上安装了下面的包：

自己写了个脚本，进行基础GPU算力与带宽测试，测试结果如下：

测试过程中，GPU利用率曲线，可以看到GPU利用率直接干道100%

pkoko · 2026-1-7 18:11:06

再写一个脚本，进行BERT推理性能测试，模型采用FP16：

测试过程输出：

测试过程中GPU使用率完全可以达到100%

pkoko · 2026-1-7 18:22:07

BERT推理性能测试，模型采用FP32：

测试过程中GPU使用率，一样可以到100%左右

pkoko · 2026-1-7 18:26:35

综上，可以确认目前的版本，人脸识别压根就没有调用tesla P4的GPU能力（FNOS 1.1.8，人脸识别标准模型 V1.0.1）。

跟硬件，驱动啥的无关，就是应用（ai_manager)没调用GPU，或模型不支持。(tesla P4是支持FP32,FP16,INT8的。FP32性能不及FP16,INT8）。

飞牛的人脸识别只要支持其一即可。

pkoko · 2026-1-9 10:44:22

版本升级到1.1.11（已按提示重新安装了560驱动），该问题依然存在，人脸识别还是无法调用TESLA P4 GPU，没有解决

mufengjun260 · 2026-1-10 10:14:11

图片.png

顶顶，测试了下视频增强识别，我的P4也有同样的问题

piupiu · 2026-1-10 20:43:38

飞牛相册的AI识别据我观察是针对IU特别优化的，CPU是推理主力，调用核显来辅助，核显负载相当稳定，不会像独显那样负载坐过山车。

N卡我之前试过几张计算卡也没负载，当时还试了张1060倒是能跑

pkoko · 2026-1-11 20:47:40

piupiu 发表于 2026-1-10 20:43
飞牛相册的AI识别据我观察是针对IU特别优化的，CPU是推理主力，调用核显来辅助，核显负载相当稳定，不会像 ...

1、宣称是支持N卡的啊，如果真不支持，或部分支持，需要在版本说明中讲清楚。不然这样就有点尴尬
2、我看了下人脸识别的模型，其实有两种，一种适用于IU，另一个是onnx，推测这个onnx应该是支持N卡的。估计是人脸识别应用调用这个模型有问题。

pkoko · 2026-2-24 09:59:55

版本升级到1.1.20，该问题依然存在，人脸识别还是无法成功调用TESLA P4 GPU.

木各x · 2026-2-26 13:49:40

我刚买的这个显卡，打算用来识别相册，官方也不出来解释一下

pkoko · 2026-2-27 11:39:44

木各x 发表于 2026-2-26 13:49
我刚买的这个显卡，打算用来识别相册，官方也不出来解释一下

买前没看论坛，坑阿。。。

pkoko · 2026-2-27 16:04:45

版本升级到1.1.23，该问题依然存在，人脸识别还是无法成功调用TESLA P4 GPU.

bbccbbc · 2026-4-28 12:24:30

顶一下，现在市场连驱动都看不到了

pkoko · 2026-4-28 15:11:54

bbccbbc 发表于 2026-4-28 12:24
顶一下，现在市场连驱动都看不到了

驱动可以到nvidia官网下载，然后手动安装

mufengjun260 · 2026-4-29 11:19:13

1.1.30更新后，问题仍然存在，P4无负载

windy9275 · 2026-4-29 16:10:02

我刚升级了1.1.30，似乎是可以正常调用P4的

pkoko · 2026-4-30 11:14:36

windy9275 发表于 2026-4-29 16:10
我刚升级了1.1.30，似乎是可以正常调用P4的

可能优化了，请问你的CPU，RAM配置如何？

windy9275 · 2026-4-30 15:47:38

[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=287122&ptid=49951][color=#999999]pkoko 发表于 2026-4-30 11:14[/color][/url][/size] 可能优化了，请问你的CPU，RAM配置如何？[/quote]

配置是这样的

锁头x · 2026-5-6 02:53:41

2026年5月5日，我在DeepSeek的帮助下，通过SS安装了驱动，显示正常，但是AI人脸识别特别慢，问

DeepSeek后被告知是TeslaP4在假努力。我是听信了豆包的推荐才买的TeslaP4.

屏幕截图2026-05-06025154.png

pkoko · 2026-5-6 17:34:21

锁头x 发表于 2026-5-6 02:53
2026年5月5日，我在DeepSeek的帮助下，通过SS安装了驱动，显示正常，但是AI人脸识别特别慢，问
DeepSeek后 ...

以我这几个月持续跟踪尝试经验看: 大概率是你的CPU主频低，更换高主频（核不需很多，8核足已）CPU，立竿见影！

逗包 · 2026-5-13 11:46:43

windy9275 发表于 2026-4-29 16:10
我刚升级了1.1.30，似乎是可以正常调用P4的

同CC150，请问人脸识别速度如何？每小时能识别2k张以上吗？

逗包 · 2026-5-13 11:50:58

pkoko 发表于 2026-5-6 17:34
以我这几个月持续跟踪尝试经验看: 大概率是你的CPU主频低，更换高主频（核不需很多，8核足已）CPU，立竿 ...

我也是持续观察了一阵，但是楼主的机器B是 E5-2680 v4 14核 / 28线程，基础频率2.5睿频3.3，按理说应该和CC150的8核 / 16线程固定3.5GHz相比，应该差不多吧

pkoko · 2026-5-14 10:34:43

逗包发表于 2026-5-13 11:50
我也是持续观察了一阵，但是楼主的机器B是 E5-2680 v4 14核 / 28线程，基础频率2.5睿频3.3，按理说应该 ...

我仔细观察过，我的机器主要慢在图片的预处理环节，特别是图上有多个人脸的场景，软件要先从图片上截取出单个人脸。这个截取单个人脸的过程，目前飞牛的软件是CPU完成，未调用GPU，且基本也未调用CPU的多核。详见案例，与之对比的是immich软件，用同样的硬件（还是飞牛虚拟机装的immich），预处理环节极快，多用了多核，和GPU

windy9275 · 2026-5-15 16:48:16

逗包发表于 2026-5-13 11:46
同CC150，请问人脸识别速度如何？每小时能识别2k张以上吗？

太小看它了啊，我3w多张照片也是一个小时内识别完的

pkoko · 2026-5-25 11:09:54

[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=292108&ptid=49951][color=#999999]pkoko 发表于 2026-5-14 10:34[/color][/url][/size] 我仔细观察过，我的机器主要慢在图片的预处理环节，特别是图上有多个人脸的场景，软件要先从图片上截取出 ...[/quote]

下面是AI给出的答案，供参考

逗包 · 2026-5-26 09:33:25

pkoko 发表于 2026-5-25 11:09
下面是AI给出的答案，供参考

我配置也是CC150+8G×2双通道，物理机。原来用丽台P600，人脸识别很慢，以为是显存太小。换了Tesla P4之后，智能识别部分提升明显，能达到每小时3万张左右。
但人脸识别依旧慢，每天只能跑3万张（相当于2-3秒一张）。CPU利用率只有5-6%，显存占用600MB+，GPU利用率基本是“假努力”状态。
完全没达到帖子里另一位CC150+P4的兄弟每小时3万张的速度……
有时间我补个图。

		自动登录	找回密码
密码			立即注册

相册AI人脸识别模型不支持FP16和INT8，实质不支持P4等推理显卡

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

点评

点评

点评

本帖子中包含更多资源

本帖子中包含更多资源

点评

点评

本帖子中包含更多资源

本帖子中包含更多资源

点评

点评

点评

点评

点评

本帖子中包含更多资源

点评

fnOS1.0上线纪念勋章

飞牛百度网盘玩家

AMD适配纪念勋章