收起左侧

相册AI人脸识别模型不支持FP16和INT8,实质不支持P4等推理显卡

27
回复
1708
查看
[ 复制链接 ]

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-5 15:47:38 显示全部楼层 阅读模式
悬赏1飞牛币未解决

FP

NAS(飞牛OS 1.1.8)最近加了一块专门的AI推理显卡tesla P4,指望人脸识别的速度能提高。安装后表面看都正常:驱动安装成功,AI相册启用GPU正常。但经过测试发现效果很差(几乎没有效果),分析飞牛人脸识别的相关文件,发现目前的模型仅针对FP32进行了配置和优化。没有对FP16,INT8的支持和优化。

恳请官方支持FP16,INT8等模型,以支持这些推理卡。或大佬们又没好的解决办法?

1、对比测试

机器A:(pve虚拟机) AMD1700X + 8GRAM +1070TI(显存8G)(直通),人脸识别很快,约1小时1万张图片

机器B :E52680V4 + 16GRAM + tesla P4 (显存 8G),人脸识别很慢,约1小时2.5K张。约为机器A的四分之一

机器A(1070Ti)识别时,GPU的使用情况:

image.png

机器B(tesla P4)识别时,GPU的使用情况

image.png

从对比看,大部分时间P4根本没有工作

2、查看AI人脸识别配置文件中,全是FP32的配置项,没找到FP16,INT8的配置项

-rw-rw---- 1 admin Users 167724 Jul 3 2025 det.xml
-rw-rw---- 1 admin Users 88922 Jul 3 2025 genderage.xml
-rw-rw---- 1 admin Users 200093 Jul 3 2025 rec.xml

3、1070TI和P4主要技术参数对比。由于人脸识别模型不支持FP16,INT8,因此P4无法发挥任何功能,更谈不上优势。

image.png

附件: 您需要 登录 才可以下载或查看,没有账号?立即注册
收藏
送赞 4
分享

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-6 14:24:10 楼主 显示全部楼层

借助DeepSeek分析了一下(分析过程较长,略),它给出的结论是,“这仅是CPU推理,没使用P4”,这跟观察的现象一致。

image.png

驱动安装正常,GPU启动看起来也是成功的,但实际上GPU并未发挥作用。这就极具迷惑性!!!

image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-7 18:07:29 楼主 显示全部楼层

在nas上安装了下面的包:

image.png

自己写了个脚本,进行基础GPU算力与带宽测试,测试结果如下:

image.png

测试过程中,GPU利用率曲线,可以看到GPU利用率直接干道100%

image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-7 18:11:06 楼主 显示全部楼层

再写一个脚本,进行BERT推理性能测试,模型采用FP16:

测试过程输出:

image.png

测试过程中GPU使用率完全可以达到100%

image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-7 18:22:07 楼主 显示全部楼层

BERT推理性能测试,模型采用FP32:

image.png

测试过程中GPU使用率,一样可以到100%左右

image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-7 18:26:35 楼主 显示全部楼层

综上,可以确认目前的版本,人脸识别压根就没有调用tesla P4的GPU能力(FNOS 1.1.8, 人脸识别标准模型 V1.0.1)。

跟硬件,驱动啥的无关,就是应用(ai_manager)没调用GPU,或模型不支持。(tesla P4是支持FP32,FP16,INT8的。FP32性能不及FP16,INT8)。

飞牛的人脸识别只要支持其一即可。

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-9 10:44:22 楼主 显示全部楼层

版本升级到1.1.11(已按提示重新安装了560驱动),该问题依然存在,人脸识别还是无法调用TESLA P4 GPU,没有解决

image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

2

主题

6

回帖

0

牛值

系统先锋体验团🛩️

2026-1-10 10:14:11 显示全部楼层

图片.png

顶顶,测试了下视频增强识别,我的P4也有同样的问题

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

3

主题

39

回帖

0

牛值

fnOS系统内测组

fnOS1.0上线纪念勋章飞牛百度网盘玩家AMD适配纪念勋章

2026-1-10 20:43:38 显示全部楼层

飞牛相册的AI识别据我观察是针对IU特别优化的,CPU是推理主力,调用核显来辅助,核显负载相当稳定,不会像独显那样负载坐过山车。

N卡我之前试过几张计算卡也没负载,当时还试了张1060倒是能跑

1、宣称是支持N卡的啊,如果真不支持,或部分支持,需要在版本说明中讲清楚。不然这样就有点尴尬 2、我看了下人脸识别的模型,其实有两种,一种使用于IU,另一个是onnx,推测这个onnx应该是支持N卡的。估计是人脸识  详情 回复
2026-1-11 20:47

4

主题

78

回帖

0

牛值

初出茅庐

2026-1-11 20:47:40 楼主 显示全部楼层
piupiu 发表于 2026-1-10 20:43
飞牛相册的AI识别据我观察是针对IU特别优化的,CPU是推理主力,调用核显来辅助,核显负载相当稳定,不会像 ...

1、宣称是支持N卡的啊,如果真不支持,或部分支持,需要在版本说明中讲清楚。不然这样就有点尴尬
2、我看了下人脸识别的模型,其实有两种,一种适用于IU,另一个是onnx,推测这个onnx应该是支持N卡的。估计是人脸识别应用调用这个模型有问题。

4

主题

78

回帖

0

牛值

初出茅庐

2026-2-24 09:59:55 楼主 显示全部楼层

版本升级到1.1.20,该问题依然存在,人脸识别还是无法成功调用TESLA P4 GPU.

5

主题

13

回帖

0

牛值

江湖小虾

2026-2-26 13:49:40 显示全部楼层
我刚买的这个显卡,打算用来识别相册,官方也不出来解释一下
买前没看论坛,坑阿。。。  详情 回复
2026-2-27 11:39

4

主题

78

回帖

0

牛值

初出茅庐

2026-2-27 11:39:44 楼主 显示全部楼层
木各x 发表于 2026-2-26 13:49
我刚买的这个显卡,打算用来识别相册,官方也不出来解释一下

买前没看论坛,坑阿。。。

4

主题

78

回帖

0

牛值

初出茅庐

2026-2-27 16:04:45 楼主 显示全部楼层
版本升级到1.1.23,该问题依然存在,人脸识别还是无法成功调用TESLA P4 GPU.

1

主题

3

回帖

0

牛值

江湖小虾

2026-4-28 12:24:30 显示全部楼层

顶一下,现在市场连驱动都看不到了

驱动可以到nvidia官网下载,然后手动安装  详情 回复
2026-4-28 15:11

4

主题

78

回帖

0

牛值

初出茅庐

2026-4-28 15:11:54 楼主 显示全部楼层
bbccbbc 发表于 2026-4-28 12:24
顶一下,现在市场连驱动都看不到了

驱动可以到nvidia官网下载,然后手动安装

2

主题

6

回帖

0

牛值

系统先锋体验团🛩️

2026-4-29 11:19:13 显示全部楼层

1.1.30更新后,问题仍然存在,P4无负载
image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

1

主题

16

回帖

0

牛值

江湖小虾

2026-4-29 16:10:02 显示全部楼层

我刚升级了1.1.30,似乎是可以正常调用P4的

image.png

image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
同CC150,请问人脸识别速度如何?每小时能识别2k张以上吗?  详情 回复
2026-5-13 11:46
可能优化了,请问你的CPU,RAM配置如何?  详情 回复
2026-4-30 11:14

4

主题

78

回帖

0

牛值

初出茅庐

2026-4-30 11:14:36 楼主 显示全部楼层
windy9275 发表于 2026-4-29 16:10
我刚升级了1.1.30,似乎是可以正常调用P4的

可能优化了,请问你的CPU,RAM配置如何?
配置是这样的  详情 回复
2026-4-30 15:47

1

主题

16

回帖

0

牛值

江湖小虾

2026-4-30 15:47:38 显示全部楼层
[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=287122&ptid=49951][color=#999999]pkoko 发表于 2026-4-30 11:14[/color][/url][/size] 可能优化了,请问你的CPU,RAM配置如何?[/quote]

image.png

配置是这样的

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

1

主题

1

回帖

0

牛值

江湖小虾

2026-5-6 02:53:41 显示全部楼层

2026年5月5日,我在DeepSeek的帮助下,通过SS安装了驱动,显示正常,但是AI人脸识别特别慢,问

DeepSeek后被告知是TeslaP4在假努力。我是听信了豆包的推荐才买的TeslaP4.

屏幕截图2026-05-06025154.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
以我这几个月持续跟踪尝试经验看: 大概率是你的CPU主频低,更换高主频(核不需很多,8核足已)CPU,立竿见影!  详情 回复
2026-5-6 17:34

4

主题

78

回帖

0

牛值

初出茅庐

2026-5-6 17:34:21 楼主 显示全部楼层
锁头x 发表于 2026-5-6 02:53
2026年5月5日,我在DeepSeek的帮助下,通过SS安装了驱动,显示正常,但是AI人脸识别特别慢,问
DeepSeek后 ...

以我这几个月持续跟踪尝试经验看: 大概率是你的CPU主频低,更换高主频(核不需很多,8核足已)CPU,立竿见影!
我也是持续观察了一阵,但是楼主的机器B是 E5-2680 v4 14核 / 28线程,基础频率2.5睿频3.3,按理说应该和CC150的8核 / 16线程 固定3.5GHz相比,应该差不多吧  详情 回复
2026-5-13 11:50

1

主题

4

回帖

0

牛值

江湖小虾

2026-5-13 11:46:43 显示全部楼层
windy9275 发表于 2026-4-29 16:10
我刚升级了1.1.30,似乎是可以正常调用P4的

同CC150,请问人脸识别速度如何?每小时能识别2k张以上吗?
太小看它了啊,我3w多张照片也是一个小时内识别完的  详情 回复
2026-5-15 16:48

1

主题

4

回帖

0

牛值

江湖小虾

2026-5-13 11:50:58 显示全部楼层
pkoko 发表于 2026-5-6 17:34
以我这几个月持续跟踪尝试经验看: 大概率是你的CPU主频低,更换高主频(核不需很多,8核足已)CPU,立竿 ...

我也是持续观察了一阵,但是楼主的机器B是 E5-2680 v4  14核 / 28线程,基础频率2.5睿频3.3,按理说应该和CC150的8核 / 16线程 固定3.5GHz相比,应该差不多吧
我仔细观察过,我的机器主要慢在图片的预处理环节,特别是图上有多个人脸的场景,软件要先从图片上截取出单个人脸。这个截取单个人脸的过程,目前飞牛的软件是CPU完成,未调用GPU,且基本也未调用CPU的多核。详见 案  详情 回复
2026-5-14 10:34

4

主题

78

回帖

0

牛值

初出茅庐

2026-5-14 10:34:43 楼主 显示全部楼层
逗包 发表于 2026-5-13 11:50
我也是持续观察了一阵,但是楼主的机器B是 E5-2680 v4  14核 / 28线程,基础频率2.5睿频3.3,按理说应该 ...

我仔细观察过,我的机器主要慢在图片的预处理环节,特别是图上有多个人脸的场景,软件要先从图片上截取出单个人脸。这个截取单个人脸的过程,目前飞牛的软件是CPU完成,未调用GPU,且基本也未调用CPU的多核。详见 案例,与之对比的是immich软件,用同样的硬件(还是飞牛虚拟机装的immich),预处理环节极快,多用了多核,和GPU
下面是AI给出的答案,供参考  详情 回复
5 天前

1

主题

16

回帖

0

牛值

江湖小虾

2026-5-15 16:48:16 显示全部楼层
逗包 发表于 2026-5-13 11:46
同CC150,请问人脸识别速度如何?每小时能识别2k张以上吗?

太小看它了啊,我3w多张照片也是一个小时内识别完的

4

主题

78

回帖

0

牛值

初出茅庐

5 天前 楼主 显示全部楼层
[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=292108&ptid=49951][color=#999999]pkoko 发表于 2026-5-14 10:34[/color][/url][/size] 我仔细观察过,我的机器主要慢在图片的预处理环节,特别是图上有多个人脸的场景,软件要先从图片上截取出 ...[/quote]

下面是AI给出的答案,供参考

image.png

image.png

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我配置也是CC150+8G×2双通道,物理机。原来用丽台P600,人脸识别很慢,以为是显存太小。换了Tesla P4之后,智能识别部分提升明显,能达到每小时3万张左右。 但人脸识别依旧慢,每天只能跑3万张(相当于2-3秒一张)  详情 回复
4 天前

1

主题

4

回帖

0

牛值

江湖小虾

pkoko 发表于 2026-5-25 11:09
下面是AI给出的答案,供参考

我配置也是CC150+8G×2双通道,物理机。原来用丽台P600,人脸识别很慢,以为是显存太小。换了Tesla P4之后,智能识别部分提升明显,能达到每小时3万张左右。
但人脸识别依旧慢,每天只能跑3万张(相当于2-3秒一张)。CPU利用率只有5-6%,显存占用600MB+,GPU利用率基本是“假努力”状态。
完全没达到帖子里另一位CC150+P4的兄弟每小时3万张的速度……
有时间我补个图。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则