告别呼唤“小爱同学”：我开发了本地化 AI 手势控制智能家居，毫秒级响应

岩风x · 昨天 13:33

【引言】为什么我们需要“第三种交互”？

最近小米推出了的 miloco 视觉方案，其中一个场景展示了手势识别功能。这让我重新审视了目前智能家居的主流交互方式——语音控制。

作为一名资深智能家居玩家，在使用小爱音箱时，我常面临两个真实的痛点：

如果不说话，也不掏手机，能不能优雅地控制家里的一切？ 答案就是：手势控制。

虽然绿米早在 2021 年就推出了 AI 手势摄像头，但作为一个折腾爱好者，我更倾向于“榨干”现有设备的价值。我的目标很明确：用最普通的网络摄像头，跑通专业的 AI 识别。

在简单思考后，我排除了通过 LLM（大模型）分析画面的方案，因为从截图到分析再到返回结果，至少几秒的延迟对于“开关灯”这种瞬时需求来说是不可接受的，同时一直调用LLM进行检测的成本我也承担不起。

最终，我锁定了 Google MediaPipe。

而我只需要将这套模型导入到本地，接上我的摄像头和小爱音箱就OK了！

经过一番折腾，总算实现了想要的效果：

目前插件已支持 8 种基础手势，覆盖了绝大多数日常控制场景：

应用界面也提供实时预览：

项目已开源在github，欢迎大家体验~

前提条件：已安装Home Assistant以及xiaomi home等集成，可参考https://club.fnnas.com/forum.php?mod=viewthread&tid=40417&highlight=

如果你对这个项目感兴趣，或者有更多好玩的AI+智能家居的点子，欢迎一起交流~

		自动登录	找回密码
密码			立即注册