收起左侧

我给 OpenClaw 装了一个“会读公众号”的技能

0
回复
86
查看
[ 复制链接 ]

34

主题

86

回帖

0

牛值

初出茅庐

最近,我给OpenClaw补上了一个一直很想做的能力。

我把“读取公众号文章”这件事,正式做成了一个 OpenClaw Skill:

wechat-mp-reader

它不只是抓一篇文章。

而是把公众号内容,变成 AI 可以真正接住的一类输入。

现在,它已经能做到这些事:

  • 提取公众号文章全文
  • 识别文章来自哪个公众号
  • 拉取这个号最近发布的文章
  • 按公众号名称搜索候选账号
  • 管理微信公众号后台 session
  • 通过二维码登录,把整条链路跑通

我更在意的,不是“能抓”。

而是:

AI 终于不只是看见一个链接,而是能顺着这篇文章继续往下读、往下查。

这个技能现在能做什么?

先说最直接的。

如果你给它一篇公众号文章链接,它可以直接提取:

  • 标题
  • 发布时间
  • 正文内容
  • 图片信息
  • 账号名称
  • 清理后的 markdown
  • 结构化 JSON 结果

如果当前 session 有效,它还可以继续:

  • 识别文章所属公众号
  • 获取账号内部标识
  • 拉取该号最近发布的文章列表

如果你手里没有文章链接,只有公众号名称,它也可以先搜索候选账号。

再往下,它还支持:

  • 检查 session 是否有效
  • 启动二维码登录
  • 轮询登录状态
  • 保存新的 session

这意味着,它不是一个“只能读单篇文章”的小工具。

而是一条可以继续往下追查账号和内容的技能链路。

直接看演示

演示 1:提取一篇公众号文章全文

你:
帮我提取这篇公众号文章全文:
https://mp.weixin.qq.com/s/gYEchEJJnGWpx3ENsrQ2Zw

Agent:
已提取成功。

演示 2:识别公众号,并拉最近 5 篇文章

你:
帮我读取这篇公众号文章,并列出这个号最近 5 篇文章:
https://mp.weixin.qq.com/s/gYEchEJJnGWpx3ENsrQ2Zw

Agent:
已识别公众号:纳斯派

演示 3:直接按公众号名称搜索

你:
帮我搜索公众号:纳斯派,并给出候选账号

Agent:
已搜索到候选结果:

演示 4:检查 session 是否有效

你:
帮我检查 wechat-mp-reader 的 session 是否有效

Agent:
当前 session 状态:

还有一个很现实的问题:微信文章页并不总是老老实实返回正文

做这个 skill 的过程中,我碰到的一个典型问题是:

微信文章链接,未必每次都直接返回标准正文页。

有时候它给的是非标准页、壳页,甚至是混合页。

如果只靠普通 HTTP 抓取,正文经常不稳定。

所以现在这个 skill 已经补上了 fallback。

当检测到文章页不够标准时,会自动回退到:

本地 Playwright WebKit

这一步非常关键。

因为它意味着这个 skill 不只是“理想情况下能跑”,而是在真实环境里也能尽量把正文接住。

MP session 是什么?

这里的 MP,指的是:

微信公众平台后台
也就是 mp.weixin.qq.com

session,你可以把它理解成:

skill 当前持有的一份“已登录微信公众号后台”的会话状态

它决定的,不只是“能不能读公开文章”,更重要的是:

  • 能不能搜索公众号
  • 能不能按账号拉文章列表
  • 能不能做更稳定的账号级查询

所以这个 skill 实际上有两层能力。

第一层:公开文章层

负责:

  • 读取单篇文章
  • 提取正文
  • 获取标题和发布时间

第二层:后台登录层

负责:

  • 搜索公众号
  • 按账号拉文章列表
  • 管理后台 session

MP session,就是进入第二层的门票。

用户安装了这个技能之后,怎么通过自然语言把它跑通?

我觉得这部分其实很重要。

因为大多数用户并不想自己处理:

  • cookie
  • token
  • session
  • fallback
  • Playwright
  • 账号内部标识

他们真正想要的,是安装好 skill 之后,直接跟 agent 说人话,然后让 agent 把后面的配置和跑通流程接住。

这个 skill 现在就适合这么用。

第一步:先让 agent 检查当前状态

用户可以直接说:

  • 帮我检查 wechat-mp-reader 现在能不能用
  • 看看这个技能的 session 是否有效
  • 这个 skill 现在能不能搜索公众号、拉文章列表

这一步的目的,是让 agent 先判断:

  • 公开文章能力能不能直接用
  • 后台账号能力能不能用
  • 当前有没有有效的后台 session

也就是说,用户不需要先理解内部机制。

只需要先问一句“现在能不能用”。

第二步:如果 session 不可用,就让 agent 接管登录流程

如果 agent 检查后发现后台 session 不可用,用户可以继续说:

  • 帮我启动 wechat-mp-reader 的微信后台二维码登录
  • 帮我把这个 skill 登录到公众号后台
  • 我来扫码,你把这个技能的 session 配好

这时候,agent 应该负责:

  • 启动二维码登录流程
  • 提示用户扫码
  • 检查登录状态
  • 保存新的 session

从用户视角看,这一步其实很自然:

你只负责扫码,agent 负责把 skill 接好。

第三步:登录成功后,直接拿真实需求验证跑通

我认为最好的验证方式,不是跑一条抽象测试。

而是直接给它一个真实任务。

例如:

  • 帮我提取这篇公众号文章全文
  • 帮我读取这篇文章,并列出这个号最近 5 篇文章
  • 帮我搜索公众号“纳斯派”,看看能不能拉出文章列表

如果这些请求都能正常返回,就说明这个 skill 已经真正跑通了。

第四步:以后就按自然语言直接用

前面的配置和登录一旦完成,后面基本就不需要再关心底层细节了。

以后最常见的用法,就是直接说:

  • 帮我提取这篇公众号文章全文
  • 帮我识别这篇文章来自哪个公众号
  • 帮我看看这个号最近发了什么
  • 帮我搜索这个公众号并列出候选账号

到这一步,它对用户来说就不再是“一个技术组件”。

而是 agent 已经接好的能力。

这也是我更想要的一种状态:

用户只负责提需求,agent 负责把 skill 配到能跑、用到顺手。

项目地址

这个 skill 现在已经独立发布了:

结尾

wechat-mp-reader 现在只是第一版。

但至少它已经跨过了最关键的一步:

从一个想法,变成了一个真的能用、能发布、能继续迭代的技能。

如果你也在折腾:

  • 内容工作流
  • AI 知识库
  • 公众号归档
  • 自动化阅读与分析

那这个 skill,应该会是一个很顺手的起点。

如果你想手机上快速浏览其它技能、收藏感兴趣的内容、查看详情、登录后转发给朋友或同事,也可以在评论区交流真实使用体验。

不妨试试 微信小程序爪爪技能助手

6d961c42ab8dee04a2f6f15eb8319fb9.jpg

👥 NAS 折腾交流群

想看更多这类 OpenClaw × NAS × AI自动化 的实战内容,欢迎关注公众号:纳斯派。
如果你想参与讨论、一起共创玩法,也欢迎私信公众号进群一起交流。

收藏
送赞 1
分享

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则