收起左侧

API太贵了,我把 Gemma 4 跑在本地,还接入了 OpenClaw

14
回复
2667
查看
[ 复制链接 ]

38

主题

104

回帖

0

牛值

小有名气

2026-4-7 22:17:08 显示全部楼层 阅读模式

这段时间,AI 我是越用越顺手,但也越来越不敢放开用。

原因很简单:API 太贵了。

刚好最近谷歌出了 Gemma 4

我顺手装了一遍,结果发现这件事比想象中简单很多。

如果你只是想先把一个能用的大模型跑起来,而不是一上来就折腾特别复杂的环境,那这条路其实挺适合的。
我这次就是用 Ollama + Gemma 4,给自己搭了一套本地 AI,还顺手接入Openclaw

整个过程,核心就三步。

第一步,先把 Ollama 装上

如果你之前没折腾过本地大模型,那可以先把 Ollama 理解成一个“本地模型运行器”。

很多开源模型,都是通过它来下载、启动和运行的。
你不用自己去处理太多底层环境,省心很多。

macOS / Linux

直接执行:

curl -fsSL https://ollama.com/install.sh | sh

Windows

1、去官网下载安装就行:

https://ollama.com

2、PowerShell直接执行:

irm https://ollama.com/install.ps1 | iex

装完之后,可以先确认一下有没有成功:

ollama -v

只要能看到版本号,基本就说明没问题了。

这一步本身不复杂,真正关键的是先把这套基础运行环境搭起来。
后面不只是 Gemma 4,很多别的开源模型你也能直接跑。

第二步,把 Gemma 4 拉到本地

环境有了,接下来就是把模型下载下来。

我这边用的是:

ollama pull gemma4:e4b

第一次拉模型会慢一点,这个主要看网络和模型大小,耐心等它跑完就行。

温馨提示:C盘空间不够的话,先更改Ollma模型设置路径

下载完成后,就可以通过Ollma客户端选择已下载的模型:

第三步,直接跑起来试一下

你也可以顺手丢一句测试:

你好,你是什么模型?简单介绍一下自己。

如果它能正常回你,那这事基本就成了。

这是本地运行占用资源:

到这里,其实最核心的部分已经结束了。

说到底,就是三步:

  • 装 Ollama
  • 拉 Gemma 4
  • 让它跑起来

没有很多人想象中那么复杂。

Gemma4本地模型接进OpenClaw

1、打开Ollama客户端-Launch复制命令

终端运行:

ollama launch openclaw

2、系统自动配置

3、Openclaw其它配置就不赘述了

最后

本地跑 Gemma 4,再接入 OpenClaw,最大的好处是省钱、可控,也更方便接自己的工作流。

当然,这套方案也有局限

本地模型的整体能力和稳定性,很多时候还是很难完全替代顶级云端模型,尤其是复杂推理、长上下文和高强度任务。

所以更适合把它理解成:

它不一定能替代所有云端模型,
但至少能把一部分高频、重复、成本敏感的任务搬回本地。

总体四步:

  • 装 Ollama
  • 拉 Gemma 4
  • 跑起来
  • 接进 OpenClaw

👥 NAS 折腾交流群

如果你最近也在折腾本地 AI,或者已经把模型接进自己的工作流,欢迎留言聊聊你现在在用什么模型。

想看更多这类 OpenClaw × NAS × AI自动化 的实战内容,欢迎关注公众号 “纳斯派”。
如果你想参与讨论、一起共创玩法,也欢迎公众号私信进群一起交流。

收藏
送赞 2
分享

5

主题

108

回帖

0

牛值

初出茅庐

2026-4-8 12:05:43 显示全部楼层

没看懂,飞牛上装ollama?还是装第二步gemma?你是懂的,很轻松,对于小白还要理解一下。第一个ollama可以装在nas上吗

可以装在NAS上,就是很吃配置  详情 回复
2026-4-8 18:39

0

主题

3

回帖

0

牛值

江湖小虾

2026-4-8 14:11:21 显示全部楼层

不知道是飞牛openclaw 的问题还是 ollama 的问题,前两天在飞牛的 openclaw 连接的 gemma4 26b,对话倒是没问题,但是让他做事只会回复一个空白对话框。

可能是爆显存了  详情 回复
2026-4-10 18:54

3

主题

6

回帖

0

牛值

江湖小虾

2026-4-8 16:42:47 显示全部楼层

之前用过ollama,装的是千问,可惜显存太小,只有8GB,装不了太大的模型,小模型不好用。

最新出的google gemma4 e4b模型还行  详情 回复
2026-4-8 18:37

38

主题

104

回帖

0

牛值

小有名气

2026-4-8 18:37:58 楼主 显示全部楼层
swxian 发表于 2026-4-8 16:42
之前用过ollama,装的是千问,可惜显存太小,只有8GB,装不了太大的模型,小模型不好用。
...

最新出的google gemma4 e4b模型还行

38

主题

104

回帖

0

牛值

小有名气

2026-4-8 18:39:47 楼主 显示全部楼层
moneycwq 发表于 2026-4-8 12:05
没看懂,飞牛上装ollama?还是装第二步gemma?你是懂的,很轻松,对于小白还要理解一下。第一个ollama可以 ...

可以装在NAS上,就是很吃配置
那你的意见是怎么装比较好?nas上装什么,其他装在哪儿呢?我的nas是一台服务器虚拟的,esxi,不过没显卡,实在不行去买张显卡  详情 回复
2026-4-8 22:37

5

主题

108

回帖

0

牛值

初出茅庐

2026-4-8 22:37:39 显示全部楼层
纳斯派 发表于 2026-4-8 18:39
可以装在NAS上,就是很吃配置

那你的意见是怎么装比较好?nas上装什么,其他装在哪儿呢?我的nas是一台服务器虚拟的,esxi,不过没显卡,实在不行去买张显卡

0

主题

2

回帖

0

牛值

系统先锋体验团🛩️

2026-4-10 18:54:24 显示全部楼层
tarowy 发表于 2026-4-8 14:11
不知道是飞牛openclaw 的问题还是 ollama 的问题,前两天在飞牛的 openclaw 连接的  gemma4 26b,对话倒是 ...

可能是爆显存了

1

主题

4

回帖

0

牛值

江湖小虾

2026-4-11 08:58:04 显示全部楼层

这个我折腾过很久,我是电脑端部署的ollama(13600KF+32GDDR5+50T0TI 16G),模型用GTPOSS20B和Qwen3.5 9b的,接入NAS装的openclaw,总体评测是简单体验一下可以,跑ai或者算力差得远,还是老老实实买token吧

简单事情可以处理下  详情 回复
2026-4-13 13:20

0

主题

7

回帖

0

牛值

江湖小虾

2026-4-11 21:48:11 显示全部楼层

笔记本16g内存用本地模型不太行,速度慢,有没有什么模型是能教他技能的,就是教他阅读知识点,我用的时候可以直接问,

这个使用本地模型不太现实,还是的上agent  详情 回复
2026-4-13 13:21

38

主题

104

回帖

0

牛值

小有名气

2026-4-13 13:20:51 楼主 显示全部楼层
麦田 发表于 2026-4-11 08:58
这个我折腾过很久,我是电脑端部署的ollama(13600KF+32GDDR5+50T0TI 16G),模型用GTPOSS20B和Qwen3.5 9b ...

简单事情可以处理下

38

主题

104

回帖

0

牛值

小有名气

2026-4-13 13:21:27 楼主 显示全部楼层
岳云磊 发表于 2026-4-11 21:48
笔记本16g内存用本地模型不太行,速度慢,有没有什么模型是能教他技能的,就是教他阅读知识点,我用的时候 ...

这个使用本地模型不太现实,还是的上agent
2026-5-12 13:31:58 显示全部楼层
win电脑需要什么配置?
部署ollama的这台电脑的模型能不能给其他电脑的openclaw使用? 怎么配置?  详情 回复
2026-5-12 13:33
2026-5-12 13:33:00 显示全部楼层
听不见的风 发表于 2026-5-12 13:31
win电脑需要什么配置?

部署ollama的这台电脑的模型能不能给其他电脑的openclaw使用? 怎么配置?

1

主题

3

回帖

0

牛值

江湖小虾

2026-5-12 17:44:51 显示全部楼层

想问下什么配置能跑起来啊?我先部署了e4b的模型,直接报错。然后部署了e2b的模型,在ollama里能跑起来,8g内存直接就占没了,在openclaw里面一对话就一直转圈了。内存直接满了。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则