🎯 做完你会得到
戴上眼镜说话,AI 看到你看到的,同时通过 OpenClaw 执行发消息/搜索/添加清单等操作
👤 适合谁
- VisionClaw:用 Meta 智能眼镜实时
⚡ 效果预览
输入需求后,AI 会围绕「VisionClaw:用 Meta 智能眼镜实时调用 Ope」生成可执行方案、关键步骤和提醒。
🔧 Step 0:先配置消息接收渠道
⚠️ 本案例需要发送通知到你的手机,先配置消息渠道 👉 去配置 Telegram/飞书/微信接入 →
这个场景解决什么问题
手机解锁再打字太慢,智能眼镜戴着随时能交互,但原生功能有限。VisionClaw 让眼镜的摄像头接入 Gemini 视觉 AI,同时通过 OpenClaw Gateway 执行实际操作,实现真正的”所见即所得”AI 助手。
工作原理
Meta Ray-Ban 眼镜(或手机摄像头)
↓ 视频帧(~1fps)+ 麦克风音频
iOS/Android App(VisionClaw)
↓ JPEG 帧 + PCM 音频(16kHz)
Gemini Live API(WebSocket 实时连接)
↓ 语音回复(PCM 24kHz)→ 耳机播放
↓ 工具调用 → OpenClaw Gateway
↓ 技能执行(搜索/发消息/记录/提醒)
↓ 工具结果返回 → Gemini 朗读给你
直接复制这段配置
第一步:克隆并配置 VisionClaw App
git clone https://github.com/sseanliu/VisionClaw.git
cd VisionClaw/samples/CameraAccess
iOS 用户:
open CameraAccess.xcodeproj
Android 用户:
# 查看 README.md 里的 Android 配置说明
cat README.md | grep -A 20 "Android"
第二步:填写密钥文件
编辑 CameraAccess/Secrets.swift:
// CameraAccess/Secrets.swift
let GEMINI_API_KEY = "your-gemini-api-key" // 必填,在 aistudio.google.com 获取
let OPENCLAW_GATEWAY_URL = "http://your-ip:18789" // 可选,你的 Gateway 地址
let OPENCLAW_TOKEN = "your-gateway-token" // 可选,Gateway auth token
第三步:确保 OpenClaw Gateway 外网/局域网可达
VisionClaw 需要通过网络连接到你的 OpenClaw Gateway:
# 1. 查看当前 Gateway 配置
openclaw gateway status
# 2. 允许 Gateway 监听所有网络接口(不只是 localhost)
# 编辑 ~/.openclaw/openclaw.json
{
"gateway": {
"host": "0.0.0.0",
"port": 18789,
"auth": {
"mode": "token",
"token": "your-secret-token"
}
}
}
# 3. 重启 Gateway
openclaw gateway restart
# 4. 验证外部可访问
curl http://你的IP:18789/health
第四步:安装 OpenClaw 技能扩展能力
VisionClaw 可以调用 OpenClaw 的技能。先安装常用技能:
# 天气查询(眼镜看到户外时询问天气)
clawhub install weather
# 网页搜索(基于 Brave Search)
# 注意:需要 Brave Search API Key,在 brave.com/search/api 免费申请
# 配置后告诉 OpenClaw 开启 brave-search 功能
# 任务提醒(说一句话添加提醒)
# OpenClaw 内置,无需额外安装
第五步:体验语音控制
戴上眼镜,按 AI 按钮说(或手机模式下按屏幕按钮):
"我现在看到什么?"
→ Gemini 用视觉识别并描述场景
"帮我记一下,这个产品叫什么"
→ OpenClaw 自动记录到 memory/notes.md
"查一下今天上海天气"
→ OpenClaw 调用 weather 技能,Gemini 朗读结果
"给我妈发消息说我快到了"
→ 通过 OpenClaw 发送 Telegram/WhatsApp 消息
手机模式测试(不需要眼镜)
不想花 ¥2000+ 买眼镜,可以先用手机测试全部功能:
- 用手机后置摄像头替代眼镜视角
- 用手机扬声器替代眼镜扬声器
- 功能完全相同,确认好用再考虑买眼镜
预期结果
- 语音控制,双手解放
- 眼镜看到什么,AI 就能看到什么
- 通过 OpenClaw 执行实际任务,不只是聊天
注意事项
- Gemini Live API:需要在 Google AI Studio 申请访问权限(部分地区受限)
- 网络要求:OpenClaw Gateway 必须通过网络可达(不能只绑
127.0.0.1) - 眼镜帧率:摄像头约 1fps,适合场景识别,不适合快速移动跟踪
- 隐私注意:眼镜摄像头会持续拍摄,注意在公共场所的使用场景
- OpenClaw 技能:上面
clawhub install安装的是真实存在的技能,web-search/smart-home等需要查看 clawhub.com 确认是否有对应技能
🦞 跑完这个副本了?
加入虾农微信群,跟 300+ 玩家交流踩坑经验、分享配置技巧
二维码过期?添加微信 深夜开发者LND 备注「虾农」拉你入群
会计税务自动化:截止日期全追踪+票据自动采集+客户催收
用 OpenClaw 做会计事务所的数字助理——自动追踪所有税表截止日期、批量采集客户票据、生成催收提醒、自动化税务季工作流,让 CPA 从繁琐事务中解脱。
AI Active Run Steering 助手:任务跑到一半也能安全改方向
用 OpenClaw 的 active-run steering 能力,在任务执行过程中动态调整目标、补充约束或改变优先级,而不用整条流程重来。
AI Agent 记忆来源面板:记住了什么、从哪来的、谁改过
用 OpenClaw 建一个记忆来源面板,把长期记忆的来源、更新时间和修改轨迹展示出来,方便团队校验。
AI Android App Actions 路由助手:一句话触发手机动作和任务流
用 OpenClaw 接入 Android App Actions,把语音命令和手机动作路由进 Agent 工作流,适合移动端快捷操作。