🎯 做完你会得到
日常对话和简单任务用免费/低价模型,只有复杂编程、深度分析等场景才调用昂贵模型,月费从 $50+ 降到 $5-10。
👤 适合谁
- 多模型成本优化:日常用便宜模型,复杂任务自动升级
⚡ 效果预览
输入需求后,AI 会围绕「多模型成本优化:日常用便宜模型,复杂任务自动升级」生成可执行方案、关键步骤和提醒。
🔧 Step 0:先确认外部工具配置
⚠️ 本案例依赖外部工具(Telegram/Notion/飞书等),先确认已配置 👉 查看常用工具配置指南 →
解决什么问题
OpenClaw 默认用 Claude Sonnet 处理所有任务——但 90% 的日常任务(问天气、设提醒、简单查询)根本不需要这么贵的模型。
核心思路:廉价模型兜底,大模型按需升级。
HN 用户 @ohthehugemanate 分享:“A common tactic with Openclaw itself is to have a cheap or local model as the default, with rules to ‘escalate’ to other models based on task complexity/type.”
配置方法
方案一:默认便宜模型 + 手动升级
在 OpenClaw 配置中设置默认模型为低成本选项:
把默认模型改成 gemini-flash
需要强力模型时手动切换:
用 opus 帮我重构这段代码
方案二:按任务类型自动路由(推荐)
在 AGENTS.md 或 SOUL.md 中添加规则:
## 模型使用策略
- 日常对话、简单查询、设置提醒 → 用默认模型(gemini-flash)
- 写代码、debug、重构 → 升级到 claude-sonnet
- 深度分析、长文写作、复杂推理 → 升级到 claude-opus
- 图片生成 → 用 nano-banana-pro
方案三:本地模型 + 云端大模型
如果你有本地 GPU 或树莓派:
# 安装 Ollama 跑本地模型
ollama pull phi3
# OpenClaw 默认用本地模型
# 复杂任务才调用云端 API
成本对比
| 策略 | 日常对话 | 编程任务 | 月费估算 |
|---|---|---|---|
| 全部用 Claude Opus | $0.015/次 | $0.15/次 | $50-100 |
| 全部用 Claude Sonnet | $0.003/次 | $0.03/次 | $15-30 |
| 混合策略 | $0.0001/次 | $0.03/次 | $5-10 |
| 本地模型 + 云端 | 免费 | $0.03/次 | $3-5 |
怎么验证省了多少
帮我查看这个月的 API 使用量和费用
OpenClaw 会显示各模型的调用次数和费用明细。
踩坑记录
便宜模型回答质量下降
症状:用 Gemini Flash 回答复杂问题时明显不如 Claude。
解法:这是正常的——关键不是让所有回答都完美,而是让 90% 的简单任务不浪费钱。复杂任务手动升级即可。
忘记切回便宜模型
症状:手动切到 Opus 后忘记切回来,一直在烧钱。
解法:用 cron 每小时自动检查当前模型,如果不是默认的就切回来。或者直接在配置里设置默认模型,每次对话自动重置。
不满意怎么调
- 想更省 → 用本地模型(Ollama + Phi-3)处理所有日常任务,只有编程才调云端
- 想更智能的路由 → 让 Agent 自己判断任务复杂度,自动选模型
- 想看详细账单 → 问 OpenClaw这周每个模型分别花了多少钱
🦞 跑完这个副本了?
加入虾农微信群,跟 300+ 玩家交流踩坑经验、分享配置技巧
二维码过期?添加微信 深夜开发者LND 备注「虾农」拉你入群
AI Android 配对恢复助手:重连、排障、状态校验一条龙
用 OpenClaw 管理 Android 配对后的常见问题,自动检查连接状态、重做配对、校验权限和恢复消息通道。
AI 模型目录上线记分牌:新 catalog 上线后该不该放量,一眼看清
用 OpenClaw 给新 provider catalog 和新模型 rollout 做记分牌,比较稳定性、成本、错误率和适用场景,再决定是否放量。
AI 配置 diff 复核助手:改动前后差异一眼看清
用 OpenClaw 读取原始配置 diff,自动标出关键变更、风险项和潜在回滚点,减少改配置时的盲区。
AI 高危安装闸门:命中 critical 风险时先拦下再谈
用 OpenClaw 在安装插件、依赖或扩展前做高危风险拦截,发现 critical 级漏洞时默认阻断,避免带病上线。