跳到正文
🔵 社区案例 — 基于社区验证案例改编 入门 入门上手

多模型成本优化:日常用便宜模型,复杂任务自动升级

配置 OpenClaw 默认使用低成本模型(Gemini Flash/本地模型),遇到复杂任务自动切换到高端模型(Claude Opus),实现 90%+ 的 API 费用节省。

⚔️ 难度 ★☆☆ 入门
⏱ 配置耗时 5-10 分钟
🎁 掉落 节省 5-10 分钟
🦞 部署 可一键部署

🎯 做完你会得到

日常对话和简单任务用免费/低价模型,只有复杂编程、深度分析等场景才调用昂贵模型,月费从 $50+ 降到 $5-10。

👤 适合谁

  • 所有 OpenClaw 用户
  • 预算有限的个人用户
  • 想控制 API 成本的开发者

⚡ 效果预览

配置后月费从 $50 降到 $8,日常任务用 Gemini Flash 秒回,遇到编程才调 Claude Opus

🔧 Step 0:先确认外部工具配置

⚠️ 本案例依赖外部工具(Telegram/Notion/飞书等),先确认已配置 👉 查看常用工具配置指南 →

解决什么问题

OpenClaw 默认用 Claude Sonnet 处理所有任务——但 90% 的日常任务(问天气、设提醒、简单查询)根本不需要这么贵的模型。

核心思路:廉价模型兜底,大模型按需升级。

HN 用户 @ohthehugemanate 分享:“A common tactic with Openclaw itself is to have a cheap or local model as the default, with rules to ‘escalate’ to other models based on task complexity/type.”

配置方法

方案一:默认便宜模型 + 手动升级

在 OpenClaw 配置中设置默认模型为低成本选项:

把默认模型改成 gemini-flash

需要强力模型时手动切换:

用 opus 帮我重构这段代码

方案二:按任务类型自动路由(推荐)

在 AGENTS.md 或 SOUL.md 中添加规则:

## 模型使用策略

- 日常对话、简单查询、设置提醒 → 用默认模型(gemini-flash)
- 写代码、debug、重构 → 升级到 claude-sonnet
- 深度分析、长文写作、复杂推理 → 升级到 claude-opus
- 图片生成 → 用 nano-banana-pro

方案三:本地模型 + 云端大模型

如果你有本地 GPU 或树莓派:

# 安装 Ollama 跑本地模型
ollama pull phi3

# OpenClaw 默认用本地模型
# 复杂任务才调用云端 API

成本对比

策略日常对话编程任务月费估算
全部用 Claude Opus$0.015/次$0.15/次$50-100
全部用 Claude Sonnet$0.003/次$0.03/次$15-30
混合策略$0.0001/次$0.03/次$5-10
本地模型 + 云端免费$0.03/次$3-5

怎么验证省了多少

帮我查看这个月的 API 使用量和费用

OpenClaw 会显示各模型的调用次数和费用明细。

踩坑记录

便宜模型回答质量下降

症状:用 Gemini Flash 回答复杂问题时明显不如 Claude。

解法:这是正常的——关键不是让所有回答都完美,而是让 90% 的简单任务不浪费钱。复杂任务手动升级即可。

忘记切回便宜模型

症状:手动切到 Opus 后忘记切回来,一直在烧钱。

解法:用 cron 每小时自动检查当前模型,如果不是默认的就切回来。或者直接在配置里设置默认模型,每次对话自动重置。

不满意怎么调

  • 想更省 → 用本地模型(Ollama + Phi-3)处理所有日常任务,只有编程才调云端
  • 想更智能的路由 → 让 Agent 自己判断任务复杂度,自动选模型
  • 想看详细账单 → 问 OpenClaw这周每个模型分别花了多少钱
#成本优化#多模型#省钱#配置