多模型成本优化：日常用便宜模型，复杂任务自动升级

配置 OpenClaw 默认使用低成本模型（Gemini Flash/本地模型），遇到复杂任务自动切换到高端模型（Claude Opus），实现 90%+ 的 API 费用节省。

⚔️ 难度 ★☆☆ 入门

⏱ 配置耗时 5-10 分钟

🎁 掉落节省 5-10 分钟

🦞 部署可一键部署

🔧 Step 0：先确认外部工具配置

⚠️ 本案例依赖外部工具（Telegram/Notion/飞书等），先确认已配置 👉 查看常用工具配置指南 →

解决什么问题

OpenClaw 默认用 Claude Sonnet 处理所有任务——但 90% 的日常任务（问天气、设提醒、简单查询）根本不需要这么贵的模型。

核心思路：廉价模型兜底，大模型按需升级。

HN 用户 @ohthehugemanate 分享：“A common tactic with Openclaw itself is to have a cheap or local model as the default, with rules to ‘escalate’ to other models based on task complexity/type.”

配置方法

方案一：默认便宜模型 + 手动升级

在 OpenClaw 配置中设置默认模型为低成本选项：

把默认模型改成 gemini-flash

需要强力模型时手动切换：

用 opus 帮我重构这段代码

方案二：按任务类型自动路由（推荐）

在 AGENTS.md 或 SOUL.md 中添加规则：

## 模型使用策略

- 日常对话、简单查询、设置提醒 → 用默认模型（gemini-flash）
- 写代码、debug、重构 → 升级到 claude-sonnet
- 深度分析、长文写作、复杂推理 → 升级到 claude-opus
- 图片生成 → 用 nano-banana-pro

方案三：本地模型 + 云端大模型

如果你有本地 GPU 或树莓派：

# 安装 Ollama 跑本地模型
ollama pull phi3

# OpenClaw 默认用本地模型
# 复杂任务才调用云端 API

成本对比

策略	日常对话	编程任务	月费估算
全部用 Claude Opus	$0.015/次	$0.15/次	$50-100
全部用 Claude Sonnet	$0.003/次	$0.03/次	$15-30
混合策略	$0.0001/次	$0.03/次	$5-10
本地模型 + 云端	免费	$0.03/次	$3-5

怎么验证省了多少

帮我查看这个月的 API 使用量和费用

OpenClaw 会显示各模型的调用次数和费用明细。

踩坑记录

便宜模型回答质量下降

症状：用 Gemini Flash 回答复杂问题时明显不如 Claude。

解法：这是正常的——关键不是让所有回答都完美，而是让 90% 的简单任务不浪费钱。复杂任务手动升级即可。

忘记切回便宜模型

症状：手动切到 Opus 后忘记切回来，一直在烧钱。

解法：用 cron 每小时自动检查当前模型，如果不是默认的就切回来。或者直接在配置里设置默认模型，每次对话自动重置。

不满意怎么调

想更省 → 用本地模型（Ollama + Phi-3）处理所有日常任务，只有编程才调云端
想更智能的路由 → 让 Agent 自己判断任务复杂度，自动选模型
想看详细账单 → 问 OpenClaw这周每个模型分别花了多少钱