平價模型策略
用模型分層 + OpenRouter 路由,把 AI API 成本砍 70% 以上 — 不犧牲關鍵任務的品質
一個殘酷的事實:你 80% 的對話根本不需要最強的模型。
問個天氣、翻譯一段文字、整理會議紀錄 — 這些任務用 Claude Opus 是殺雞用牛刀。但很多人就是全程開著最貴的模型在跑,然後抱怨 API 帳單太高。
解法很直覺:不同等級的任務,配不同等級的模型。
模型分層策略
我們把使用場景分成三層:
日常層(Daily)
適用場景:日常對話、簡單問答、文字翻譯、格式轉換、摘要整理
推薦模型:
- MiniMax:極低成本,回應速度快,中文能力堪用
- Google K2.5:多語系支援好,長上下文處理穩定
這兩個模型的成本大約是 Opus 的 1/100。沒打錯,一百分之一。
進階層(Advanced)
適用場景:程式碼分析、技術文件撰寫、複雜邏輯推理、多步驟任務
推薦模型:
- Claude Sonnet:Anthropic 的性價比之王,程式碼和分析能力強
- GPT-4o:通用性高,圖片理解能力好
這層的成本大約是 Opus 的 1/5 到 1/7,但對大多數「需要動腦」的任務來說品質已經很夠。
關鍵層(Critical)
適用場景:重大決策分析、深度推理、需要最高品質輸出的場景
推薦模型:
- Claude Opus:目前最強的推理模型之一,適合你真正需要它的時候
只在值得的時候用。
成本對照表
每百萬 token 的價格(近似值,實際費率可能變動):
| 模型 | 輸入成本 | 輸出成本 | 最適合 |
|---|---|---|---|
| MiniMax | ~$0.15 | ~$0.55 | 日常對話、簡單問答 |
| Google K2.5 | ~$0.15 | ~$0.60 | 多語系、長上下文 |
| Claude Sonnet | ~$3 | ~$15 | 分析、程式碼、複雜任務 |
| GPT-4o | ~$2.50 | ~$10 | 通用、圖片理解 |
| Claude Opus | ~$15 | ~$75 | 關鍵決策、深度推理 |
看最右邊兩欄的差距。MiniMax 的輸出成本是 Opus 的 0.7%。如果你的日常對話佔總使用量的 70%,光是把這部分切到日常層模型,整體成本就能降七成。
OpenRouter:模型路由器
它是什麼
OpenRouter 是一個統一的 API 閘道,讓你用一把 API Key 存取超過 100 個模型。你不需要分別去 Anthropic、OpenAI、Google 各開帳號、各綁一張卡。
為什麼用它
- 單一入口:一個 API Key 搞定所有模型
- 自動容錯:某個供應商掛了,自動切換到替代方案
- 價格透明:所有模型的價格在同一個介面比較
- 按需付費:只付你實際用的量,沒有最低消費
在 OpenClaw 中設定
在 OpenClaw 的設定中,你可以透過 OpenRouter 作為模型提供者。設定的概念是指定 OpenRouter 作為 provider,然後選擇你要使用的模型。不同任務類型可以綁定不同的預設模型。
自動切換策略
最理想的狀態是:你不需要每次手動選模型。
OpenClaw 支援根據任務複雜度自動選擇模型層級的概念。日常對話自動走平價模型,當偵測到複雜任務(長程式碼、多步推理)時升級到進階模型。你也可以設定規則,讓特定類型的請求固定走特定模型。
核心原則:預設走便宜的,需要時才升級。 而不是反過來。
手動切換:/model 指令
有時候你知道接下來的對話需要更強的模型。在 OpenClaw 的 TUI 介面中,你可以用 /model 指令手動切換當前使用的模型。
切換是即時生效的,不需要重啟服務。用完高階模型記得切回來 — 不然你的成本最佳化策略就白設了。
Provider 格式
在 OpenClaw 中指定模型時,使用 provider/model 的格式。例如:
anthropic/claude-opus-4-6anthropic/claude-sonnet-4openai/gpt-4ogoogle/gemini-2.5-flash
透過 OpenRouter 的話,模型名稱會帶上 OpenRouter 的前綴格式,具體請參考 OpenRouter 的模型清單。
實際省了多少
假設一個典型使用者每月的對話分布:
- 70% 日常對話(閒聊、問答、翻譯)
- 20% 進階任務(程式碼、分析)
- 10% 關鍵任務(重大決策)
不做分層(全部用 Claude Sonnet):
- 100% 的量都走 ~$3/$15 的價格
做了分層:
- 70% 走 ~$0.15/$0.55(日常層)
- 20% 走 ~$3/$15(進階層)
- 10% 走 ~$15/$75(關鍵層)
粗略計算,分層後的加權平均成本大約是全用 Sonnet 的 30-35%。如果原本全用 Opus,省下的比例更驚人。
GetClaw 觀點
大多數對話不需要 Opus。這不是在說 Opus 不好 — 它確實是目前最強的推理模型。但「最強」不等於「每次都需要」。
一個設定良好的分層策略,可以在幾乎不影響日常使用體驗的情況下,把 API 成本砍掉 70-80%。這不是理論值,是我們實際觀察到的數字。
省下來的錢,讓你在真正需要 Opus 的時候可以毫不猶豫地用它。 這才是聰明的成本管理。
搭配 OAuth 訂閱策略 一起使用效果最好 — OAuth 打底處理基礎額度,平價模型處理溢出的請求,Opus 只在關鍵時刻出場。三層防線,把成本壓到最低。