GetClaw Docs
省錢攻略

平價模型策略

用模型分層 + OpenRouter 路由,把 AI API 成本砍 70% 以上 — 不犧牲關鍵任務的品質

一個殘酷的事實:你 80% 的對話根本不需要最強的模型。

問個天氣、翻譯一段文字、整理會議紀錄 — 這些任務用 Claude Opus 是殺雞用牛刀。但很多人就是全程開著最貴的模型在跑,然後抱怨 API 帳單太高。

解法很直覺:不同等級的任務,配不同等級的模型。

模型分層策略

我們把使用場景分成三層:

日常層(Daily)

適用場景:日常對話、簡單問答、文字翻譯、格式轉換、摘要整理

推薦模型

  • MiniMax:極低成本,回應速度快,中文能力堪用
  • Google K2.5:多語系支援好,長上下文處理穩定

這兩個模型的成本大約是 Opus 的 1/100。沒打錯,一百分之一

進階層(Advanced)

適用場景:程式碼分析、技術文件撰寫、複雜邏輯推理、多步驟任務

推薦模型

  • Claude Sonnet:Anthropic 的性價比之王,程式碼和分析能力強
  • GPT-4o:通用性高,圖片理解能力好

這層的成本大約是 Opus 的 1/5 到 1/7,但對大多數「需要動腦」的任務來說品質已經很夠。

關鍵層(Critical)

適用場景:重大決策分析、深度推理、需要最高品質輸出的場景

推薦模型

  • Claude Opus:目前最強的推理模型之一,適合你真正需要它的時候

只在值得的時候用。

成本對照表

每百萬 token 的價格(近似值,實際費率可能變動):

模型輸入成本輸出成本最適合
MiniMax~$0.15~$0.55日常對話、簡單問答
Google K2.5~$0.15~$0.60多語系、長上下文
Claude Sonnet~$3~$15分析、程式碼、複雜任務
GPT-4o~$2.50~$10通用、圖片理解
Claude Opus~$15~$75關鍵決策、深度推理

看最右邊兩欄的差距。MiniMax 的輸出成本是 Opus 的 0.7%。如果你的日常對話佔總使用量的 70%,光是把這部分切到日常層模型,整體成本就能降七成。

OpenRouter:模型路由器

它是什麼

OpenRouter 是一個統一的 API 閘道,讓你用一把 API Key 存取超過 100 個模型。你不需要分別去 Anthropic、OpenAI、Google 各開帳號、各綁一張卡。

為什麼用它

  • 單一入口:一個 API Key 搞定所有模型
  • 自動容錯:某個供應商掛了,自動切換到替代方案
  • 價格透明:所有模型的價格在同一個介面比較
  • 按需付費:只付你實際用的量,沒有最低消費

在 OpenClaw 中設定

在 OpenClaw 的設定中,你可以透過 OpenRouter 作為模型提供者。設定的概念是指定 OpenRouter 作為 provider,然後選擇你要使用的模型。不同任務類型可以綁定不同的預設模型。

自動切換策略

最理想的狀態是:你不需要每次手動選模型。

OpenClaw 支援根據任務複雜度自動選擇模型層級的概念。日常對話自動走平價模型,當偵測到複雜任務(長程式碼、多步推理)時升級到進階模型。你也可以設定規則,讓特定類型的請求固定走特定模型。

核心原則:預設走便宜的,需要時才升級。 而不是反過來。

手動切換:/model 指令

有時候你知道接下來的對話需要更強的模型。在 OpenClaw 的 TUI 介面中,你可以用 /model 指令手動切換當前使用的模型。

切換是即時生效的,不需要重啟服務。用完高階模型記得切回來 — 不然你的成本最佳化策略就白設了。

Provider 格式

在 OpenClaw 中指定模型時,使用 provider/model 的格式。例如:

  • anthropic/claude-opus-4-6
  • anthropic/claude-sonnet-4
  • openai/gpt-4o
  • google/gemini-2.5-flash

透過 OpenRouter 的話,模型名稱會帶上 OpenRouter 的前綴格式,具體請參考 OpenRouter 的模型清單。

實際省了多少

假設一個典型使用者每月的對話分布:

  • 70% 日常對話(閒聊、問答、翻譯)
  • 20% 進階任務(程式碼、分析)
  • 10% 關鍵任務(重大決策)

不做分層(全部用 Claude Sonnet):

  • 100% 的量都走 ~$3/$15 的價格

做了分層

  • 70% 走 ~$0.15/$0.55(日常層)
  • 20% 走 ~$3/$15(進階層)
  • 10% 走 ~$15/$75(關鍵層)

粗略計算,分層後的加權平均成本大約是全用 Sonnet 的 30-35%。如果原本全用 Opus,省下的比例更驚人。

GetClaw 觀點

大多數對話不需要 Opus。這不是在說 Opus 不好 — 它確實是目前最強的推理模型。但「最強」不等於「每次都需要」。

一個設定良好的分層策略,可以在幾乎不影響日常使用體驗的情況下,把 API 成本砍掉 70-80%。這不是理論值,是我們實際觀察到的數字。

省下來的錢,讓你在真正需要 Opus 的時候可以毫不猶豫地用它。 這才是聰明的成本管理。

搭配 OAuth 訂閱策略 一起使用效果最好 — OAuth 打底處理基礎額度,平價模型處理溢出的請求,Opus 只在關鍵時刻出場。三層防線,把成本壓到最低。