控制 Junior 的成本

控制 Junior 的成本

Junior 的薪水對應 AI 計算量。學會理解和降低 token 用量。

Junior 的薪水對應 AI 計算量(token)。下面說明成本怎麼算、怎麼控制。

成本怎麼運作

Junior 處理的每一則訊息都會用到 token。思考、呼叫工具、讀檔、產生回應,都會消耗 token。任務越複雜,用的 token 越多。

最大的影響因素:模型

Junior 可以跑在不同的 AI 模型上。模型對成本的影響最大。

模型 輸入成本 輸出成本 適合的場景
Opus 每百萬 token $15 每百萬 token $75 複雜推理、有層次的寫作、難題
Sonnet 每百萬 token $3 每百萬 token $15 大部分日常任務、摘要、信件、研究

Sonnet 的價格是 Opus 的五分之一,多數任務都做得好。

怎麼切換模型

  • 改預設: 跟 Junior 說「把預設模型改成 Sonnet」
  • 單次用 Opus: 需要更深入推理的任務,跟 Junior 說「這個用 Opus」

哪些行為最耗 token

  • 工具呼叫多、思考鏈很長的任務(複雜的多步驟任務)
  • 處理大檔案,特別是反覆讀
  • 用 Opus 模型(單價多 5 倍)
  • 不必要的頻道回覆(Junior 在沒被點到時還是回應)

立即見效的省錢方法

動作 影響
把預設模型改成 Sonnet 最大
跟 Junior 說「只在被 mention 時才在頻道裡回」
不要叫 Junior 一直重新處理大文件
提問講具體(減少來回確認)

怎麼查用量

在帳號頁查看 Junior 的用量

  • 帳號頁會顯示目前的支出和預算
  • 問 Junior:「我預算還剩多少?」可以快速查
  • 要加預算,見管理 Junior 的預算

預設用 Sonnet 開始,只在真的需要時才切到 Opus(複雜分析、重要寫作、多步推理)。光這一條就能省 50 到 80% 的成本。