コストを管理する

コストを管理する

Junior の給与は AI 計算量にひもづいています。トークン消費を抑える方法。

Junior の給与は AI 計算量(トークン)にひもづいています。コストの考え方と抑え方をまとめます。

コストの仕組み

Junior が処理するすべてのメッセージはトークンを消費します。思考、ツール呼び出し、ファイル読み込み、応答生成、すべて消費対象です。複雑なタスクほどトークンを使います。

最大の要素:モデル選択

Junior は異なる AI モデルで動かせます。コストへの影響がいちばん大きいのはモデルです。

モデル 入力コスト 出力コスト 向いているタスク
Opus $15 / 100万トークン $75 / 100万トークン 複雑な推論、ニュアンスのある執筆、難しいタスク
Sonnet $3 / 100万トークン $15 / 100万トークン 日常的なタスク、サマリー、メール、リサーチ

Sonnet は Opus の5分の1の価格で、ほとんどの業務をきちんとこなします。

モデルの切り替え

  • デフォルト変更: 「デフォルトモデルを Sonnet にして」と Junior に伝える
  • 特定タスクで Opus: 深い推論が必要なときだけ「このタスクは Opus でやって」と指定

トークンを大量に使うパターン

  • ツール呼び出しを多用する長い思考連鎖(複雑なマルチステップタスク)
  • 大きなファイルの処理、特に繰り返し読み込む場合
  • Opus モデル(トークン単価が5倍)
  • チャンネルでの不要な応答(メンションされていないのに Junior が返事する)

コスト削減の即効策

アクション 効果
デフォルトモデルを Sonnet に切り替え 最大
「メンションされたチャンネルでだけ返事して」と Junior に伝える
大きなドキュメントの再処理を依頼しない
依頼を具体的に(やり取り回数を減らす)

使用量の確認

アカウントページで使用量を確認

  • アカウントページに現在の支出と予算が表示されます
  • Junior に「予算はあとどのくらい?」と聞けば即答してくれます
  • 予算を増やしたいときは予算を管理するを参照

Sonnet をデフォルトにしてスタート。複雑な分析、重要な執筆、多段の推論など、本当に必要なときだけ Opus に切り替える。これだけでコストが 50〜80% 下がります。