Claude Code コスト最適化完全ガイド|プロンプトキャッシュ・Max vs API・トークン節約術

この記事のポイント
Claude Codeのコスト削減の最短ルートは「プロンプトキャッシュを壊さない運用」「月間トークン量に合わせたプラン選択」「/usageと/clearを中心とした節約習慣」の3点。2026年6月15日の課金体系変更(Agent SDK分離)を含む最新情報で、Pro/Max/APIの選び方から1時間キャッシュ・RTKまで徹底解説。
Claude Codeのコストを下げる最短ルートは「プロンプトキャッシュを壊さない運用」「月間トークン量に合わせたプラン選択」「/usage と /clear の習慣化を中心とした節約術」の3点です。 公式の最新ドキュメントでは開発者1人あたり1日平均$13、90パーセンタイルで$30というのが実態で、前回公表値($6/$12)から大きく引き上げられています。セッション全トークンの90%以上を占めるキャッシュ読み込みを活かせるかどうかで、月額が2〜10倍変わります。
この記事でわかること:
- 2026年6月15日施行の課金体系大幅変更(Agent SDK分離・二池構造)と対処法
- Claude Codeのサブスクリプション(Pro/Max 5x/20x/Team)とAPI従量課金の現行料金
- プロンプトキャッシュの価格倍率・最小トークン数・キャッシュを壊す操作の完全一覧
- 月間トークン量別に見たMaxとAPIの損益分岐
/usage・/clear・/compactなどコマンドと設定ファイルによる節約テクニック(効果大きい順)- Opus 4.7・Sonnet 4.6・Haiku 4.5のモデル別コスト感と使い分け
- ccusage・ccburnなどサードパーティの使用量追跡ツール
誰向けの記事か:
- Claude Codeの月額が読めず不安な個人開発者
- 定額プランと従量課金のどちらが安いか判断したいテックリード
- チーム導入時のWorkspace支出上限・レート制限を設計したい責任者
- 2026年6月の課金変更を受けてCI/CD自動化のコストを試算したいエンジニア

出典: Anthropic 公式サイト
⚠️ 速報:2026年6月15日に課金体系が大幅変更(Agent SDK分離)

出典: anthropics/claude-code GitHub 公式
2026年5月14日、Anthropicは6月15日施行の大型課金変更を発表しました。「Agent SDKなどのプログラマティック利用」をサブスクリプション枠から切り離し、別途ドル建てクレジットプールに移行するという内容です。既存記事の多くがまだ対応できていないため、最優先で把握してください。
二池構造(Two-Pool System)の概要
プール | 対象 | 課金方式 |
|---|---|---|
Pool 1(インタラクティブ利用) | ターミナルでの対話的Claude Code、Claude.ai Web/Desktop/Mobile、Claude Cowork | 変更なし・サブスクリプション枠継続 |
Pool 2(Agent SDKクレジット) | Claude Agent SDK、 | 別途クレジット、標準API料金で課金 |
クレジット付与額(月額)
プラン | Pool 2 クレジット | Sonnet 4.6入力換算目安 |
|---|---|---|
Pro | $20/月 | 約660万トークン |
Max 5x | $100/月 | 約3,300万トークン |
Max 20x | $200/月 | 約6,600万トークン |
Team/Enterprise | $20〜$200/席 | 席種による |
重要な注意点:
- クレジットは月次リセット、翌月繰越不可
- チームメンバー間での共有不可
- クレジット枯渇後は「Extra Usage」設定に応じてAPI料金で継続課金または停止
- 典型的なCI/CD自動化(PR自動レビュー4件/日)で月約$25消費 → Pro($20クレジット)では3週目で枯渇する計算
今すぐ必要なアクション
- 6月8日頃のAnthropicからのメールを確認してクレジットを有効化(要アクション)
- 現在の自動化・スクリプト利用のAPI料金換算で実コストを試算
- Extra Usageトグルの設定を決定(クレジット枯渇後の動作を選択)
- チームメンバー・CI/CDパイプライン管理者への周知
ターミナルでの対話的利用(Pool 1)には影響がありません。ただし ANTHROPIC_API_KEY 環境変数が設定されている場合はAPIキー認証が優先され、意図せずPool 2課金になる点に注意してください。
Claude Code の課金は「サブスクリプション」と「API従量課金」の2系統
Claude Codeの料金は、(1) claude.com側で支払うサブスクリプション(Pro/Max/Team/Enterprise)、(2) Claude Consoleで支払うAPI従量課金の2系統に分かれます。どちらを選んでも Claude Code本体は同じですが、コストの読み方と上限の設計が大きく違います。
- サブスクリプション:月額定額、ただし「Usage limits apply(使用量の上限あり)」が全プランに明記
- API従量課金:使った分だけ入力・キャッシュ・出力トークン単価で加算。Workspaceで支出上限を設定可能
公式ドキュメント(code.claude.com/docs/ja/costs)の最新値では、開発者1人あたり1日平均$13、90パーセンタイルで日次$30、チーム利用(Sonnet 4.6中心・API経由)は1人あたり月額$150〜$250が目安として公表されています。ヘビーユーザーでなければMax 5xで収まることが多く、逆に複数リポジトリで長時間並列実行するチームではAPI従量課金のほうが可視性と上限制御の点で優位です。
サブスクリプション料金(claude.com/pricing)
プラン | 月額 | 年額払い | Claude Code | 使用量(Pro比) |
|---|---|---|---|---|
Free | $0 | — | ×(ターミナル版利用不可) | 限定 |
Pro | $20/月 | $17/月(年額$200) | ◯ | 基準 |
Max 5x | $100/月 | — | ◯ | 5倍 |
Max 20x | $200/月 | — | ◯ | 20倍 |
Team Standard席 | $25/席/月(月払) / $20/席/月(年払) | — | ◯(要確認) | Pro以上 |
Team Premium席 | $125/席/月 / $100/席/月(年払) | — | ◯ | Max 5x相当 |
Enterprise | $20/席 + API従量 | カスタム | ◯ | カスタム |
※ すべてのプランに使用量上限があります。Max 20xでも24時間100%並列でエージェントを回すような使い方ではレート制限・フェアユース警告に到達します。
※ Pro/Maxの使用量はClaude本体(Web/Desktop/Mobile)とClaude Codeで共有です。Claude Code専用枠ではありません。
API従量課金の単価(2026年5月時点・公式確認済み)
モデル | 入力 | 5分キャッシュ書込 | 1時間キャッシュ書込 | キャッシュ読込 | 出力 |
|---|---|---|---|---|---|
Claude Opus 4.7 | $5/MTok | $6.25 | $10 | $0.50 | $25 |
Claude Opus 4.6 | $5 | $6.25 | $10 | $0.50 | $25 |
Claude Opus 4.5 | $5 | $6.25 | $10 | $0.50 | $25 |
Claude Opus 4.1 | $15 | $18.75 | $30 | $1.50 | $75 |
Claude Sonnet 4.6 | $3/MTok | $3.75 | $6 | $0.30 | $15 |
Claude Sonnet 4.5 | $3 | $3.75 | $6 | $0.30 | $15 |
Claude Haiku 4.5 | $1/MTok | $1.25 | $2 | $0.10 | $5 |
※ MTok = 100万トークンあたり。
公式注記:
- Opus 4.7は新トークナイザーを採用しており、同じテキストに対し最大35%多くのトークンを消費する可能性あり
- バッチAPI利用時は入出力ともに50%オフ(Sonnet 4.6バッチ入力$1.50/MTok、出力$7.50/MTok)
- US限定推論(
inference_geo指定)は1.1倍(Opus 4.7/4.6以降) - Fast mode(Opus 4.6/4.7ベータ)は6倍(入力$30、出力$150)、バッチAPIとの併用不可
「Opus 4.1時代の入力$15/出力$75」という旧単価を紹介している日本語記事がまだ残っていますが、現行Opus 4.7は1/3の単価です。ただしトークナイザー変更を加味すると実効コストは旧Opus 4.1比で約45〜50%程度になります。
プロンプトキャッシュの仕組みが、コストの9割を決める

出典: Anthropic 公式ドキュメント(Prompt Caching)
Claude Codeのセッションでは、長時間使うほどキャッシュ読み込みがトークン全体の90%以上を占めます。つまり「キャッシュを壊さない運用」こそが最大のコスト削減策です。
価格倍率(基本入力単価に対して)
操作 | 価格倍率 | 有効期間 |
|---|---|---|
5分キャッシュ書き込み | ×1.25 | 5分(ヒットごとに自動リフレッシュ) |
1時間キャッシュ書き込み | ×2.0 | 1時間 |
キャッシュ読み込み(ヒット) | ×0.1 | 直前の書き込みと同じ |
損益分岐はシンプルに計算できます:
- 5分キャッシュは「1回でも再利用すれば元が取れる」(1.25 < 1.0 + 0.1)
- 1時間キャッシュは「9回以上読み込んで最大効果」(2.0 ÷ (1.0 − 0.1) = 約2.2回で元が取れるが、繰り返すほど節約幅が拡大)
日常のコーディングセッションでは5分キャッシュで十分ヒットします。1時間キャッシュは「長時間同じ大規模コンテキストを維持するエージェントワークフロー」で真価を発揮します。
最小キャッシュトークン数(モデル別・最新版)
プロンプトが小さすぎるとキャッシュされず、エラーは返らず静かに通常課金されます。
モデル | 最小トークン数 |
|---|---|
Claude Mythos Preview、Opus 4.7/4.6/4.5 | 4,096 |
Claude Sonnet 4.6/4.5、Opus 4.1、Opus 4(廃止) | 1,024 |
Claude Haiku 4.5 | 4,096 |
Claude Haiku 3.5 | 2,048 |
最新世代(Opus 4.7・Haiku 4.5)は閾値が4,096に引き上げられているため、短いシステムプロンプトではキャッシュ恩恵を受けられない点に注意してください。Sonnet 4.6は1,024と比較的低い閾値のままです。
1時間キャッシュを有効化する方法(v2.1.108以降)
Claude Code v2.1.108から環境変数 ENABLE_PROMPT_CACHING_1H=1 で1時間キャッシュを有効化できます。
export ENABLE_PROMPT_CACHING_1H=1または settings.json に記述:
{
"env": {
"ENABLE_PROMPT_CACHING_1H": "1"
}
}大規模なシステム設計ドキュメントを参照しながら長時間作業する場合や、エージェントワークフローで同じコンテキストを繰り返し参照する場面で有効です。
キャッシュ事前ウォーミング(プレウォーミング)
max_tokens: 0 でリクエストを送ることで、レスポンスを受け取らずにキャッシュだけを先に書き込めます。レイテンシ重視のアプリや、作業開始前にキャッシュを温めておきたいワークフローで有効なテクニックです。
{
"model": "claude-sonnet-4-6",
"max_tokens": 0,
"cache_control": {"type": "ephemeral"},
"messages": [{"role": "user", "content": "...大規模なコンテキスト..."}]
}Workspaceレベルキャッシュ分離(2026年2月5日〜)
2026年2月5日より、Claude APIでのプロンプトキャッシュはWorkspaceレベルの分離に変更されました(以前はOrganizationレベル)。対象はClaude API・Claude Platform on AWS・Microsoft Foundry(beta)。BedrockとVertex AIは引き続きOrganizationレベルの分離です。
チームで複数Workspaceを使っている場合、Workspace間でキャッシュは共有されないため、同一コンテキストを複数Workspaceで参照するとそれぞれで書き込みコストが発生します。
ブレイクポイントの設計
- 1リクエストあたり最大4個まで
cache_controlを設置可能 - 階層は
tools→system→messagesの順で評価される - 最後のキャッシュブロックから逆方向20ブロック以内でヒット検索される
- TTL混在は「1時間キャッシュを先に、5分キャッシュを後に」配置する必要あり(逆は不可)
Claude Codeは内部で自動的にシステムプロンプト・CLAUDE.md・ツール定義をキャッシュブロックに分けています。ユーザー側は「キャッシュを壊さない運用」を意識するだけで良いケースがほとんどです。
キャッシュを壊す操作(最重要一覧)
以下の変更は、同じ階層以上のキャッシュを全て無効化します。セッション中にこれらを変えると、次のメッセージから5〜10倍の入力コストが発生します。
変更内容 | tools無効化 | system無効化 | messages無効化 |
|---|---|---|---|
ツール定義の変更 | ◯ | ◯ | ◯ |
tool_choiceの変更 | ◯ | ◯ | — |
画像の追加/削除 | ◯ | ◯ | — |
Extended thinking設定変更 | ◯ | ◯ | — |
Web検索トグル切替 | ◯ | — | — |
引用(citations)トグル切替 | ◯ | — | — |
Fast mode切替 | ◯ | — | — |
セッション中にMCPサーバーを追加する・モデルを切り替える・system promptにタイムスタンプを差し込む、といった操作はキャッシュ全ミスを引き起こす典型例です。どうしても途中で切り替えたいときは、一度 /clear で完全リセットしてから変更した方が結果的に安く済みます。
Max プランと API 従量課金の損益分岐

出典: Claude Code 公式ドキュメント(コスト管理)
「MaxとAPIはどちらが安いのか?」は、月間トークン消費量で機械的に判断できます。複数の実測レポート(Verdent/Finout/SSD Nodes等)を集約すると、おおよそ以下のラインになります。
月間トークン消費量 | 推奨プラン | 月額目安 |
|---|---|---|
〜50Mトークン | API従量課金 | $0〜$80程度 |
50M〜200M | Max 5x($100) | $100定額 |
200M〜1B | Max 20x($200) | $200定額 |
1B超(定常化) | Max 20x またはEnterprise | $200〜 |
実測レポートの代表例では、8ヶ月で100億トークンを消費した開発者がAPI換算で$15,000超になるところを、Max 20xで約$800(約93%節約)というケースが報告されています。ただし24時間フル並列運用はレート制限・フェアユース警告に引っかかるため、「現実的な業務時間で使い切る」前提での試算です。
判断基準
- APIが有利なケース: 利用時間が日中3〜5時間・週5日。チームで支出上限をかっちり設計したい。複数WorkspaceでコストをProject別に分離したい。
- Maxが有利なケース: 1日8時間以上常にエージェントを動かす。長時間キャッシュを温めながらリファクタや仕様策定をする。月額を予測可能にしたい。
- Pro($20)で十分なケース: Claude Codeは週数時間、残りはWeb UIでチャット中心。試用中で使用量が読めない。
判断に迷ったら、まずProで1〜2週間運用し、/stats コマンドで利用パターンを可視化してからMaxかAPIに移行するのが確実です。
Maxプランでも「無制限」ではない
Max 20xでも公式は「Usage limits apply」と明記しています。具体的な上限は公式非公開ですが、実測レポートによれば以下が目安です。
- 平均的な業務利用ではMax 20xの上限にはまず到達しない
- 24時間連続のエージェント並列実行ではブロックされる
- 「フェアユース」違反時は警告→一時制限の順で通知される
上限に達した場合は当月分のプランに追加課金は不可(翌週のリセットを待つ)になるため、ミッションクリティカルな使い方ではAPI併用が安全です。
スラッシュコマンドと設定でできるトークン節約術

Claude Codeのトークン節約は、効果の大きい順にやるのが鉄則です。以下は公式ドキュメントと複数の日本語実践記事の集約から整理した優先順位です。
節約効果が大きい順のアクション一覧
優先度 | アクション | 推定効果 | 理由 |
|---|---|---|---|
★★★ |
| 30〜70%削減 | 関係ない履歴を引きずらず、次タスクのキャッシュを温め直せる |
★★★ | CLAUDE.md を200行以下に収める | 10〜30%削減 | 毎セッションの固定コスト。肥大化はキャッシュ前の基礎代謝を上げる |
★★★ | 専門指示をスキル化(オンデマンド読込) | 10〜25%削減 | 使わないスキルはロードされずコンテキストを食わない |
★★ | MCPは使う時だけON、普段はCLI代替 | 10〜20%削減 | ツール定義は常時コンテキスト占有。 |
★★ | Sonnet 4.6をデフォルト、複雑タスクのみOpus | 5〜60%削減 | Opusは入出力ともSonnetの1.66倍。設計・難解デバッグのみ使う |
★★ | サブエージェントに高ボリューム操作を委譲 | 5〜30%削減 | ログ解析・ドキュメント取得は子で処理、親には要約のみ返す |
★ |
| 5〜20%削減 | 不要なファイルをコンテキストから排除。 |
★ |
| 5〜15%削減 |
|
★ | Extended thinking予算を調整 | 5〜15%削減 | 単純タスクは |
★ | プランモード(Shift+Tab)で先に方向性確定 | 再作業コスト回避 | 間違った方向に進む前に合意形成 |
★ | 前処理フックで入力を圧縮 | 条件次第 | 10,000行ログをgrepで100行に絞ってから渡す |
★ | RTK(Rust Token Killer)を使う | CLI出力を最大92%削減 |
|
CLAUDE.mdの行数は「200行以下」が新しい目安です。旧来の「500行以下」という基準よりも厳しくなっています。肥大化したCLAUDE.mdは毎セッションの固定コストを押し上げるため、使っていない指示は削除またはスキルファイルに分離してください。
.claudeignore によるコンテキスト削減
.gitignore と同様の記法で不要なファイル・ディレクトリをClaude Codeのコンテキストから除外できます。
# .claudeignore の例
node_modules/
dist/
build/
*.log
*.lock
coverage/
.git/大規模なリポジトリでは node_modules などがコンテキストに入り込むだけで数万トークンを無駄に消費します。初期設定で必ず作成することをおすすめします。
主要スラッシュコマンド一覧(最新版)
コマンド | 役割 | コスト最適化での使いどころ |
|---|---|---|
| 現セッションのトークン・ドル推計表示(公式推奨・旧/costの後継) | APIユーザーが毎セッション確認 |
| サブスク利用者の使用パターン・ヒートマップ表示 | Pro/Maxで利用ペース把握 |
| 会話履歴を完全リセット | タスク完了ごとに習慣化 |
| 履歴要約で圧縮 | 文脈維持したまま縮めたいとき |
| コンテキストの内訳可視化(MCP・履歴等が何を占めるか) | 肥大の原因特定(新コマンド) |
| セッションを名前保存→後で再開 | クリア前の退避 |
| MCPサーバーの一覧・有効切替 | 不要なMCPを即オフ |
| モデル切替(Opus↔Sonnet等) | 難易度に応じて変更(※キャッシュは壊れる) |
| Extended thinkingの努力レベル調整 | 単純作業では低めに |
| 間違った方向の会話を巻き戻す | 再作業コストの予防 |
/cost から /usage へ: 公式ドキュメントは現在 /usage を推奨コマンドとして記載しています。/usage は現セッションのトークン使用量と推定ドルコストを表示します(ローカル計算の推計値)。実際の請求は Claude Console で確認してください。
設定ファイル(settings.json)での抑制例
{
"outputStyle": "Concise",
"env": {
"DISABLE_NON_ESSENTIAL_MODEL_CALLS": "1",
"MAX_THINKING_TOKENS": "8000",
"ENABLE_PROMPT_CACHING_1H": "1",
"ENABLE_TOOL_SEARCH": "auto:5"
}
}outputStyle: "Concise"で出力の冗長さを抑制DISABLE_NON_ESSENTIAL_MODEL_CALLS=1で補助的なモデル呼び出し(要約バックグラウンドジョブ等)を抑制MAX_THINKING_TOKENS=8000で拡張思考予算を下げるENABLE_PROMPT_CACHING_1H=1で1時間キャッシュを有効化(v2.1.108以降)ENABLE_TOOL_SEARCH="auto:5"でMCPツール定義が5%を超えたら遅延読込に切替(デフォルト10%→より軽量化)
RTK(Rust Token Killer)でCLI出力を圧縮
rtk はCLIコマンドの出力を圧縮するプロキシツールです。30日間の実測で92.3%のトークン削減(998コマンド実行、220万トークン節約)という実績があります。
# インストール
cargo install rtk && rtk init -g
# 使用例(curlの出力が98%削減)
rtk curl https://api.example.com/large-responsecurl出力: 98.1%削減、ps aux: 98.3%削減と、大量の構造化テキストを出力するコマンドで特に効果があります。
モデル選択とコスト感|Opus・Sonnet・Haiku の使い分け
Claude Codeはセッション中に /model で切り替えられるため、タスクの難易度に応じたモデル選択がコストに直結します。
モデル | 得意領域 | 単価感(Sonnet比) | 目安用途 |
|---|---|---|---|
Opus 4.7 | 複雑な設計・大規模リファクタ・難解デバッグ | 1.66倍(入力$5/出力$25) | アーキテクチャ決定・難しい数学・マルチステップ推論 |
Sonnet 4.6 | 日常コーディング全般 | 基準(入力$3/出力$15) | デフォルト推奨。実装・テスト・レビュー・ドキュメント |
Haiku 4.5 | 大量の定型処理・高速応答 | 0.33倍(入力$1/出力$5) | ログ解析・ファイル分類・簡単な置換・要約 |
Opus 4.7の新トークナイザーに要注意
Opus 4.7は新しいトークナイザーを採用したため、同じテキストでも最大35%多くトークンを消費する可能性があります。単価自体は旧Opus 4.1(入力$15/出力$75)の1/3まで下がっていますが、トークナイザー差分を加味すると実効コストでは旧Opus 4.1比で約45〜50%が現実的な見積もりです。見積もりで「1/3」と単純計算すると誤差が出るので注意してください。
モデル切替時のキャッシュ注意
セッション中に /model でモデルを切り替えると、toolsとsystemのキャッシュが無効化されます。頻繁な切替は逆効果です。以下の運用がおすすめです。
- Sonnetをデフォルト起動、難タスクに入るタイミングで一度だけOpusに切替
- 切替前には
/clearで履歴をリセットしておく - Haikuは独立したセッションで並行起動し、大量処理専用として切り分ける
使用量の可視化・追跡ツール

出典: ccusage 公式サイト
公式の /usage コマンドはローカル推計値です。より正確なコスト分析には以下のサードパーティツールが有効です。
ツール | 特徴 | 向いている利用者 |
|---|---|---|
CLI。ローカルJSONLから日別/週別/月別/ブロック別分析。複数ツール対応 | APIユーザーの詳細コスト分析 | |
ccburn | ターミナルUIでリアルタイム使用量チャート。ペースライン付きで制限到達予測 | サブスク利用者の使用量ペース把握 |
ローカルダッシュボード。Pro/MaxはプログレスバーとUX統計表示 | Pro/Max利用者の総合ビュー |
ccusageの使い方(インストール不要):
# bunx経由(推奨)
bunx ccusage
# npx経由
npx ccusage
# ブロック別分析
bunx ccusage blocksBedrock/Vertex/Foundry経由の場合
Anthropic公式の /usage やConsoleメトリクスは使えません。LiteLLM(オープンソース)でコスト追跡するのが現状の定石ですが、AnthropicとLiteLLMは提携関係になく、セキュリティ監査も実施されていません。採用時はリスク評価が必要です。
Workspace 支出上限とチームレート制限の設計
API従量課金を企業で使うときは、Claude ConsoleのWorkspace機能で支出上限とレート制限を必ず設計してください。
Claude Consoleで認証すると「Claude Code」専用Workspaceが自動作成されますが、このWorkspaceは認証専用でAPIキーを発行できません。運用用に別Workspaceを分けて作るのが実務上の定石です。
公式推奨:チームサイズ別レート制限(ユーザーあたり)
チームサイズ | TPM(Tokens/min) | RPM(Requests/min) |
|---|---|---|
1〜5ユーザー | 200k〜300k | 5〜7 |
5〜20 | 100k〜150k | 2.5〜3.5 |
20〜50 | 50k〜75k | 1.25〜1.75 |
50〜100 | 25k〜35k | 0.62〜0.87 |
100〜500 | 15k〜20k | 0.37〜0.47 |
500+ | 10k〜15k | 0.25〜0.35 |
上位にはチーム共通の月間上限、個人には1日あたり上限を別途かけると「一人の暴走で全社止まる」事故を防げます。
Extra Usage(追加使用量)の設定
Extra Usageを有効化するとサブスクリプション枠超過分がAPI標準料金で自動課金されます。日次上限$2,000・月間支出上限を別途設定できます。2026年6月15日の変更後は、Agent SDKクレジット枯渇後の挙動もExtra Usage設定で制御されるため、事前に設定を確認・決定してください。
エージェントチーム機能は「約7倍」のトークンを消費する
Claude Codeにはプレビュー機能のエージェントチーム(Agent Teams)があり、CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 で有効化できます。標準セッションに比べプランモード時で約7倍のトークンを消費すると公式が明記しているため、チームで開放する際は事前にコストシミュレーションを必ず実施してください。
バッチ API・Fast mode・修飾子係数まとめ
Claude Codeの基本単価に追加でかかる、または割引される修飾子系の一覧です。API従量課金を使うチームは必ず把握しておきましょう。
修飾子 | 係数 | 特徴 | 併用可否 |
|---|---|---|---|
バッチAPI | ×0.5(50%オフ) | 入出力とも半額。非同期で数時間以内の完了を許容できるジョブ向け | Fast modeと併用不可 |
Fast mode(Opus 4.6/4.7ベータ) | ×6 | 応答速度優先。対話の体感速度が上がる | バッチAPIと併用不可、Platform on AWSでは利用不可 |
US限定推論( | ×1.1 | データレジデンシー要件がある場合 | Opus 4.7/4.6以降で利用可能 |
プロンプトキャッシュ読み込み | ×0.1 | 最大の節約効果 | 全プランで有効 |
リアルタイム対話が必要ないバックエンドのログ分類・テスト生成・ドキュメント翻訳は、バッチAPIを選ぶだけで即座に50%コスト削減できます。
バッチAPIの料金早見表
モデル | バッチ入力 | バッチ出力 |
|---|---|---|
Claude Opus 4.7/4.6/4.5 | $2.50/MTok | $12.50/MTok |
Claude Sonnet 4.6/4.5 | $1.50/MTok | $7.50/MTok |
Claude Haiku 4.5 | $0.50/MTok | $2.50/MTok |
月額シミュレーション:3パターンの実例
以下はSonnet 4.6を中心に使った場合の概算です。最新の公式ベンチマーク($13/日平均)を加味し、キャッシュ読み込み比率90%を前提にしています。
パターン1:個人開発者(週10時間・Claude Codeメイン)
- 月間入力トークン:50M(うちキャッシュ読み込み45M、書き込み5M)
- 月間出力トークン:10M
- 概算コスト: (45M × $0.30) + (5M × $3.75) + (10M × $15) = 約$184
- おすすめ:Max 5x($100)で大幅に安い
パターン2:スタートアップのテックリード(週30時間・2リポジトリ並行)
- 月間入力トークン:300M(キャッシュ読み込み270M、書き込み30M)
- 月間出力トークン:40M
- 概算コスト: (270M × $0.30) + (30M × $3.75) + (40M × $15) = 約$794
- おすすめ:Max 20x($200)+ ピーク時のみAPI補完
パターン3:軽い利用(週3時間・主にWeb UIと併用)
- 月間入力トークン:10M(キャッシュ読み込み8M、書き込み2M)
- 月間出力トークン:2M
- 概算コスト: (8M × $0.30) + (2M × $3.75) + (2M × $15) = 約$40
- おすすめ:Pro($20)でやや上限超過リスクあり、超えたらMax 5xへ
トリガーは「月$100超え」と覚えておくと簡単です。$100を超えるならMax 5x、$200を超えるならMax 20x、$500超えが定常化したらAPI従量課金で細かく制御する、というしきい値が実務的な判断軸になります。
こんな人におすすめ / おすすめしない人
Max 5x($100)がおすすめ
- 1日3〜5時間Claude Codeを使う個人開発者
- 月額の予測可能性を最優先したい
- 複数プロジェクトを横断するが1日の総時間は8時間以内
- キャッシュを温めたまま長時間リファクタを進めたい
Max 20x($200)がおすすめ
- 毎日8時間以上Claude Codeを回す専業開発者
- 複数エージェントを並列で走らせる日が多い
- Web UIとClaude Codeを両方ヘビーに使う
- 過去にProやMax 5xで使用量上限に到達したことがある
API従量課金がおすすめ
- チーム導入でユーザーごとの支出・使用量を可視化したい
- Workspaceごとにコストを分離しプロジェクト別に請求したい
- バッチAPIで非対話ジョブを大量に流したい
- 月間トークン消費が50M以下で、Proでは上限に引っかかりそうな人
どのプランもおすすめしない/向かない人
- Bedrock/Vertex AI/Azure Foundry経由の必須要件がある:
/usageやAnthropicメトリクスが使えないため、LiteLLM等の外部ツール前提になる - 24時間フル並列の自動化エージェント運用: どのプランでもフェアユース警告に引っかかる可能性が高い。Enterpriseの個別契約が前提
- コストの読み方を学ぶ時間が取れない: キャッシュの概念なしではClaude Codeのコストは予測不能。最低限
/usageと/clearを覚えられる人向け
よくある質問(FAQ)
Q1. 2026年6月15日の課金変更で、ターミナルで使うClaude Codeの料金は上がりますか?
通常のターミナル対話利用(Pool 1)は変更なしです。影響を受けるのは claude -p(ヘッドレスモード)・Agent SDK・GitHub Actionsなどのプログラマティック利用(Pool 2)のみです。ただし ANTHROPIC_API_KEY が環境変数に設定されていると、Pool 1の利用でもAPIキー認証が優先される点に注意してください。
Q2. /usage と /cost はどう違いますか?
現在は /usage が公式推奨コマンドです。現セッションのトークン使用量と推定ドルコストを表示します。/cost は旧コマンドで現在も動作するかは未確認です。なお、どちらもローカルのトークン数から計算した推計値であり、実際の請求額とは異なる場合があります。正確な請求は Claude Console で確認してください。
Q3. プロンプトキャッシュは自動で効きますか?
Claude Codeは自動でシステムプロンプト・CLAUDE.md・ツール定義をキャッシュします。APIを直接叩く場合は cache_control を明示的に設定する必要があります。Claude Code経由で使う限り、ユーザーが気にすべきは「キャッシュを壊す操作をしない」という運用のほうです。
Q4. Opus 4.7は旧Opus 4.1より本当に安いですか?
単価は1/3ですが、新トークナイザーで最大35%トークン増が発生します。実効コストでは旧Opus 4.1比で約45〜50%程度になる計算で、それでも大幅に安いです。ただし見積もりで「1/3」と単純計算すると誤差が出ます。
Q5. Maxプランは本当に無制限ですか?
無制限ではありません。全プランに「Usage limits apply」が明記されています。実測レポートでは平均的な業務利用でMax 20xの上限到達は稀ですが、24時間フル並列運用では警告が出ます。
Q6. Bedrock/Vertex/Foundry経由でもコスト最適化の方法は同じですか?
キャッシュの概念は共通ですが、/usage やAnthropicメトリクスは使えません。LiteLLMなどの外部プロキシでコスト計測するのが現時点の定石です。なお2026年2月のWorkspaceレベルキャッシュ分離はBedrockとVertex AIには適用されておらず(OrganizationレベルのままContinue)。
Q7. エージェントチーム機能を使うといくらくらい増えますか?
公式によると標準セッションの約7倍のトークン(プランモード時)を消費します。デフォルト無効で、CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1 で有効化できます。導入前に必ずコストシミュレーションを実施してください。
Q8. キャッシュヒット率を可視化できますか?
APIレスポンスには cache_creation_input_tokens と cache_read_input_tokens が含まれるため、ログ集約すればヒット率を計算できます。ccusageなどのサードパーティツールを使うとより簡単に可視化できます。Claude Code単体での可視化機能はまだないため、APIユーザーは /usage と請求明細の組み合わせで確認するのが現実的です。
Q9. 1時間キャッシュと5分キャッシュはどう使い分けますか?
同じ大きなコンテキストを1時間以内に2回以上参照するシーンで1時間キャッシュを使います。たとえば大規模なシステム設計ドキュメントをプランニング→実装→レビューで参照するようなワークフローです。1回しか使わないなら5分キャッシュの方が安くつきます。ENABLE_PROMPT_CACHING_1H=1 で有効化(v2.1.108以降必須)。
まとめ:Claude Codeのコストは「キャッシュ×プラン選択×運用習慣」で決まる
Claude Codeのコスト最適化で押さえるべきポイントをまとめます。
- 2026年6月15日施行の課金変更を把握する: Agent SDK/ヘッドレス利用が別クレジットプールへ分離。対話利用(ターミナル)は変更なし
- キャッシュ読み込みはセッション全体の90%以上を占める: キャッシュを壊さない運用(MCP追加・モデル切替・tool_choice変更を避ける)が最大の節約
- 月間50M以下はAPI、50〜200MはMax 5x、200M以上はMax 20x が損益分岐のおおまかな目安
/clearの習慣化・CLAUDE.mdの200行以内維持・Sonnetデフォルト化 が節約効果の大きい三種の神器/usageコマンドが公式推奨(旧/costから変更)。実際の請求はClaude Consoleで確認- 1時間キャッシュは
ENABLE_PROMPT_CACHING_1H=1で有効化(v2.1.108以降) - Opus 4.7は旧単価の1/3だが、新トークナイザーで最大35%トークン増を加味
- バッチAPIは50%オフ。リアルタイム不要なジョブは積極活用
- Maxでも使用量上限あり。24時間並列運用はAPIまたはEnterpriseを検討
- 企業導入時はWorkspace支出上限とチームレート制限を必ず設計
- ccusage・ccburnなどの追跡ツールで使用量を可視化し、プラン判断の精度を上げる
Claude Codeは更新頻度が高いため、導入判断前に必ず公式ドキュメント(code.claude.com/docs/ja/costs)で最新をご確認ください。
関連記事
- Claude Codeの全体像から知りたい方は Claude Codeとは を先に
- 料金プランの基礎は Claude Code 料金 で詳しく
- セットアップから基本操作は Claude Code 使い方ガイド を参照
- Claude全体のプラン選びは Claude 料金 と Claude Maxプラン 解説 を合わせて
- チーム導入は Claude Code チーム導入ガイド と Claude Code セキュリティ 安全な使い方 を参考に
- 他ツール比較は Claude Code vs GitHub Copilot 比較 や Cursor vs Claude Code 比較 も
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

Prime Intellect Labとは?セルフ改善AIエージェントを訓練するフルスタックプラットフォームの機能・料金・使い方を完全解説
2026/05/28

ChatGPT料金【日本円換算】2026年最新|全プラン比較・選び方
2026/03/31

AIエージェントフレームワーク比較12選【2026年最新】LangChain・CrewAI・Dify
2026/04/02

Claude料金【日本円】2026年最新|Free/Pro/Max/Team全プラン比較
2026/03/26

税務AI活用【2026年最新】AI-OCR自動仕訳・JDL評判・freee連携
2026/04/23

Grokとは?Agent Mode使い方・料金・ChatGPTとの比較【2026年最新】
2026/04/18

