Claude Code トークン節約ガイド

800時間��自律運用データに基づく、実測済みの節約方法。

$13
開発者1人の平均日額
(公式データ)
$150-250
月額コスト/人
+35%
Opus 4.7のトーク��増加
(新tokenizer)

1. トークンがどこで消えているか

800時間の運用データから判明したトークン消費の内訳:

消費先割合対策の効果
CLAUDE.md / 指示文15-30%200行→35行で最大50%削減
ファイル読み込み25-30%read-budget-guardで制御可能
コード生成20-25%モデル選択で最適化
ツールスキーマ / MCP12-20%未使用MCPの無効化
会話履歴 / compaction10-25%/clear、/compact で管理
最大の発見: CLAUDE.mdが100行を超えると、毎ターンのトークンコストが急増する。35行のテンプレートでも同じ効果を得られることが分かった。

2. CLAUDE.mdの最適化(最も効果が高い)

CLAUDE.mdは��ターンコンテキストに読み込まれる。100行のCLAUDE.mdは、30���ーンのセッションで約75,000トークンを消費する。

5つの最適化パターン

  1. 許可リスト方式: 「〜するな」の列挙→「〜のみ許可」に変換
  2. 具体例は1つだけ: 3つの例より1つの正確な例
  3. 理由は1行: 「なぜ」を1行で。長い説明はSkillに移動
  4. テーブル形式: 箇条書きよりテーブルの方がトークン効率が高い
  5. hookに委任: 強制ルールはCLAUDE.mdではなくhookで実装
# 最適化されたCLAUDE.md(35行の例)
# Project: my-app

## Rules
- Test before commit (hook enforced)
- No force-push (hook enforced)
- TypeScript strict mode

## Architecture
| Layer | Tech | Notes |
|-------|------|-------|
| API | Express + Zod | /src/api/ |
| DB | Prisma + Postgres | /prisma/ |
| Auth | JWT + bcrypt | /src/auth/ |

## Conventions
- Files: kebab-case
- Functions: camelCase
- One export per file

3. hookでトークン浪費を自動防止

hookはClaude Codeの動作を監視し、トークン浪費を防ぐ。

# 10秒でインストール
npx cc-safe-setup

トークン節約に効くhook

Hook効果
read-budget-guardファイル読み込み回数を制限。同じファイルの繰り返し読み込みを防止
token-budget-guardセッション内のトークン消費に上限を設定
pre-compact-checkpointcompaction前にgit checkpointを自動作成。幻覚による無駄な作業を防止
context-monitorコンテキスト使用率を段階的に警告。75%で注意、90%で危険
Opus 4.7対策: 新しいtokenizerで同じテキストが最大35%多くトークンを消費する。token-budget-guardの閾値を従来の70%に設定すると安全。

4. モデルの使い分け

タスク推奨モデル理由
日常的なコーディングSonnet 4.6Opusの1/5のコスト。大半のタスクで十分
複雑な設計判断Opus 4.7高い推論能力が必要な場合のみ
サブエージェントHaiku単純なタスクに高性能モデルは不要

/modelコマンドでセッション中にモデル切替可能。

5. コンテキスト管理

もっと詳しく学びたい方へ

このページは概要です。具体的な設定手順、before/afterデータ、チーム向けの最���化、Opus 4.7完全対応の��細は:

Token Book — 全10章 ¥2,500

はじめに + 第1章「トークンはどこに消えているか」無料公開中

無料診断: Token Checkup コスト計算機 CLAUDE.md分析

6. よくある質問

Q: Max Plan($200/月)でもトークンが足りない

Max 20xでも1時間で枯渇する報告がある(#23706)。原因は多くの場合、CLAUDE.mdの肥大化、サブエージェントの乱用、不要なMCPサーバー。上記の対策で有効利用時間を2-3倍に延ばせる。

Q: Opus 4.7にしたらトークン消費が増えた

新しいtokenizerにより同じ入力で最大35%多くのトークンを消���する(公式ドキュメント)。また、thinking tokenが増加し出力も多い。対策: effort levelを調整(/effort)、日常タスクはSonnetに切替。

Q: hookを入れるとセッションが遅くならない?

hookの実行時間は通常10-50ms。トークン節約の効果(数千〜数万トークン/セッショ���)と比べれば無視できる。