Max や Pro を払っているのに、Claude Code の利用枠が週の半ばどころか数日で尽きて、残りの日は作業できない。前と同じ使い方なのに急に早く上限に当たるようになった——これは多くの利用者が報告している痛みです(例: #16157、#38335)。あなたの感覚は正しく、気のせいではありません。

このページは、まず何があなたの枠を食っているのかを特定し、次に公式に裏づけのある方法で消費を減らして枠を長持ちさせる手順です。すべて Anthropic の公式ドキュメントに基づきます(末尾に出典)。あわせて、消費が増える要因のうち利用者側で変えられないもの(プラットフォーム側)も正直に分けて示します。

まず: 何が枠を食っているか特定する

原因を当てる前に、実測で内訳を見ます。これが最初の一手です。

/usage を開くと、Pro / Max / Team / Enterprise では枠に対する消費の内訳が出ます。d で直近24時間、w で直近7日に切り替えられ、skill・subagent・plugin・個別の MCP サーバーのそれぞれが全体の何%かを表示します。どれが枠を食っているかがここで分かります。
/context で、いま文脈に何が載っているか(MCP のツール定義や CLAUDE.md など)を確認できます。

数値はこの端末のローカルの履歴から概算されるため、別の端末や claude.ai の利用は含まれません。

消費を減らして枠を長持ちさせる(公式の方法)

1. タスクの切れ目で /clear(最も効くレバー)

毎回のメッセージには、それまでの会話のすべてが含まれます。会話が長くなるほど、1回ごとの消費が増えます。別の作業に移るときは /clear で会話を流すと、CLAUDE.md やプロジェクトのファイルは残したまま、履歴だけが消えます。公式は、これを品質と費用の両方で最も効果的なレバーと説明しています。後で戻りたいときは /clear の前に /rename、戻るときは /resume。

2. 用途に合うモデルを選ぶ(Opus は数倍重い)

Opus は1ターンあたり Sonnet の数倍の枠を使います。常用せず、難しい設計判断や込み入った推論のときだけにします。/model で随時切り替え、/config で既定を設定。opusplan を使うと、計画は Opus・実装は Sonnet に自動で切り替わります(後述の 1M の自動昇格は opus 設定には及びますが opusplan には及びません)。subagent には model: haiku も指定できます。

3. 1M 文脈を無効化する(既定で重い場合)

Opus 4.7 では 1M 文脈が既定で、これは消費が大きくなります。多くのタスクは 200K で足ります。次で 200K に戻せます。

これを settings.json または環境変数に設定すると、モデルの選択肢から 1M 版が外れます。1M の文脈は毎回その大きな文脈を再処理するため、週次の枠の消費を速める要因になります。

4. 毎回載るものを軽くする

5. 拡張思考(extended thinking)を調整する

拡張思考は既定で有効で、思考トークンは出力として課金されます。深い推論が要らない簡単なタスクでは、/effort で努力レベルを下げる、/config で無効化する、MAX_THINKING_TOKENS=8000 で予算を下げる、で消費を減らせます。

6. 重い処理は subagent に逃がす / agent team は控えめに

テストの実行・ドキュメントの取得・ログの処理などの冗長な出力は subagent に委ねると、その出力は subagent の文脈に留まり、本体には要約だけが返ります。なお agent team は、各メンバーが自分の文脈を持つため、plan モードで標準のセッションの約7倍のトークンを使います。使うときは小さく保ち、終わったら片付けます。

7. 上限のガードを置く

Pro / Max では /usage-credits で使用クレジットの月次の上限を設定できます(変更には課金のアクセス権が必要)。あわせて、消費の暴走を実行の手前で自動で止める hook を入れておくと、気づかないうちの枠の枯渇を防げます(下記)。

消費の暴走を自動で止める hook を入れる

npx cc-safe-setup

暴走した取得ループ・無限出力・巨大画像の再試行など、枠と費用を一気に食う操作を実行の手前で止めます。892の hook 9,200以上のテスト

いま自分がどの費用事故に無防備かを調べる: cost-incident-self-audit · GitHub

正直な限界: 利用者側で変えられない要因もある

上の方法はあなたの消費を減らして枠を長持ちさせます。一方で、消費が増える要因のうちプラットフォーム側のものは、利用者側では直せません。報告レベルでは、特定の版での挙動の変化(モデルの自動の振り分けや既定の変化)で、同じ使い方でも消費が増えたという声があります(#16157、#38335)。これらは Anthropic 側の対応を待つ部分です。回避策として版を戻すと消費が戻ったという報告もあります(claude --version で現在の版を確認できます)。使い方を一切変えていないのに急に枠の減りが速くなった場合は、上の節約で凌ぎつつ、公式のサポートに報告するのが筋です。確実に自分で減らせる部分と、待つ/報告する部分を分けて扱ってください。

Claude Code の Max / Pro の利用枠がすぐ尽きるとき

まず: 何が枠を食っているか特定する

消費を減らして枠を長持ちさせる(公式の方法)

1. タスクの切れ目で `/clear`(最も効くレバー)

2. 用途に合うモデルを選ぶ(Opus は数倍重い)

3. 1M 文脈を無効化する(既定で重い場合)

4. 毎回載るものを軽くする

5. 拡張思考(extended thinking)を調整する

6. 重い処理は subagent に逃がす / agent team は控えめに

7. 上限のガードを置く

消費の暴走を自動で止める hook を入れる

正直な限界: 利用者側で変えられない要因もある

関連するページ

Claude Code の Max / Pro の利用枠がすぐ尽きるとき

まず: 何が枠を食っているか特定する

消費を減らして枠を長持ちさせる(公式の方法)

1. タスクの切れ目で /clear(最も効くレバー)

2. 用途に合うモデルを選ぶ(Opus は数倍重い)

3. 1M 文脈を無効化する(既定で重い場合)

4. 毎回載るものを軽くする

5. 拡張思考(extended thinking)を調整する

6. 重い処理は subagent に逃がす / agent team は控えめに

7. 上限のガードを置く

消費の暴走を自動で止める hook を入れる

正直な限界: 利用者側で変えられない要因もある

関連するページ

1. タスクの切れ目で `/clear`(最も効くレバー)