利用方針の判別器の誤発火と利用者の側の4つの選択肢、 5件の防衛のhookの全件の出荷の整理

2026年5月18日以降、 Claude Code で Opus 系列のモデル (4.7、 4.6、 1Mの異本) を選んだ状態で、政策に違反しない通常のやり取りがサーバー側の利用方針の判別器に阻まれて、応答が返らない事象が25件以上の独立な起票で広範に報告されている。本頁は CC Safety Lab の12月号の冒頭の章 (約6,500字、読了8分) の全文公開です。

集計範囲: 2026-05-18 から 2026-05-27 の10日間の窓、 25件以上の独立な起票
読了の目安: 8分
収録の中身: 4軸の合図の articulate、 11件の代表の起票の集積の表、利用者の側の4つの選択肢の整理、 5件の防衛のhookの全件の出荷の整理 (主の症状の3件 + 二次の痛みの2件)

何が起きるか

利用者の側に出てくる文面は二つの様式。第一は「利用方針の違反」と「サイバー関連の防衛」が同時に名指される様式。第二は「サイバー保護器が発火した」と言われて、言い換えるか巻き戻すかが助言される様式。両方の文面は、起票 #60366 と #62190 の本文に原文が記録されています。

誤発火の引き金は政策の境界の合図と無関係。一語の挨拶や、ロシア語の挨拶、自分のプロジェクトの普通のコードの読み取り、単純な質問が、ある時は通って別の時は阻まれる。同じ入力でも挙動が変わる非決定性の合図が、集積の全体で繰り返し報告されています。

業務の整備で Opus 系列の長文脈の整理や深い代理の循環の整備を選ぶ必要がある利用者には、利用枠の費用と業務の遮断の二重の負担が継続する状況。 6月15日の課金分離の延長の合図 (Pool 2 の判定の経路) との関連で、業務の整備の経路の整理は12月の段でも重要な合図の継続中です。

なぜ詰まるか (4軸の合図の整理)

サーバー側の判別器の調整が、利用方針の検出の鋭さを想定以上に高い値で動かしている様式が、集積の合図の集合から推定されます。設計の意図と実機の振る舞いの乖離の中核は三つの軸の証拠で示されます。

第1の軸: Opus 系列の判別の経路のみが影響を受ける

Sonnet 系列は同じ作業の流れで影響を受けません。集積の全件で再現された明確な差。起票 #60366 (16反応、 30コメント) と他の25件以上の独立な起票で Sonnet 系列の通過の合図が報告されています。業務で Opus を選ぶ理由が長文脈の整理や深い代理の循環の整備の場合、集積の継続の期間の中で短期の妥協が必要になります。

第2の軸: 多言語の入力で発火する

ロシア語、ポーランド語、スペイン語で確認済の合図。英語の境界の判別の経路ではない構造の合図。起票 #62065 (ロシア語の合図、道具に向けた不満の表現が遮断) と起票 #62373 (ポーランド語で自分の顧客管理の道具の監査が遮断) の合図。

第3の軸: 領域の境界と無関係

生医療の研究、半導体の設計、圧縮の算法、そして単純な挨拶のいずれでも発火します。起票 #61656 (生医療の研究)、 #61642 (半導体の波形の解析)、 #60366 (単純な挨拶) の合図の集合で、領域の判別ではない構造の合図。

3軸の証拠から、利用方針の判別の偏りではなく、判別器の不安定性そのものという合図として整理されます。加えて、計画 (Cyber Verification Program) の承認済の利用者からの起票 #61889 の合図は、承認が現在の集積の対象外と整合しない経路を示しています。計画は設計上の正規の経路で正当な作業の判別を意図する整備ですが、現在の集積の判別器は計画と別の整理を実行している合図。

集積の事例 (2026年5月18日から5月27日の状況)

直近10日間で同じ集積の合図の独立な起票は25件以上の規模。単一の日の最大の集中は5月23日の12件の独立な起票で、集積の発火の山の合図。

起票60366 (16反応、 30コメント、 2026年5月18日) — 単一の挨拶の合図、集積の最初の独立な合図
起票62190 (10反応、 2026年5月25日) — 非決定性の合図と多言語の合図の言語化
起票61056 (4反応、 2026年5月21日) — 通常の作業の流れで遭遇
起票61638 (3反応、 2026年5月23日) — 過剰な発火を止めてほしいという利用者の言語化
起票61185 (2反応、 2026年5月21日) — サイバー防衛の偽陽性、通常の機械の管理の監査が遮断
起票61664 (2026年5月23日) — 支払い済の利用者の通常のコード解析が遮断、「ブロック発生時もcontext/creditは消費される」
起票62373 (2026年5月26日) — ポーランド語で自分の顧客管理の道具の監査
起票62065 (2026年5月24日) — ロシア語の合図、道具に向けた不満の表現が遮断
起票61889 (1反応、 2026年5月23日) — 計画の承認済の利用者が継続して遮断される合図
起票61656 (2026年5月23日) — 生医療の研究の正当な作業が遮断
起票61642 (2026年5月23日) — 半導体の波形の解析で遭遇

加えて14件以上の独立な低反応の起票が、同じ集積の合図で5月23日の集中から5月27日まで継続的に提出されています。 github-actions の自動の重複の判別の経路で3件の重複の連鎖が既に整理されている合図で、判別の整備の段で集積の合図の認識は確認済の状況。ただし、集積の解決の公式の対応の経路は、本書の起稿の時に公開されていません。

利用者の側の4つの選択肢

サーバー側の対応が公開されない期間の中で、業務の整備の経路は4軸で整理されます。 4軸の選択は、利用者の業務の整備の特徴で経路を選ぶ。

選択肢1: Sonnet 系列への切り替え

シェルの環境変数 ANTHROPIC_MODEL に claude-sonnet-4-7 の値を設定する経路で、同じセッションを Sonnet 系列に切り替える。集積の全件の独立な合図で、 Sonnet 系列は同じ作業の流れで影響を受けない事実が整理されます。 30秒の切り替えで、集積の最も再現可能な遮断が解消する合図。

選択肢2: セッションの前置の整備の経路

機密な質問の前に、プロジェクトの文脈の整理 (一段か二段の機密でない作業) を整備する経路。集積の合図の整理で、暖機を経たセッションのほうが冷たい機密な質問より、通過の率が顕著に高い合図。単純な「自分のプロジェクトの概要」「自分のディレクトリの整理」を機密な質問の前に置く経路。

選択肢3: 計画 (Cyber Verification Program) の申請の経路

https://www.anthropic.com/legal/cyber-verification-program の頁で申請。サイバーの境界の正当な作業を継続する利用者の長期の経路の整備の合図。ただし、 #61889 の合図の整理で、現在の集積の対象は計画の承認済の利用者でも継続して遮断される合図の継続中。集積の解決の経路と計画の承認の経路は別の経路で、同時に進める整備。

選択肢4: 同じ入力での再試行の経路

判別器の非決定性の合図の整理で、同じ入力の二回目から三回目の試行で通過の合図が頻発します。費用は追加の通信の呼び出しの一件のみ。規律は実機の機密な遮断と集積の遮断の区別の整理 (実機の機密な遮断は試行を重ねても通過しないため、試行の経路で誤って遮断を回避する経路にはなりません)。

5件の防衛のhookの全件の出荷の整理 (2026年5月31日の段)

cc-safe-setup の hook の library から、集積9の防衛の道具の集まりは2026年5月28日から5月30日の3日間で5件が出荷され、完成段に到達。主の症状の3件と、二次の痛みの軸1と軸4の2件の合計5件で、利用者の側の集積9の対応の全範囲を覆う構造。

第1のhook: aup-false-positive-helper.sh出荷済

主の症状の整備の経路。 SessionStart の hook で、利用者の側のモデルの環境変数の値を検査。 Opus 系列に固定されている場合に、案内の環境変数の opt-in (CC_AUP_FALSE_POSITIVE_HELPER_REMIND=1) で、 4軸の選択肢の助言を標準誤差に発火する整理。 hook は常に正常終了で、判別の経路を変えない助言の様式。取り込みの依頼 #388 と #389、 2026年5月28日3時取り込み完了、 16件の試験で全件で通過。

第2のhook: aup-block-pattern-logger.sh出荷済

主の症状の整備の経路。 PostToolUse の hook で、道具の呼び出しの出力の中の遮断の合図のパターンを検出、 ~/.claude/aup-block-history.log の記録の場所に追記する経路。 5件の独立なパターン (cyber-safeguards、 safety-guardrails、 rephrase-rewind、 usage-policy、 usage-policy-api) を区別、 5項目の縦線の区切りの記録 (時刻、モデル、道具、パターンの種類、 120字以内の抜粋) で追記。利用者の固有の入力は記録しない経路の整備で、機密の境界の安全側。取り込みの依頼 #461、 2026年5月29日取り込み完了、 23件の試験。

第3のhook: model-swap-suggester.sh出荷済

主の症状の整備の経路。 SessionStart の hook で、第2のhookの記録の場所を読み、直近の窓 (既定60分) で Opus 系列の遮断が閾値 (既定3件) 以上の時のみ、具体的な Sonnet 系列への切り替えの命令 (export ANTHROPIC_MODEL=claude-sonnet-4-7) を発火する経路。証拠を踏まえた具体の助言の経路で、実際に遮断されている利用者にだけ届く整備。静寂が既定で、影響を受けていない利用者へのノイズは0件。取り込みの依頼 #480、 2026年5月30日15時42分取り込み完了、 25件の試験。

第4のhook: aup-retry-loop-guard.sh出荷済

二次の痛みの軸1 (再試行の継続中の context と credit の浪費、起票 #61664 の日本の有料の利用者の直接の声「ブロック発生時もcontext/creditは消費される」への直接の対応) の経路。 PostToolUse の hook で、第2の道具の記録の場所を読み、直近5分の窓で3件以上の阻止が同じ道具を対象の合図を検出した時、 /exit の助言と切り替えの命令の2軸の助言を発火する経路。取り込みの依頼 #481、 2026年5月30日取り込み完了、 26件の試験。

第5のhook: aup-large-tool-output-warner.sh出荷済

二次の痛みの軸4 (単一の道具の呼び出しの中の大きな機密の合図の量、起票 #61185 の filipghoulin の合図、 17,000件のIPの阻止の一覧の事例) の経路。 PreToolUse の hook で、 Bash の道具の呼び出しの前の段で命令の中身を解析し、大きな機密の合図の量を出力する経路の様式を検出した時、より絞った代替の経路の助言を発火する経路。 PreToolUse の境界の唯一の対応の場所の合図 (発火の後の段では救済の手順が無い)。取り込みの依頼 #486、 2026年5月30日取り込み完了、 32件の試験。

5件の道具の経路の整理は、互いに補完の構造。第1のhookは一般の気づきの経路、第2のhookは証拠の蓄積の経路、第3のhookは証拠を踏まえた具体の助言の経路、第4のhookは再試行の連鎖の即時の遮断の経路、第5のhookは事前の予防の経路。 5件の組み合わせで、利用者の集積9の対応の全範囲が覆われる構造。

本号の購入の経路

12月号の続きの章 (約23,000字) の購入の経路は、月額¥500の note のメンバーシップで、 12月号と以降の毎月の届け物の経路。初月は無料で、その後は月額¥500です。

CC Safety Lab メンバーシップ
¥500/月

メンバーになる→ note 商品の頁を見る

12月号は12月1日配信予定。 6月号と 7月号と 8月号と 9月号の試し読みで書き方の深さの目安を判断できます。

続きの章の中身

12月号の続きの章では、 4軸の合図の全件の深掘りと25件の起票の集積の全件の表、 5件の防衛のhookの ~/.claude/settings.json の articulate の例 (CC_AUP_FALSE_POSITIVE_HELPER_REMIND、 CC_MODEL_SWAP_SUGGESTER_THRESHOLD、 CC_MODEL_SWAP_SUGGESTER_WINDOW_MIN 等の環境変数の整理)、警告の発火の後の5手順の即時の対応、 5軸の予防の整備、計画 (Cyber Verification Program) の申請の経路の整備 (第2のhookの記録の場所の累計の合図の活用)、月次の安全チェックの7軸の追加項目が届きます。

1月号以降の主題の予告 (道具の呼び出しの解析の失敗、認証の沈黙の失敗、認識不能の道具の呼び出しの集積、非英語の品質の劣化など) は商品の頁で公開済です (9ヶ月分の runway)。