Claude Fable 5再開｜輸出規制解除と安全対策の変更点

【著者プロフィール】天秤AIメディア編集部／ GMO天秤AI株式会社筆者: 生成AIの最新情報や使い方ガイド、活用事例などを紹介するメディアです。 AI初心者の方向けの情報からニッチな情報まで発信中！

📌 この記事の要約

Claude Fable 5が3週間ぶりに全世界で再開
2026年7月1日、輸出規制が解除されたことを受け、AnthropicはClaude Fable 5の提供を全世界で再開。停止は6月12日に始まり、Amazonの研究者によるジェイルブレイク報告がきっかけとなっていた。
ジェイルブレイクは「軽微」と評価
問題となった迂回手法は、Fable 5に固有の危険な能力を解放するものではなく、既存の複数モデルでも同様の出力が確認された。Anthropicはこれを「軽微なジェイルブレイク」と位置づけている。
クラシファイアを大幅に強化して再開
Fable 5では通常より広い「安全マージン」を持つクラシファイアを設定。報告された迂回手法のブロック成功率は99%超（CAISI検証済み）。誤判定が増える可能性はあるが、安全性を優先した設計。
プランごとに利用条件が異なる
Pro・Max・Team・プレミアムEnterpriseは7月7日まで週間上限の50%がFable 5枠として含まれ、以降は従量課金へ移行。標準Enterpriseは使用クレジットの有効化が必要。

はじめに

2026年7月1日、AnthropicはAIモデル「Claude Fable 5」の提供を全世界向けに再開しました。同モデルは6月12日に米国政府の輸出規制を受けて突如停止されており、約3週間ぶりの復活となります。

この記事では、停止の背景・再開の条件・セキュリティ面の変更点を整理して解説しますので、利用再開前に確認しておきたい情報をまとめて把握できます。

「NOW SHOWING FABLE 5」と表示されたレトロなドット絵風の告知画像。黒背景にクマのシルエットとブタのピクセルキャラクターが描かれている

Claude Fable 5が一時停止された背景

米国輸出規制が適用されるまでの経緯

Claude Fable 5とClaude Mythos 5は、2026年6月9日に正式リリースされました。両モデルは同一の基盤モデルを共有していますが、Fable 5は一般向けに強力なセーフガード（安全機能）を備えた仕様で公開されており、Mythos 5は少数のProject Glasswingパートナー向けに限定提供されていました。

リリースからわずか3日後の6月12日、米国政府は両モデルに輸出規制を適用しました。規制は即日発効されたため、Anthropicはリアルタイムで国籍を確認する手段を持てず、全ユーザーのアクセスを一時停止する対応を取ることになりました。

停止の直接原因：ジェイルブレイク報告と政府対応

停止の直接的なきっかけは、Amazonの研究者によるセキュリティ報告でした。研究者チームはFable 5のセーフガードを迂回する手法（ジェイルブレイク）を発見し、モデルが複数のソフトウェア脆弱性を特定したほか、うち1件については悪用方法を示すコードを生成したと報告しています。

その後Anthropicが実施した検証では、同じ脆弱性の特定はClaude Opus 4.8・GPT-5.5・Kimi K2.7など、より能力の低い複数のモデルでも再現できることが確認されました。悪用コードの生成についても、Claude Haiku 4.5・Sonnet 4.6・Opus 4.6〜4.8・GPT-5.4・GPT-5.5・Kimi K2.7を含むすべての検証対象モデルで同様の出力が確認されています。

つまり今回のジェイルブレイクは、Fable 5に固有の危険な能力を解放するものではなく、既存モデルでも到達可能な「日常的な防御的セキュリティ作業」の範囲に留まるものでした。Anthropicはこれを「軽微なジェイルブレイク」と位置づけています。

輸出規制解除と利用再開の概要

再開スケジュールとプランごとの利用条件

2026年6月30日に輸出規制が解除され、翌7月1日よりClaude Platform・Claude.ai・Claude Code・Claude Coworkで全世界への提供が再開されています。プランごとの利用条件は以下のとおりです。

Pro・Max・Team・プレミアムEnterprise：7月7日まで週間利用上限の最大50%がFable 5の利用枠として含まれます。7月8日以降は従量課金（使用クレジット）方式での利用となります。
Enterpriseプラン：Fable 5の利用枠は含まれておらず、使用クレジットを有効化することでのみ利用できます。クレジットが無効の場合はアクセスできません。
AWS・Google Cloud・Microsoft Foundry：可能な限り速やかにアクセスを再開する予定ですが、具体的な日程は公表されていません。

Claude Mythos 5の再開状況

Mythos 5については、2026年6月26日に米国政府の承認を得た一部の米国内組織に限りアクセスが復元されています。Glasswingプログラムに参加する国内外パートナーへの拡大については、引き続き政府と協議中とのことです。

強化されたセキュリティ対策の内容

安全性クラシファイアとは何か

安全性クラシファイア（Safety Classifier）とは、モデルとのやりとりの中で危険なサイバーセキュリティ関連の要求を検知する小規模なAIシステムです。問題のある要求を検知した場合、モデルの応答をブロックする役割を担います。

AnthropicはこのクラシファイアをFable 5において、過去のモデルより大幅に広い「安全マージン」で設定しています。誤判定（偽陽性）が増えることを承知の上で安全側に振り切る設計であり、その分だけ悪意ある利用を見逃すリスクを低減する方針です。

通常セーフガード（A）とFable 5セーフガード（B）のクラシファイア境界線と安全マージンの広さを比較した図

今回のアップデートで変わったこと・変わらないこと

変わったこと：

Amazonの報告書に記載された迂回手法をブロックする改良版クラシファイアを新たに導入しました。
ブロックされたリクエストはユーザーに通知され、代わりにOpus 4.8が応答する仕組みが追加されています。
報告された手法のブロック成功率は99%超となっています（米国商務省傘下のCAISIが検証・評価済みです）。

注意すべき点：

通常のコーディングやデバッグ作業で誤ってブロックされるケースが増える可能性があります。
クラシファイアはすべてのリスクを完全に防ぐものではなく、「防御の多層化（Defense in Depth）」の一要素として機能します。

業界共通ジェイルブレイク評価フレームワークの策定

4つの評価基準とは

今回の事態を経て、AnthropicはAmazon・Microsoft・Google・その他Glasswingパートナーと共同で、ジェイルブレイクの重大度を客観的に評価する業界共通フレームワークの策定を進めています。

ジェイルブレイクの3分類（C：軽微、D：狭域有害、E：ユニバーサル）がクラシファイア境界をどこまで突破するかを示した概念図

現時点の提案では、以下の4基準でスコアリングする方式が示されています。

能力向上度：既存ツールや弱いモデルで同じ能力に到達できるか、あるいは専門家を超える能力が解放されるか。
能力向上の広さ：同一手法がどれだけ多様な攻撃目標に有効か。
兵器化のしやすさ：実際の攻撃に転用するまでに要する手間や専門知識の量。
発見のしやすさ：手法が広く知られているか、専門知識がなければ入手困難か。

このフレームワークを基に重大度が高いと判断されたジェイルブレイクには、確認次第すみやかに予備的な対策を展開する体制を整えるとしています。なお、セキュリティ研究者向けには新たなHackerOneプログラム（Anthropic Cyber Jailbreak）も開設されており、Fable 5への脆弱性報告窓口として機能します。

よくある質問（FAQ）

Q. Claude Fable 5は7月8日以降も使えますか？

利用は継続できますが、従量課金（使用クレジット）方式への切り替えが必要です。Pro・Max・Teamプランの場合は7月7日までに使用クレジットを設定しておくことで、継続してFable 5を利用できます。

Q. 停止期間中に利用できなかった分の料金は返金されますか？

Anthropicの公式発表には返金に関する言及はありません。ご利用状況や契約内容に応じて、サポートセンターへ直接お問い合わせいただくことをお勧めします。

Q. 今回のジェイルブレイクでユーザーデータが漏えいしましたか？

公式発表によると、報告されたジェイルブレイクはソフトウェア脆弱性の特定に関するものであり、ユーザーデータの漏えいについての記述はありません。詳細はAnthropicの公式ページで最新情報を確認してください。

まとめ

2026年6月12日に始まったClaude Fable 5の利用停止は、輸出規制解除を受けて6月30日に終息し、7月1日から全世界での提供が再開されています。

今回の対応で特筆すべきは、単なる規制への受動的な対処にとどまらず、①クラシファイアの強化、②業界共通ジェイルブレイク評価フレームワークの策定、③政府との協力体制の深化という3つの前向きな変化が同時に動き出した点です。AIモデルの安全性をめぐる議論は今後さらに活発になることが予想されており、Anthropicが提案するフレームワークが業界標準として採用されるかどうかも注目に値します。

今すぐ確認していただきたいこと：