「Claude Fable 5」とは?ーOpus超えの最強モデルでアプリを作ったらトークンが溶けた!

「Claude Fable 5」とは?ーOpus超えの最強モデルでアプリを作ったらトークンが溶けた!
相坂ソウタ
【著者プロフィール】 相坂ソウタ あいさか そうた AIライター
こんにちは、相坂ソウタです。AIやテクノロジーの話題を、できるだけ身近に感じてもらえるよう工夫しながら記事を書いています。今は「人とAIが協力してつくる未来」にワクワクしながら執筆中。コーヒーとガジェット巡りが大好きです。
柳谷智宣
【著者プロフィール】 柳谷智宣 Yanagiya Tomonori 監修
ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。

📌 この記事の要約

  • Opusを超える初のMythos級公開モデル
    Anthropicが2026年6月9日にClaude Fable 5を一般公開。SWE-bench Proで80%台を記録するなど、特に長く複雑なタスクで他モデルを大きく引き離す最強クラスの性能を持つ。

  • 危険な質問はOpus 4.8が肩代わりする「フォールバック」
    サイバー攻撃・生物化学・蒸留に関わる質問を検知すると自動でOpus 4.8に切り替わる。発動は平均5%未満だが判定は広めで、害のない質問まで巻き込む過剰検知も起きる。

  • 重いタスクで真価を発揮、ただしトークン消費は大きい
    Coworkに複数エージェントでウイスキーバー検索アプリを制作させたところ高品質に完成。一方でMax(20x)プランの利用枠を大きく消費し、軽い用途では差が見えにくい。

  • 価格はOpus 4.8の2倍、提供は段階的
    入力100万トークン10ドル・出力50ドルでOpus 4.8の2倍。各プランで6月22日まで追加費用なし、6月23日以降は利用クレジットが必要になる。

 Anthropicは2026年6月9日、新モデル「Claude Fable 5」(読み方:クロード フェイブル ファイブ)を一般公開しました。同社の従来の最上位だったOpusのさらに上に新設された「Mythos級」の、初めて誰でも使える公開モデルです。同じ日に発表された「Claude Mythos 5」は、Fable 5と同じ基盤モデルを使いながら、一部の安全制限を外して信頼できる組織に限定提供されるモデルです。最強と呼ぶにふさわしい性能を持ちながら、その出し方には今までにない工夫が組み込まれていました。今回はFable 5に焦点をあて、何がすごいのか、なぜ安全装置を付けて公開したのか、私たちはどう向き合えばよいのかを整理します。

AnthropicによるClaude Fable 5とClaude Mythos 5の発表ページAnthropicから最新・最強の「Claude Fable 5」がお目見えしました。

長く複雑なタスクほど他モデルとの差が広がる

 Claude Fable 5は、Anthropicがこれまで一般公開してきたどのモデルよりも高い能力を持ちます。ほぼすべてのベンチマークで最先端の数値を記録し、ソフトウェア開発や知識労働、画像認識、科学研究まで、幅広い領域で抜けた成績を見せました。なかでも目を引くのは「長く複雑なタスクほど、ほかのモデルとの差が大きくなる」という性質です。

 コーディングの実力をはかるSWE-bench Proという試験では80%台を記録し、Opus 4.8の69.2%を10ポイント以上引き離しました。早期テストに参加した決済大手のStripeは、5000万行規模のRubyコードベース全体にまたがる移行作業を例に挙げています。人間のチームなら2か月以上かかる仕事を、Fable 5はわずか1日で終わらせたそうです。数か月分のエンジニアリングが数日に縮んだ、というのは驚きですね。

 画像を読み取る力の伸びもおもしろいところです。従来のClaudeは、ゲーム『ポケットモンスター ファイアレッド』を遊ばせるのに、地図やヒントになる道具を用意してあげても苦戦していました。ところがFable 5は、ゲーム画面のスクリーンショットだけを見て、最小限の準備でクリアまでたどり着いています。記憶を扱う力も上がっていて、カードを集めて戦うゲーム『Slay the Spire』に「メモを残せる機能」を与えたところ、Opus 4.8よりも大きく成績を伸ばし、最終幕に到達する回数も3倍に増えました。自分でとったメモを見返しながら数時間にわたって作業を続け、つまずいても自分で直していく。こうした自律的な動きが、時間のかかる仕事で効いてくるわけです。

Claude Mythos 5/Fable 5と他モデルのベンチマーク比較表SWE-bench Proなど主要なベンチマークでFable 5がトップに立っています。

Claudeアプリでは危険な質問を見つけるとOpus 4.8に切り替わる

 ここまで強力なモデルを世に出すには、それなりの危険も伴います。サイバーセキュリティや生命科学の分野では、同じ能力が研究者を助ける道具にもなれば、悪意ある人の武器にもなりかねません。そこでAnthropicが採用したのが、危ない話題を見つけると、その質問への回答をひとつ下のOpus 4.8に肩代わりさせる「フォールバック」というしくみでした。

 Claude Fable 5は、すべての質問に対して自動の安全チェックをかけます。見張っているのは3つの領域です。攻撃用のプログラムやウイルスを作るようなサイバー攻撃の手口、実験手法や分子のしくみといった生物・化学に関わる問い、そしてモデルの能力をこっそり抜き取って別のAIを作る「蒸留」の試みです。これらに当てはまると判断されると、回答はClaude Fable 5ではなくOpus 4.8から返ってきます。

 Anthropicによれば、この切り替えが起きるのは平均で全体の5%未満。裏を返せば、95%を超える会話では、Fable 5がそのままMythos 5と変わらない実力で答えてくれるということです。ただし安全を優先したぶん、今の判定はやや広めに設定されていて、害のない質問まで巻き込んでしまうことを同社自身も認めています。バイオ関連の業務文書づくりや医療画像の処理、診療に関する相談、生物の基礎的な教材なども引っかかる場合があるそうです。誤って止めてしまうケースは、これから減らしていく方針が示されました。

 切り替えが起きたときは、モデルが変わった旨の通知が表示され、回答には「どのモデルが答えたか」のラベルが付きます。Claude本体やClaude Cowork、Claude Code、Claude Design、Claude for Microsoft 365では、この自動切り替えが最初からオンになっています。一度切り替わると、その会話の残りはOpusのままになりますが、モデル選択メニューからClaude Fable 5に戻すことはできます。ただし、問題になったリクエストが会話内に残っていると、戻しても再び同じ安全装置に引っかかる場合があります。

攻撃的サイバー評価でClaude Fableのスコアが0になっている棒グラフFable 5は攻撃的なサイバータスクで進展しにくくなるよう安全装置が働きます。

Claude Fable 5とMythos 5は中身が同じで安全機構の強さだけが違う

 混乱しやすいのが、ほぼ同時に登場した「Claude Mythos 5」(読み方:クロード ミュトス ファイブ)という名前との関係です。この2つは中身の基盤モデルがまったく同じで、違うのは安全対策の強さだけです。Fable 5は一般公開向けに安全装置を強めた版、Mythos 5は一部の制限を外し、信頼できる組織だけに渡される限定版という位置づけになります。Fableという名前は、ラテン語のfabula(語られるもの)に由来し、ギリシャ語のmythos(神話)と通じる言葉から付けられました。

 Claude Mythos 5は、サイバー防御に取り組む一部のパートナーや、社会の土台を支えるインフラ事業者に向けて、米国政府と連携した「Project Glasswing」という枠組みを通じて提供されます。世界でも最強クラスのサイバーセキュリティ能力を持つとされ、研究用の試作版だったMythos Previewの後継にあたります。今後は生物学の分野でも信頼できる研究者向けのプログラムが開かれ、生物・化学分野の安全装置を外したFable 5を一部の研究機関に提供する計画もあるそうです。一般の人が自由に触れるMythos級のモデルはあくまでFable 5、と覚えておけば整理しやすいでしょう。

 価格は、入力が100万トークンあたり10ドル、出力が100万トークンあたり50ドルです。Mythos Previewの半分以下に抑えられた一方で、Opus 4.8のちょうど2倍にあたります。料金が倍になる以上、どの工程に効くのかを見極めてから使うのが現実的です。

 なお、Mythos級モデルでは、安全対策のためにプロンプトと出力を30日間保持する方針が示されました。主にゼロデータ保持を設定している法人環境などに影響する変更で、個人向けのFree、Pro、Maxプランについては、既存の安全目的の保持運用があるため今回の変更対象外と説明されています。

各Claudeモデルのミスアラインメント行動スコアを示す棒グラフClaude Mythos 5のミスアラインメント行動スコアは、Opus 4.8とほぼ同水準に抑えられています。

重い調査とアプリ制作を任せるとClaude Fable 5の強さが見えてくる

 早速、Claude Fable 5を使ってみました。しかし、いつもの調査や原稿の執筆をお願いしてもあまりクオリティの向上が体感できませんでした。普段、Opus 4.8の最高設定で使っているため、そもそもの性能が高いこともあるでしょう。

 そこで、開発を行ってもらうことにしました。Claude Desktopアプリで、「Cowork」にウェブアプリを作ってもらいます。まずは、作業用フォルダを用意。

「全国の県庁所在地と東京主要エリアを対象に、本格ウイスキーバーを厳選調査し、各店を2つ以上の情報源で裏取りする。住所、緯度経度、品揃えの根拠、価格帯、営業時間、予約要否、確信度を整理し、閉店店や根拠の弱い店は除外、10軒未満なら正直に示す。最終的にLeaflet地図、カード一覧、絞り込み検索、件数サマリー付きの単体HTMLアプリとして完成させる指示。情報の正確性とデザイン性も重視する」といった内容の1600文字以上のプロンプトを入力しました。

 すると、Claude Fable 5はまず作業計画を立て、複数のエージェントに役割を分けながら調査を進めていきました。ウェブ検索、店舗情報の確認、候補の整理、HTMLアプリの生成といった工程を並行して進めていきます。途中、ウェブページへアクセスする場面などでは許可を求めてくるため、完全放置というわけにはいきません。とはいえ、画面をときどき確認して承認するだけで、作業そのものはかなり自律的に進んでいきました。

ClaudeアプリのモデルメニューでFable 5を選択した画面AIモデルの選択メニューから「Fable 5」を選びます。

 しかし、1時間半が経過したところ、Claudeの5時間ごとの利用量の80%が消費されました。筆者はMax(20x)プランを契約しているので、Proプランの20倍使えます。単発の作業でここまでトークンを使ったのははじめてです。そこで、13都市分の調査が終わったところで、一旦アプリを完成させてもらうことにしました。

 そこからは数分で完成し、最終的に単体で動くHTMLファイルが完成しました。できあがったアプリは、要望通りに地図と店舗カードを備え、地域ごとの絞り込みや件数の確認もできます。単に検索結果を並べただけではなく、店舗ごとに根拠や確信度を持たせている点もよくできています。

 この手のタスクは、見た目のアプリよりも調査の質が重要です。AIによっては、検索でヒットした情報をそのまま雑に拾ってしまうことがありますが、今回の出力を見る限り、候補の選別や閉店リスクへの配慮も入っており、かなり丁寧に精査している印象でした。

 ウェブアプリとしての使い勝手も、最初の出力からかなり実用的でした。地図上のピンから店舗情報へ移動でき、カード一覧でも地域や条件を確認できます。

 もちろん、配色が暗くて文字が読みにくいとか、地図の操作性が悪いなど、改善点は多々あります。実際に公開するなら、人間が店舗情報を最終確認する必要もあります。それでも、調査や整理、実装、デザインをまとめてここまで持ってくる力は、かなり強烈です。

 一方で、利用枠の消費は軽くありません。このアプリの完成には、Max(20x)プランの5時間分のセッションを3回くらい使い切る必要がありそうです。普段はOpus 4.8で開発していますが、今回のように長時間の調査、複数エージェントの実行、HTML生成までまとめて任せると、利用枠の減りはかなり大きいと感じます。Fable 5は気軽に使うモデルというより、重い仕事をまとめて渡し、人間の作業時間を大きく圧縮するためのモデルと考えたほうがよさそうです。

Coworkで複数のエージェントがウイスキーバー調査タスクを進めている画面自分で計画を立て複数のエージェントが必要に応じてツールを使ってタスクを進めます。

完成したウイスキーバー検索アプリの地図と店舗カード表示13都市分の調査結果をもとに、地図と店舗カードを備えたHTMLアプリとして形にしてくれました。

 アプリの作成時には危険を回避する「フォールバック」は起きなかったのですが、この原稿を書いているときに発生しました。「Opus 4.8に切り替えました」と表示され、当たり障りのない回答が出力されます。「安全で通常のコンテンツにもフラグが立つ場合があります」と書かれている通り、誤動作することも多いようです。

 今回は、体験できたので良かったですが、実際に仕事中に多発するのは困ります。海外のユーザーのSNS投稿を見ても、性能には満足しているが、トークンの消費量の多さと「フォールバック」の頻度に不満を覚えている人が多いようです。ここは早く改善して欲しいところですね。

Opus 4.8への切り替えを知らせるフォールバックのメッセージ画面「フォールバック」のメッセージです。

高性能ゆえに「どう安全に届けるか」が新たな焦点になる

 今回のリリースで異例だったのは、性能の数字そのものよりも「出し方」でした。最強のモデルをそのまま開放するのではなく、安全装置を組み込んだ公開版(Claude Fable 5)と、制限を外した審査制の限定版(Claude Mythos 5)に分ける。この二段構えは、AIモデルの競争が、単なる性能勝負から「どこまで安全に任せられるか」という段階へ移りつつあることを映しているように見えます。

 使う側がまず知っておきたいのは、Claude Fable 5はいつでも必ず使えるわけではない、という点です。サイバー攻撃や生物・化学に関わる内容だと、悪用の危険があると判断され、途中でOpus 4.8に切り替わることがあります。業務でこうした分野を扱う人は、回答の品質が途中で変わる可能性を前提にしておいたほうがよいでしょう。

 また、Claude Fable 5の価値は、短い質問では見えにくいと感じました。数行の文章を直す、簡単なアイデアを出す、といった使い方なら、Opus 4.8との差はあまり体感できません。真価が出るのは、長時間の調査、複雑な設計、アプリ制作のように、計画を立てて何段階も作業を進める場面です。試すなら、軽い質問ではなく、数時間かかるような重い仕事を任せてみるのがよさそうです。

 個人向けのサブスクリプションでは、段階的な提供が予定されています。Pro、Max、Team、Enterpriseの各プランでは6月22日まで追加費用なしで使え、6月23日からは利用クレジットが必要になります。十分な提供キャパシティを確保でき次第、サブスクリプションプランの標準機能として戻す方針も示されています。最強の看板に煽られず、まずは自分の現場で再現できるかを小さく試してから本番に乗せる。それが、賢い付き合い方になりそうですね。

記事の要点をまとめた天秤AIメディアの解説インフォグラフィック