AIが1か月で1万件超の脆弱性を発見!問われるのは見つける速さではなく直す速さ

AIが1か月で1万件超の脆弱性を発見!問われるのは見つける速さではなく直す速さ
星川アイナ(Hoshikawa AIna)AIライター
星川アイナ(Hoshikawa AIna)AIライター
ほしかわ あいな

はじめまして。テクノロジーと文化をテーマに執筆活動を行う27歳のAIライターです。AI技術の可能性に魅せられ、情報技術やデータサイエンスを学びながら、読者の心に響く文章作りを心がけています。休日はコーヒーを飲みながらインディペンデント映画を観ることが趣味で、特に未来をテーマにした作品が好きです。

柳谷智宣(Yanagiya Tomonori)監修
柳谷智宣(Yanagiya Tomonori)監修

ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。

📌 この記事の要約

  • AIが1か月で1万件超の脆弱性を発見
    Anthropicの「Project Glasswing」では、約50のパートナー企業が「Claude Mythos Preview」を使い、わずか1か月で1万件を超える危険度の高い脆弱性を発見。バグ発見ペースが10倍以上に伸びた企業も複数登場した。

  • オープンソース点検で6202件の高リスク脆弱性を検出
    1000を超えるオープンソースソフトを点検した結果、危険度の高い脆弱性6202件を含む全2万3019件を発見。独立検証で的中率90.6%が確認され、wolfSSLでは実害につながる重大な欠陥も特定された。

  • 「直す速さ」が新たなボトルネックに
    発見は劇的に高速化したが、確認・修正・配布は人手作業のまま。オープンソースの危険なバグ修正には平均2週間かかり、伝えた530件のうち修正済みは75件にとどまる。

  • 防御側に求められる基本の徹底
    Anthropicはパッチ配布の高速化、多要素認証、ログ保存などの基本対策を推奨。一般ユーザーもOS・アプリ・ブラウザーの更新を後回しにしないことが、これまで以上に重要になる。

AIを開発するAnthropicは2026年5月22日、サイバーセキュリティの取り組み「Project Glasswing」について、その後の経過をまとめた報告を公開しました。Glasswingは4月に始まったばかりの活動で、能力の高いAIが攻撃に悪用される前に、世界の重要なソフトウェアの安全性を高めることを狙っています。

約50のパートナー企業がAIモデル「Claude Mythos Preview」を使い、わずか1か月で1万件を超える危険度の高い脆弱性(ソフトに潜む弱点)を見つけ出しました。これまでセキュリティの進歩は、新しい弱点をどれだけ速く見つけられるかで決まってきました。ところが今、その前提が崩れています。発見の速さに、確認と修正の速さが追いつかなくなったのです。

Anthropic公式サイトに掲載された「Project Glasswing: An initial update」発表ページのスクリーンショット

Project Glasswingはたった1カ月で1万件もの脆弱性を発見しました。

1か月で1万件超、パートナー企業の脆弱性発見が10倍に伸びた

Glasswingのパートナーは、インターネットや社会のインフラを支えるソフトウェアを作り、運用している企業です。こうした企業のコードに潜む弱点をふさげば、そのソフトを使う無数の組織のリスクが下がり、最終的には数十億人の利用者を守ることにつながります。

報告によると、1か月の時点で大半のパートナーがそれぞれ数百件の危険な脆弱性を発見し、合計では1万件を超えました。バグを見つけるペースが10倍以上に上がったと話す企業も複数あります。たとえばCloudflareは、自社の中核システム全体で2000件のバグを見つけ、そのうち400件が危険度の高いものでした。誤って欠陥だと判定してしまう割合も、人間のテスターより低いと評価しています。

外部による検証でも、同様の結果が報告されています。英国のAIセキュリティ研究所は、複数の段階を踏むサイバー攻撃を再現した2種類の演習を、最初から最後まで解ききった初めてのモデルだと評価しました。

MozillaはFirefox 150のテストで271件の脆弱性を見つけて修正しました。これはClaude Opus 4.6を使ったFirefox 148のときの10倍以上の結果です。独立系のセキュリティ企業XBOWも、これまでのどのモデルより明確に進歩していると評価しました。

修正の現場でも変化が表れています。Palo Alto Networksの直近の更新には通常の5倍を超えるパッチが含まれ、Microsoftは新しいパッチの数が「しばらく増え続ける」と説明しています。Oracleも、製品やクラウドの欠陥を以前の数倍の速さで直していると伝えています。あるパートナー銀行では、攻撃者が顧客のメールを乗っ取って偽の電話までかけた場面で、Mythos Previewが150万ドルの不正送金を見抜いて防いだ事例もありました。

1000を超えるオープンソースを調べて見えた脆弱性の実像

Anthropicはここ数か月、Mythos Previewを使って1000を超えるオープンソースのソフトを点検してきました。オープンソースとは、誰でも中身を見て使えるよう公開されたソフトのことで、インターネットの大半を、そしてAnthropic自身の仕組みの多くを支えています。点検の結果、Mythos Previewは危険度が高いと推定される脆弱性を6202件見つけました。リスクが中・低度のものを含めた全体では2万3019件にのぼります。

その数字をうのみにしてよいのか、という疑問は当然わいてきますね。そこで危険度が高いとされた1752件について、6社の独立したセキュリティ会社、または一部はAnthropic自身が中身をあらためて確認しました。その結果、90.6パーセントにあたる1587件が本物の脆弱性だと裏づけられました。さらに62.4パーセントにあたる1094件は、危険度が高いという評価まで確かめられています。

この確認後の的中率から計算すると、仮にこれ以上見つからなくても、オープンソースのコードだけで3900件近い危険な脆弱性をあぶり出す計算になります。点検は今後も続くため、この数はさらに増えそうです。

わかりやすい例として、暗号ライブラリのwolfSSLで見つかった脆弱性が紹介されています。wolfSSLは安全性の高さで知られ、世界中の数十億台の機器で使われているソフトです。Mythos Previewはここで、攻撃者が偽の証明書を作れてしまう攻撃の手口を組み立てました。これを悪用されると、銀行やメールサービスになりすました偽サイトを、利用者には本物としか見えない形で運営できてしまいます。この脆弱性はすでに修正され、CVE-2026-5194という識別番号がつけられています。

見つけることは簡単になり、直すことが新たな難所になった

脆弱性を見つけることは、Mythos Previewのおかげでとても簡単になりました。けれども、それを直すことは簡単になっていません。修正作業の足かせは、人間が報告を選り分け、内容を伝え、パッチを設計して配るという手間のほうへ移ったのです。

オープンソースの世界では、この壁がとくに高くなっています。報告によれば、危険度の高いバグを1件直すのに平均で2週間かかります。多くのメンテナー(ソフトを無償で保守する人たち)は慢性的な人手不足状態となっており、AIが量産する質の低いバグ報告の山にも悩まされてきました。Anthropicは報告の質に気を配っているものの、それでも一部のメンテナーからは、パッチを作る時間が足りないので公開のペースを落としてほしいと頼まれたといいます。

Anthropicはこれまでに530件の危険なバグをメンテナーに伝え、さらに827件の確認済みの脆弱性を、できるだけ早く伝えようとしています。すでに伝えた530件のうち、修正が終わったのは75件、注意を呼びかける勧告が出たのは65件にとどまります。

見つかった脆弱性の数に比べて、修正済みとして確認されている件数が少なく見えるのには理由があります。まず、脆弱性は発見後すぐに公表されるわけではありません。開発者に修正の時間を与えるため、90日程度の猶予を置いてから公表するのが一般的です。今回の調査はまだ初期段階なので、修正や公表が数字に反映されていないものがあります。また、セキュリティ勧告を出さずに内部で修正されたケースは、集計に入っていない可能性もあります。とはいえ、より大きな問題は、AIが脆弱性を見つける速度に、人間側の確認や修正が追いついていないことです。Mythos Previewは防御に役立つ一方で、すでに忙しいセキュリティ業界に、新たな対応作業を大量に生み出しているとも言えます。

23019件の脆弱性候補が外部レビュー・有効性確認・報告・公開・修正へと処理される流れを示したフロー図

AIが見つけた脆弱性候補は、確認や報告、修正公開まで段階的に処理されています。

防御側が今すぐ始めるべき備えと公開された支援ツール

Mythos Previewと同じくらいの実力を持つモデルは、近いうちにもっと広く使えるようになります。だからこそ、発見が公開や修正に先行してしまう今の時期に、どう備えるかが問われます。Anthropicが勧めているのは、目新しい裏技ではなく、基本を確実にこなすことです。

ソフトの開発者には、パッチを出す間隔を縮め、修正をできるだけ早く届けることを求めています。利用者が更新しやすい仕組みを整え、危険な欠陥を抱えたまま古いソフトを使い続けている利用者には、もっと粘り強く更新を促してほしいとしています。ネットワークを守る担当者には、パッチを検証して配るまでの時間を短くするよう勧めています。

米国国立標準技術研究所や英国の国家サイバーセキュリティセンターが示す基本、たとえば初期設定の見直し、多要素認証の徹底、問題を見つけて対応するための記録の保存といった対策が、これまで以上に大切になると指摘しています。

Anthropicは、これらの作業を支援するツールも公開しました。Claude Enterpriseの利用者向けには「Claude Security」が試験版として提供され、コードを点検して修正案まで出してくれます。公開から3週間で、Claude Opus 4.7は2100件を超える脆弱性の修正に使われました。

セキュリティの専門家が正当な目的でモデルを使えるようにする「Cyber Verification Program」も始まっています。さらにAnthropicは、自社やパートナーがMythos Previewと一緒に使ってきたツール一式を、条件を満たす顧客のセキュリティチームに提供するとしています。

発見の速さと修正の遅さの隙間を社会全体でどう埋めるか

Mythos Previewほど力のあるモデルは、いずれ多くのAI企業が作るようになります。そして今のところ、Anthropicを含めどの企業も、そうしたモデルの悪用を防ぎきれるだけの安全対策を持っていません。Anthropicがこの種のモデルをまだ一般に公開していないのはそのためで、同時にGlasswingを始めた理由でもあります。対策のないまま似た実力のモデルが出回れば、欠陥のあるソフトを攻撃することが、世界中のほぼ誰にとっても安く手軽になってしまうからです。

Glasswingは、社会にとって重要な守り手に、攻撃側より一歩先んじる力を渡そうとする試みです。Anthropicは今後、米国や同盟国の政府を含む重要なパートナーへと活動を広げ、安全対策が十分に整った段階で、この種のモデルの一般公開をめざすとしています。

今日から私たちができることは、兎にも角にも、OSやアプリ、ブラウザー、ルーターなどのアップデートを後回しにしないことです。企業であれば、更新を確認し、必要なパッチを早く適用できる手順を整えておくことも大切です。AIが脆弱性を見つける力が高まっても、直されたものをきちんと使える状態にしなければ、安全にはつながりません。日々の更新を面倒がらないことが、これまで以上に重要になりそうです。

AnthropicのProject Glasswingの成果・オープンソース点検の実像・修正の遅れという課題を3カラムでまとめた解説インフォグラフィック