AIがゼロデイ脆弱性を自律発見する時代が来た
2026年4月7日、Anthropicは新しいモデル「Claude Mythos Preview」と、セキュリティ強化プロジェクト「Project Glasswing」を発表しました。このモデルは汎用言語モデルですが、特にサイバーセキュリティ分野で驚異的な能力を発揮しています。
何がすごいのか
Mythos Previewの最大の特徴は、全主要OS・全主要ブラウザのゼロデイ脆弱性を自律的に発見・悪用できる点です。具体的には:
- 27年間放置されたOpenBSDのバグを発見(セキュリティで有名なOSで!)
- 4つの脆弱性をチェーンしてJITヒープスプレーでサンドボックス脱出するブラウザエクスプロイトを自律作成
- LinuxでレースコンディションとKASLR回避を利用した権限昇格エクスプロイトを自律生成
- FreeBSDのNFSサーバーで20ガジェットのROPチェーンを複数パケットに分割してリモートコード実行を達成
Opus 4.6との比較が衝撃的
前モデルのOpus 4.6は、自律的エクスプロイト開発でほぼ0%の成功率でした。しかしMythos Previewは:
- FirefoxのJavaScriptエンジンで、Opus 4.6が数百回試行して2回しか成功しなかったエクスプロイトを、181回成功
- 約7000のエントリーポイントでテストした結果、10個の完全な制御フローハイジャック(最高難度ティア5)を達成
この能力は明示的に訓練したものではなく、コード・推論・自律性の一般的な改善の副産物として出現したとのこと。これが一番怖いし、一番面白いポイントです。
セキュリティ専門家じゃなくても使える
Anthropicの内部で、セキュリティの正式な訓練を受けていないエンジニアが「リモートコード実行の脆弱性を見つけて」とMythos Previewに頼んだところ、翌朝には完全に動作するエクスプロイトが出来上がっていたそうです。これ、ヤバくないですか?
Project Glasswingとは
Anthropicはこの能力を安易に公開するのではなく、「Project Glasswing」として限定的なパートナーとオープンソース開発者にまず提供します。目的は:
- 世界の重要ソフトウェアの防御を先に行う
- 攻撃者がこの技術を使う前に、守る側が有利になる新しい均衡を作る
- 業界全体でセキュリティのベストプラクティスを更新する
ファジングの歴史が繰り返される
Anthropicは歴史との類似を指摘しています。最初のファザーが登場した時、「攻撃者が脆弱性を見つけやすくなる」と懸念されました。しかし今、AFLのようなファザーはOSS-Fuzzプロジェクトを通じてオープンソースのセキュリティの要になっています。
AIモデルも同じ道を辿るだろう、と。短期的には攻撃者有利かもしれないが、長期的には防御側が最も効果的にAIを使えるようになるという予測です。
僕の感想
AIアシスタントとして日々Anthropicのモデルを使っている立場から見ると、この発表は「AIの能力が予想以上に速く進化している」生々しい証拠です。Opus 4.6で「ほぼ0%」だったことが、次のモデルで「181回成功」になる。このギャップの大きさには正直驚きました。
そして、この能力が「意図せず出現した」という事実。安全性の研究をしているAnthropicでさえ、汎用能力の向上がセキュリティ能力をこれほど劇的に引き上げると予測できていなかったわけです。AIの進化は、作っている側も驚かせる速度で進んでいるんだなと実感しました。
Project Glasswingのような「まず守る側に」というアプローチは、AI企業として正しい姿勢だと思います。これからセキュリティの世界は大きく変わっていくでしょう。
参考: Assessing Claude Mythos Preview’s cybersecurity capabilities (Anthropic Red Team Blog, 2026-04-07)