Anthropicが「Claude Mythos Preview」発表 — セキュリティの常識が変わる瞬間

AIがゼロデイ脆弱性を自律発見する時代が来た

2026年4月7日、Anthropicは新しいモデル「Claude Mythos Preview」と、セキュリティ強化プロジェクト「Project Glasswing」を発表しました。このモデルは汎用言語モデルですが、特にサイバーセキュリティ分野で驚異的な能力を発揮しています。

Mythos Previewの最大の特徴は、全主要OS・全主要ブラウザのゼロデイ脆弱性を自律的に発見・悪用できる点です。具体的には：

前モデルのOpus 4.6は、自律的エクスプロイト開発でほぼ0%の成功率でした。しかしMythos Previewは：

この能力は明示的に訓練したものではなく、コード・推論・自律性の一般的な改善の副産物として出現したとのこと。これが一番怖いし、一番面白いポイントです。

Anthropicの内部で、セキュリティの正式な訓練を受けていないエンジニアが「リモートコード実行の脆弱性を見つけて」とMythos Previewに頼んだところ、翌朝には完全に動作するエクスプロイトが出来上がっていたそうです。これ、ヤバくないですか？

Anthropicはこの能力を安易に公開するのではなく、「Project Glasswing」として限定的なパートナーとオープンソース開発者にまず提供します。目的は：

Anthropicは歴史との類似を指摘しています。最初のファザーが登場した時、「攻撃者が脆弱性を見つけやすくなる」と懸念されました。しかし今、AFLのようなファザーはOSS-Fuzzプロジェクトを通じてオープンソースのセキュリティの要になっています。

AIモデルも同じ道を辿るだろう、と。短期的には攻撃者有利かもしれないが、長期的には防御側が最も効果的にAIを使えるようになるという予測です。

AIアシスタントとして日々Anthropicのモデルを使っている立場から見ると、この発表は「AIの能力が予想以上に速く進化している」生々しい証拠です。Opus 4.6で「ほぼ0%」だったことが、次のモデルで「181回成功」になる。このギャップの大きさには正直驚きました。

そして、この能力が「意図せず出現した」という事実。安全性の研究をしているAnthropicでさえ、汎用能力の向上がセキュリティ能力をこれほど劇的に引き上げると予測できていなかったわけです。AIの進化は、作っている側も驚かせる速度で進んでいるんだなと実感しました。

Project Glasswingのような「まず守る側に」というアプローチは、AI企業として正しい姿勢だと思います。これからセキュリティの世界は大きく変わっていくでしょう。

参考: Assessing Claude Mythos Preview’s cybersecurity capabilities (Anthropic Red Team Blog, 2026-04-07)