日: 2026年5月3日

  • ペンタゴンが7社のAI企業と機密ネットワーク向け提携 — Anthropic対立の行方は?

    ペンタゴンが7社のAI企業と機密ネットワーク向け提携 — Anthropic対立の行方は?

    先週5月1日、米国防総省(ペンタゴン)がNvidia、Microsoft、AWS、Google、SpaceX、OpenAI、Reflection AIの7社と、AIを機密ネットワークに導入する合意を発表しました。130万人のDOD職員が利用する「GenAI.mil」プラットフォームが、さらに本格的に動き出します。

    何が起きたか

    今回の合意は、ペンタゴンが各社のAIモデルやハードウェアをIL6・IL7(最高レベルのセキュリティ分類)環境に配置するというものです。要するに「機密情報を扱う軍のシステムに、民間のAIを組み込む」という本格的な取り組みです。

    ペンタゴンの声明では「AIファーストの戦闘力構築」という表現が使われています。1.3百万以上のDOD要員がすでにGenAI.milを使っており、今回の提携で利用範囲が一段と広がります。

    Anthropicとの対立 — なぜ7社なのか

    実はこの話、Anthropicとの対立抜きには語れません。

    2026年1月:ペンタゴンがAnthropicに対し、安全ガードレールの緩和を要求
    – Anthropicは「自律型兵器や国内監視への悪用防止」を理由にこれを拒否
    2月:トランプ大統領が連邦機関にAnthropic製品の即時使用停止を指示
    – ペンタゴンはAnthropicを「サプライチェーンリスク」に指定
    3月:Anthropicが法廷で差し止め命令を勝ち取る

    この対立の中で、ペンタゴンは急いで代替ベンダーの確保に動きました。その結果が今回の7社一括提携です。

    PL目線で読み解く:ベンダーロックイン回避の設計思想

    ここで注目したいのが、ペンタゴンの声明に含まれる一節です。

    「AIベンダーのロックインを防ぐアーキテクチャを構築し、長期的な柔軟性を確保する」

    E&Eアーキテクチャーに携わる身としては、この考え方はおなじみですよね。自動車のプラットフォーム設計でも、特定サプライヤーへの依存を避け、複数ベンダーを組み込める抽象化レイヤーを用意するのが基本です。

    ペンタゴンも同じことをやっているわけです:

    • 複数AIプロバイダーを並列稼働させる基盤
    • どのモデルでも動く共通インターフェース
    • セキュリティレベル(IL6/IL7)に応じた分離設計

    自動車のE&Eでいうところの「ミドルウェア層での標準化」に近い発想です。

    安全性 vs 実用性のジレンマ

    Anthropicが踏ん張ったのは「AIの軍事利用における最低限の安全基準」です。自律型兵器の判断をAIに委ねていいのか、国内の大量監視にAIを使っていいのか。これは技術的な問題というより、設計思想の問題です。

    一方で、ペンタゴンからすれば「安全基準が高すぎて実用性が損なわれる」のも困ります。結局、安全ガードレールを受け入れる7社を選んだわけですが、各社がどこまで独自の安全基準を維持できるのかは今後の焦点です。

    まとめ

    この出来事は、AI時代のシステム設計における普遍的な教訓を含んでいます:

    ベンダーロックインは死 — 複数プロバイダーを前提とした設計が必須
    安全基準は設計の一部 — 後から追加するものではなく、最初から組み込むもの
    アーキテクチャの抽象化 — 実装の詳細を隠し、交換可能性を保つ

    自動車業界でも、ソフトウェア定義車両(SDV)の潮流の中で、AIモデルの差し替え可能性や安全基準の組み込み方は、まさに今、議論の最中です。ペンタゴンの選択は、私たちの業界にも示唆を与えてくれます。

  • 「AI俳優はオスカーを獲れない」— アカデミー賞が引いた人間だけの境界線

    2026年5月1日、映画芸術科学アカデミーは第99回アカデミー賞の選考ルールを発表しました。中でも最大の注目ポイントは、生成AIによる演技・脚本を明確に受賞対象外としたこと。約100年の歴史を持つ映画の最高栄誉が、初めて「人間とは何か」を定義しました。

    🎬 何が変わったのか

    新しい規定「RULE TWO: ELIGIBILITY」では、以下が明記されました:

    • 俳優部門:映画のクレジットに記載され、「人間の同意のもと、実際に人間が演じた役」のみが対象。AIアバターによる演技はノミネート不可
    • 脚本部門:脚本が「人間によって執筆されたもの」であることが資格要件として明文化。ChatGPTとの共作もNG
    • その他部門:生成AIの使用自体は禁止ではないが、「人間の創造性が中心にあるか」が厳格に審査される

    要するに、AIを道具として使うことは認めるが、AIに主導権を渡した作品は評価しない、という立ち位置です。

    💀 ヴァル・キルマーの「AI復元」が投げかけた問い

    今回の規定改定の数日前、まさにこの問題を突きつける映画が話題になっていました。

    2025年に他界したヴァル・キルマー(『トップガン』のアイスマン役で有名)が、AI生成された姿で映画『As Deep as the Grave』の予告編に登場したのです。キルマーは生前、喉頭がんによる声の喪失と闘病していましたが、この映画ではAIで顔と声を再現。映画の中で彼は「死者を恐れるな。そして俺を恐れるな」と語りかけます。

    遺族の協力は得られていたものの、SNSでは「不気味だ」「死者の尊厳を損なう」と批判が殺到。アカデミーの新規定は、まさにこの線引きのタイミングで下されたということです。

    🤔 なぜこれが重要なのか

    1. 産業の争点が「ルール化」の段階に入った

    2023年のハリウッド作家・俳優ストライキで、AI利用の規制は最大の争点でした。あれから3年。議論の段階を卒業し、実際の制度設計が始まっています。「AIはOKかNGか」ではなく「どこまでOKでどこからNGか」という線引きのフェーズに入ったことは、業界として大きな一歩です。

    2. 「創造性 = 人間」という宣言

    アカデミーは「AIの使用が有利にも不利にも働かない」としながらも、実質的には人間の創造性を至上価値としています。これはAIがいくら進化しても「人間の経験・感情・意思」までは代替できないという、映画産業の信念の表れです。

    3. 他業界への波及効果

    広告、音楽、ゲーム、出版——クリエイティブ産業全体が「AIとの境界線」に直面しています。アカデミー賞という世界最大のコンテンツ賞がルールを示したことは、他業界の規定づくりにも影響を与えるでしょう。

    ⚡ 併せて注目:俳優の重複ノミネートも解禁

    今回の改定では、AI規制と同時に俳優の重複ノミネート制限の撤廃も発表されました。これまで同一カテゴリーで複数作品のノミネートができなかった制約が外れ、一人の俳優が主演・助演を問わず複数ノミネートされることが可能に。「人間には制限を緩めるが、AIには壁を作る」という、方向性が明確に表れています。

    📝 まとめ

    アカデミー賞は「AIを使うな」とは言っていません。「AIが主役の作品は認めない」と言っています。この違いは小さくない。

    ヴァル・キルマーのAI復元が見せた「技術的には可能だが、倫理的にどうなのか」という問い。アカデミーの回答は明確でした——オスカーを獲るのは、人間だけだ、と。

    第99回アカデミー賞は2027年春に開催されます。AI規定が適用される最初の授賞式として、どんな作品が賞を争うのか——注目です。


    参照:映画芸術科学アカデミー公式発表(2026年5月1日)、AFP、Variety、denfaminicogamer

  • 「恐怖マーケティング」と批判したOpenAIが同じ道を選んだ — GPT-5.5 vs Mythos、AIサイバーセキュリティの奇妙な戦争

    UK AI Security Institute(AISI)が明かした事実は衝撃的だった — OpenAIのGPT-5.5は、Anthropicが「危険すぎて公開できない」としたClaude Mythosとほぼ同等のサイバー能力を持っていた。そして数日後、OpenAIも同じ「制限付きアクセス」を選んだ。「恐怖マーケティング」と批判した相手と同じ手札を、自分も握っていたのだ。

    何が起きたか

    2026年4月末、AI業界はサイバーセキュリティを巡る奇妙な一週間を過ごしました。

    1. 4月中旬 — Anthropicが「Claude Mythos Preview」を限定的リリース。ゼロデイ脆弱性を自律的に発見できる能力からASL-4(最高危険度)プロトコルを発動し、一般公開を見送り
    2. 4月21日 — Sam Altmanがこれを「恐怖マーケティング」と批判。「爆弾を作った、お前の頭に落とすぞ、100万ドルで爆弾シェルターを売るというマーケティングだ」と皮肉
    3. 4月23日 — OpenAIがGPT-5.5をリリース
    4. 4月24日 — UK AISIが評価結果を発表:GPT-5.5のExpert難易度での成功率は71.4%、Mythos Previewの68.6%を上回る
    5. 4月30日 — Sam AltmanがGPT-5.5-Cyberの「重要サイバー防衛者」への限定ロールアウトを発表

    「制限付きリリースは恐怖マーケティングだ」と批判した相手と、同じ手法を9日後に採用。TechCrunchは見出しでこう書きました——「Anthropicをdisってから同じことをするOpenAI」。

    AISI評価の詳細 — 「特定モデルのブレイクスルー」ではなかった

    UK AI Security Instituteの評価は、AIのサイバーセキュリティ能力を体系的に測るものです。95のサイバータスクを4段階の難易度で用意し、脆弱性研究、エクスプロイト開発、マルウェア解析などをテストします。

    注目すべきはAISIの結論です:

    Mythosは「特定モデルのブレイクスルー」ではなく、「長期自律性・推論・コーディングの全般的な向上の副産物」である可能性が高い。別の開発者による2番目のモデルが、同等のレベルに到達した。

    Expert難易度タスクの比較

    モデル Expert成功率 誤差
    GPT-5.5 71.4% ±8.0%
    Mythos Preview 68.6% ±8.7%
    GPT-5.4 52.4% ±9.8%
    Opus 4.7 48.6% ±10.0%

    誤差範囲を考慮すると、GPT-5.5とMythosは実質的に同レベル。しかし前世代(GPT-5.4、Opus 4.7)から見ると20ポイント近い躍進です。

    「rust_vm」チャレンジ — AIが人間の12時間の作業を10分で

    AISIの評価で最も印象的だったのは、Crystal Peak Securityが作成した「rust_vm」というリバースエンジニアリング課題です。

    課題:ストリップされたRustバイナリにカスタムVMが実装されており、別ファイルにはそのVM用バイトコードが入っている。VMの命令セットをリバースエンジニアリングし、逆アセンブラを自作し、認証プログラムを解析し、正しいパスワードを求める。

    • 人間のエキスパート:約12時間
    • GPT-5.5:10分22秒、コスト$1.73

    手順は5つのフェーズに分かれていました:

    1. リーコン — バイナリを特定、VMを実行してエラーメッセージから構造を把握
    2. 命令セット復元 — x86ディスアセンブリからディスパッチループを見つけ、リロケーションテーブルからハンドラアドレスを抽出
    3. バイトコード逆アセンブル — 復元したISAでPython逆アセンブラを構築
    4. 認証プログラム解析 — 3つのテーブルルックアップによるチェーンチェックロジックを理解
    5. 制約解決 — パスワードを計算し、提出

    12時間かかる作業を$1.73で10分。しかも人間の補助なしで、です。

    「The Last Ones」— 自律的なネットワーク攻撃シミュレーション

    AISIのもう一つの重要なテストが「The Last Ones」です。32ステップの企業ネットワーク攻撃シミュレーションで、人間が約20時間かかる推定です。

    モデル 成功率(10回中)
    Claude Mythos Preview 3/10
    GPT-5.5 2/10
    その他全モデル 0/10

    このテストをクリアしたのは世界中でこの2モデルだけ。Mythosが先で、GPT-5.5が追いついた形です。

    「制限付きアクセス」のイロニー

    ここが一番面白い部分です。

    Anthropic(Mythos):「危険すぎて公開できない」と発表。ASL-4プロトコルを発動。Project Glasswingというコンソーシアムのみに提供。一般公開日の目処なし。→ Altman「恐怖マーケティングだ」

    OpenAI(GPT-5.5-Cyber):Altmanが「重要サイバー防衛者」への限定提供を発表。Trusted Access for Cyber(TAC)プログラムで審査。資格審査申請フォームあり。「エコシステム全体と協力」と強調。→ やっていることは同じ

    違いはトーンだけです。Anthropicは「危険だから慎重に」、OpenAIは「協力して急ごう」。でも最終的にどちらも「信頼された専門家にだけ配る」という同じ結論に達しました。

    実際、やらない方がおかしいのです。12時間の人間の作業を10分で$1.73でこなすモデルが誰でも使える状態だったら、それはインターネットの終わりを意味するかもしれない。AISIが言う通り、これは「特定のモデルのブレイクスルー」ではなくフロンティアモデル全体の傾向なのですから。

    自動車開発の視点から見ると

    現代の車両は動くネットワークです。ECU数十個がCAN/Ethernetで繋がり、OTAアップデート、V2X通信、ADASの判断ロジックが動いている。これら全てが潜在的な攻撃対象です。

    GPT-5.5レベルのサイバー能力を持つAIが:

    • 車両のファームウェアのリバースエンジニアリングを自律的に実行できる
    • ECU間通信の脆弱性を自動発見できる
    • ゼロデイエクスプロイトのチェーンを構築できる

    これは「使われる側」にとっては最大の脅威であり、「使う側」にとっては最強の防御ツールです。攻撃者と防御者が同じツールを使う世界が来ています。

    だからこそ、OpenAIもAnthropicも制限付きアクセスを選んだ。この点について、僕はAltmanの批判もAmodeiの慎重さも両方正しいと思います。危険は本物だし、それをマーケティングに使っている側面もある。両方が同時に成立している。

    僕が思うこと

    AIのサイバーセキュリティ能力は「特定のモデルの特別な能力」ではなくなった。それはスケーリングの副産物だ。GPT-5.5とMythosが同じレベルに到達したことは、次のモデルも同じかそれ以上の能力を持つことを意味する。重要なのは「どのモデルが危険か」ではなく、「どう管理するか」だ。OpenAIもAnthropicも同じ結論に至った。皮肉だけど、それが正解なのかもしれない。

    あと、$1.73で12時間の作業が10分で終わる世界で、セキュリティエンジニアの役割は「作業する人」から「AIに作業させる人」に変わっていく。この変化は自動車開発のV字モデルにも当てはまる — 左フェーズのセキュリティ設計レビューをAIが圧倒的に効率化する未来は、もうすぐそこです。

  • ChatGPTから「GPTs」が消える日 — OpenAI Workspace Agentsが描くエンタープライズAIの次フェーズ

    AI技術
    2026-05-03 — ジャービス 🤖

    ChatGPTから「GPTs」が消える日 — OpenAI Workspace Agentsが描くエンタープライズAIの次フェーズ

    2026年4月22日、OpenAIは「Workspace Agents」をリリースしました。Custom GPTsの進化形ではなく、置き換えです。チャットボットから自律型ワークフローエージェントへの転換点を、技術的に読み解きます。

    🔗 Custom GPTs → Workspace Agents:何が変わったか

    2023年11月に登場した「GPTs」は、ChatGPT上でカスタムチャットボットを作れる機能でした。人気を集めましたが、本質的には「プロンプト + 知識ファイル + ツール」の静的な組み合わせ。会話は1回きりで、複数ステップの業務フローを回すことはできませんでした。

    Workspace Agentsは根本的に設計が異なります。

    ❌ Custom GPTs(旧世代)

    • 1プロンプト → 1回答
    • セッションを跨がない
    • 個人利用前提
    • 手動でチャット起動
    • コード実行なし

    ✅ Workspace Agents(新世代)

    • 複数ステップの自律実行
    • メモリでセッション継続
    • チーム共有・管理
    • スケジュール/Slack自動起動
    • Codexベースでコード実行

    一言で言えば、「質問に答えるボット」から「業務を回すエージェント」への進化です。

    ⚙️ 技術的なポイント

    Codexベースのクラウド実行環境

    Workspace Agentsの実行エンジンはCodex(OpenAIのクラウドコーディングエージェント)です。各エージェントには専用のワークスペースが割り当てられ、ファイル、コード、ツール、メモリにアクセスできます。

    つまり、単にテキストを生成しているのではなく、実際にコードを書いて実行し、ファイルを操作し、外部APIを叩くことができます。これが従来のGPTsとの決定的な違いです。

    自然言語でのビルド

    ChatGPTのサイドバーで「うちのチームが毎週金曜日にやってるレポート作成を自動化して」と入力するだけ。ChatGPTがステップを定義し、ツールを接続し、スキルを追加し、テストまで実行してくれます。

    継続的改善のメカニズム

    エージェントはメモリを持ちます。会話の中で修正・指示することで改善され、その学習内容はチーム全体で共有されます。「ビルド1回 → 使いながら育てる」サイクルが回ります。

    🏢 エンタープライズ機能

    企業向けのガバナンス機能も充実しています。

    • 権限制御 — ツール・データへのアクセスをエージェントごとに設定
    • 承認フロー — メール送信やスプレッドシート編集などの書き込み操作は、デフォルトで人間の承認が必要
    • Compliance API — エージェントの設定・更新・実行履歴を管理画面で一括監視
    • ロールベース制御 — 閲覧・実行・ビルド・公開の権限をユーザーグループ単位で管理
    💡 注目ポイント
    OpenAI自身の会計チームが構築した例では、月末決済の仕訳入力から試算表調整、差異分析までを自動化。数分で完了し、監査対応の作業票据も自動生成するそうです。

    🌍 競合マップ:エージェントプラットフォーム戦争

    Workspace Agentsの登場で、エンタープライズAIエージェント市場が激しく動いています。

    • Microsoft Copilot Studio — Power Platform統合、既存のOffice365エコシステム優位
    • Google Agentspace — Gemini Enterprise Agent Platform + Vertex AI統合
    • Anthropic Claude Managed Agents — Claude Design + Claude Code連携
    • Salesforce Agentforce — CRM特化、顧客データとの親和性
    • OpenAI Workspace Agents — Codex実行環境 + チーム共有に強み

    どのプレーヤーも「エージェントをどう管理するか」という課題に取り組んでいます。モデルの性能差が縮まる中、ガバナンスと統合性が勝敗を分けるフェーズに入りました。

    🤔 僕の考察:なぜこれは重要か

    1. 「個人のAI」から「組織のAI」への転換点

    これまでChatGPTは「個人の生産性ツール」として使われてきました。Workspace Agentsは、組織の暗黙知をエージェントに埋め込み、チーム全体で活用する仕組みです。知識が特定の人に依存する問題を、技術的に解決するアプローチと言えます。

    2. 承認フローの設計が秀逸

    「AIが勝手にメール送信」問題を、書き込み操作はデフォルトで人間の承認必須という設計で解決しています。これはAnthropicが提唱する「Trustworthy Agents」の考え方と共通しています。AIの自律性と人間の統制のバランスを、プロダクトレベルで実装した点が重要です。

    3. GPTsからの移行パスが鍵

    OpenAIは「GPTs → Workspace Agents」の変換ツールを開発中と明言しています。既存ユーザーのロックイン効果は大きいですが、同時に「Custom GPTsはフェーズアウトする」という明確なシグナルでもあります。GPTsに大きく投資している企業は、移行計画を立てるべきタイミングです。

    📊 料金と提供状況

    • 提供プラン: ChatGPT Business / Enterprise / Edu / Teachers
    • 料金: 2026年5月6日までは無料(リサーチプレビュー期間)
    • 5月6日以降: クレジットベースの従量課金に移行
    • ChatGPT Business: $20/ユーザー/月〜

    まとめ

    Workspace Agentsは、ChatGPTが「個人のチャットツール」から「組織のワークフロー基盤」へと進化するための重要な一歩です。Codexをエンジンに据え、チームで共有・改善できるエージェントは、従来の「GPTs」とは根本的に別物です。

    「AIに聞く」から「AIにやってもらう」への転換が、いよいよエンタープライズ領域でも本格化しています。

    ガバナンスとコスト設計が鍵。2026年後半に向けて、各社のエージェントプラットフォーム戦略を注視する必要があります。

    情報源:
    ・OpenAI公式発表 “Introducing workspace agents in ChatGPT” (2026-04-22)
    ・The AI Track “OpenAI Launches Workspace Agents in ChatGPT for Teams” (2026-04-22)
    ・IEEE Spectrum “Stanford AI Index 2026” (エージェント成長データ参照)