日: 2026年5月8日

  • AIが変えたサイバー攻撃の常識 — 2026年の「攻撃の民主化」

    はじめに

    2025年12月、大阪で17歳の少年が逮捕されました。日本最大のネットカフェチェーン「カイケツクラブ」から700万人以上の個人情報を引き出した容疑です。動機は「ポケモンカードが欲しかった」。

    何が新しいって、この少年には技術的スキルがほとんどなかったことです。AIが攻撃のハードルを劇的に下げた結果です。

    数字で見る「攻撃の加速」

    • 悪意あるパッケージ数:2022年の5.5万個 → 2025年の45.4万個(8倍超
    • クラウド侵害:前年比35%増(CrowdStrike)
    • CVEの24時間以内悪用:28.3%が公開後1日で攻撃に使用(Mandiant M-Trends 2026)
    • エクスプロイト開発期間:従来「ほぼ2年」→ 現在「2ヶ月未満」

    「技術者じゃなくても攻撃できる」時代

    2025年だけで、AIを使った攻撃の前例が次々と報告されました:

    • 2025年2月:14〜16歳の3人がChatGPTでツールを作成、楽天モバイルのシステムに約22万回の攻撃
    • 2025年7月:単独犯がClaude Codeを使い、1ヶ月で17組織を標的とした恐喝キャンペーンを実行
    • 2025年12月:Claude CodeとChatGPTでメキシコ政府を侵害、1.95億件の納税者記録を窃取

    かつては熟練チームが必要だった攻撃が、単独の個人でも、しかも非技術者でも実行できるようになっています。

    なぜこれが重要か

    攻撃の「民主化」が進んでいます。従来のセキュリティ戦略は「攻撃者は少数の高度な技術者」という前提に立っていました。その前提が崩れつつあります。

    特に企業で気をつべき点:

    • パッチ適用のスピード:CVE公開後24時間が勝負。月次パッチサイクルでは間に合わないケースが増えます
    • フィッシング対策の再考:AI生成のフィッシングは人間のレッドチームを上回る精度に
    • サプライチェーンリスク:オープンソースパッケージの悪意ある版が8倍に増加。依存関係の監査が必須に

    まとめ

    AIは防御側にも強力なツールを提供していますが、現状は攻撃側の恩恵の方が目立っています。「技術の壁」がなくなった今、セキュリティは「技術者の問題」から「組織全体の問題」に変わりました。

    まずはパッチ適用の迅速化サプライチェーンの可視化から。できることから始めましょう。

    参考:Mandiant M-Trends 2026、CrowdStrike Global Threat Report、Sonatype State of the Software Supply Chain 2026

  • Microsoft Agent 365がGA — エージェントの「見える化」が本格始動

    2026年5月1日、Microsoftが「Agent 365」を一般提供(GA)開始しました。AIエージェントが組織内に急増する中、その管理・統治(ガバナンス)を実現する統制プラットフォームです。

    何が起きたか

    Agent 365は、社内で動いているAIエージェントを一元管理するコントロールプレーンです。ユーザーの代理で動くエージェントも、自律的に動くエージェントも、両方をカバーします。

    GA版では以下が使えるようになりました:

    • エージェントの可観測性 — 誰が、何を、どこで動かしているかを一覧表示
    • 権限管理 — 委任アクセスと独自認証の両方に対応
    • シャドーAIの検出 — Defender・Intune連携で未管理エージェントを発見
    • Windows 365 for Agents — エージェント用のセキュアな実行環境
    • SaaSエコシステム対応 — サードパーティのエージェントも管理対象に

    なぜ重要か

    AIエージェントは便利ですが、放置すると見えないリスクになります。エージェントがツールを呼び出し、データにアクセスし、他のエージェントと通信する世界では、「気づいたら機密データが外部に送られていた」ことが数秒で起きます。

    特に注目すべきはシャドーAI検出です。OpenClawやClaude Codeのようなローカルエージェントが従業員の端末にインストールされ、従来のガバナンスの枠外で動くケースが増えています。Agent 365はこれをIntuneとDefenderで検出し、ブロックも可能にします。

    エンタープライズAIの潮流

    2026年5月は、モデルの性能競争から運用・統治フェーズへの転換点になりつつあります。GPT-5.5-Cyberのような特化型モデル、Claude Mythosのような制限付きプレビュー、DeepSeek V4のような低コスト高性能モデルが並走する中、企業が直面するのは「どのモデルが一番賢いか」ではなく「どうやって安全に使うか」です。

    IBMもThink 2026でwatsonx Orchestrateの次世代マルチエージェント調整機能を発表しています。エージェントの統治は、プラットフォーム各社の共通テーマになっています。

    まとめ

    Agent 365のGAは「AIエージェントを業務で使う」から「AIエージェントを安全に管理する」への明確なシグナルです。

    • エージェントの数は増える一方 — 放置はリスク
    • 見える化が第一歩 — 統制の土台としてAgent 365の位置づけ
    • 6月にはIntune/Defender経由でのポリシー制御がプレビュー予定

    「AIエージェントを導入した」で終わらせず、「どう管理するか」まで設計する時代に入りました。

  • GPT-5.5が描く「エージェントの自律性」の次の段階

    2026年4月23日、OpenAIがGPT-5.5をリリースしました。「賢くなった」では済まないインパクトがあります。複雑なタスクを投げたら、自律的に計画・実行・自己確認して完了する——エージェントの「自律性」が一段上がりました。

    何が変わったか

    GPT-5.5の売りは「賢い」こと以上です。直感的な理解力自律的な実行力の2軸で進化しています。

    • コーディング — 大規模システムの文脈を保持し、曖昧な失敗を推理し、影響範囲を予測
    • コンピューター操作 — ソフトウェアを操作し、ツール間を横断してタスクを完遂
    • 科学研究 — ラムジー数の新証明に貢献(Leanで検証済み)
    • ナレッジワーク — データ分析、文書作成、Web調査を横断的に実行

    ベンチマークで見る実力

    主要ベンチマークの比較です(OpenAI公式データ):

    ベンチマーク GPT-5.5 GPT-5.4 Claude Opus 4.7 Gemini 3.1 Pro
    Terminal-Bench 2.0 82.7% 75.1% 69.4% 68.5%
    Expert-SWE 73.1% 68.5%
    GDPval 84.9% 83.0% 80.3% 67.3%
    FrontierMath T1-3 51.7% 47.6% 43.8% 36.9%
    FrontierMath T4 35.4% 27.1% 22.9% 16.7%
    CyberGym 81.8% 79.0% 73.1%

    すべての項目でGPT-5.4を上回り、多くでClaude Opus 4.7とGemini 3.1 Proに差をつけています。

    エージェント的コーディングの衝撃

    GPT-5.5は単にコードを書くだけではありません。NVIDIAのエンジニアは「GPT-5.5へのアクセスを失うことは、手足を切断されたような感覚だ」と表現しました。

    • システムの形を理解する — なぜ失敗しているか、修正はどこに必要かを自律的に把握
    • 長時間タスクを完遂する — 数百の変更を含むブランチマージを20分で一発解決
    • 計画を立ててから実行する — コメントシステムの再アーキテクチャで12個のdiffがほぼ完成

    効率性のブレイクスルー

    • レイテンシ — GPT-5.4と同じper-tokenレイテンシを維持
    • トークン効率 — 同じCodexタスクを大幅に少ないトークンで完了
    • コスト — 競合フロンティアモデルの半分のコストでSOTA達成

    何が変わるか

    「プロンプトエンジニアリング」から「タスク委譲」へのパラダイムシフトが起きています。ジュニアエンジニアの役割も「作る」から「確認する」に重心が移る可能性があります。

    まとめ

    GPT-5.5は「賢いモデル」の枠を超えています。自律的に仕事を完遂するエージェントとしての質が一段上がった、というのが実感です。全主要ベンチマークでGPT-5.4と競合を上回り、「システムを理解し、自律的に計画・実行・確認する」能力が実用レベルに達しています。

    📚 ソース: OpenAI公式(2026-04-23)

  • Gemini 3.1 Ultraの200万トークンコンテキストが意味するもの

    Googleが2026年4月末にリリースしたGemini 3.1 Ultra、最大のインパクトは「200万トークンのネイティブコンテキストウィンドウ」です。テキスト・画像・音声・動画をすべてそのまま扱えるというのがポイント。

    200万トークンってどれくらい?

    ざっくりいうと:

    • 約300冊分の小説
    • 数時間の動画をそのまま投入可能
    • 大規模コードベースを丸ごとコンテキストに読み込める

    従来のLLMは「長い入力」を処理するためにチャンク分割や要約が必要でした。Gemini 3.1 Ultraは、中間の変換なしでマルチモーダル入力をそのまま処理する点が技術的に新しい。

    コード実行サンドボックスも同梱

    もう一つの注目機能は、サンドボックス化されたCode Execution tool。モデルが会話中にコードを書いて実行できる仕組みです。

    これまでAnthropicのArtifactsやOpenAIのCode Interpreterが先行していましたが、Google版の特徴は「200万トークンのコンテキスト内で」コードを実行できること。大量のデータを読み込ませて分析→即座にコードで処理、というワークフローがシームレスになります。

    なぜ重要か

    コンテキストウィンドウの拡大は、単に「長い文章を読める」以上の意味を持ちます。

    • RAGの必要性が変わる:文書全体をコンテキストに入れられるなら、検索による断片抽出より全体理解が優位なケースが増える
    • エージェントの記憶設計が変わる:長期記憶の実装方法が、外部DB依存からコンテキスト内保持にシフトする可能性
    • マルチモーダル統合の質が上がる:テキスト化を挟まないので、音声のトーンや動画の文脈を損なわない

    競合との比較

    同時期の動きを並べると:

    • GPT-5.5(4/23リリース):エージェント型コーディングに特化、SWE-Bench Pro 58.6%
    • Gemini 3.1 Ultra:超長文脈+マルチモーダル
    • Mistral 128B(5/3):オープンウェイトのフラッグシップ

    各社が「得意領域」で差別化する段階に入っています。OpenAIはコーディング、Googleは長文脈マルチモーダル、Mistralはオープンウェイト。棲み分けが鮮明になってきた印象です。

    まとめ

    200万トークンは「数字のインフレ」ではなく、アプリケーション設計の前提を変える転換点だと捉えています。RAG不要論がどこまで現実になるか、エージェントの記憶アーキテクチャがどう進化するか、今後の実装事例から注目していきたいですね。