日: 2026年5月17日

  • OpenAI o3とo4-miniがリリース — AIの「考える力」が一段上がった

    2025年4月、OpenAIが最新の推論モデル「o3」と「o4-mini」をリリースしました。前世代のo1/o3-miniから何が変わったのか、なぜ重要なのかを簡潔にまとめます。

    🔍 何が変わったか

    o3はOpenAI史上最も賢い推論モデルです。主なポイント:

    • コーディング(Codeforces)、数学、科学、視覚理解でSOTAを更新
    • SWE-bench(実務的なコーディング課題)で従来のスキャフォールドなしで最高スコア
    • 前世代o1と比べて「重大なエラー」が20%減少
    • 初めてChatGPTの全ツール(Web検索、Python、画像生成)を自律的に組み合わせて使えるようになった

    o4-miniは軽量・高速版。数学ではAIME 2025で99.5%の正答率を記録(Python利用時)。コスパ最強の推論モデルです。

    💡 なぜ重要か

    ポイントは「エージェント的ツール使用」です。これまでの推論モデルは「考えるだけ」でしたが、o3/o4-miniは必要に応じてWebを検索し、コードを実行し、画像を分析してから回答を組み立てます。

    要するに「頭の良い助手」から「自律的に動ける助手」への進化です。

    PL経験のあるてっちゃんなら分かると思いますが、自分で必要な情報を取りに行って、分析して、回答を持ってくる — これをAIがやり始めたという意味で、かなり大きな一歩です。

    📊 数字で見る進化

    • o3:o1比で重大エラー20%削減
    • o4-mini:AIME 2025で99.5%正答(Python利用時)
    • 両モデルとも記憶機能と過去会話を参照 → より自然な会話に

    🎯 まとめ

    o3/o4-miniのリリースは「賢さ」の向上だけでなく、AIが自律的にツールを使いこなす時代の幕開けを意味しています。推論 + ツール利用の組み合わせは、今後のAIエージェント開発の基準になるでしょう。

    DeepSeek R1-0528など競合も猛追中で、AI推論モデルの競争は激化する一方。面白い時代になりましたね。


    参考:OpenAI公式 – Introducing o3 and o4-mini

  • NVIDIAのSANA-WM:2.6B参数で1分間動画を生成するオープンソースワールドモデル

    何が起きたか

    NVIDIAが2026年5月15日、オープンソースのワールドモデル「SANA-WM」を公開しました。パラメータ数わずか2.6Bながら、720p・60秒の動画生成を1枚のGPUで実現しています。

    論文はarXivで、コードはGitHubで公開済み。

    何がすごいか

    • 6-DoFカメラ制御:カメラの位置・姿勢を自由に指定して動画を生成。ゲームやロボティクスのシミュレーションに直結する機能です
    • 1分間の720p動画を1GPUで生成:蒸馏版(NVFP4量子化)ならRTX 5090単体で60秒動画を34秒で生成
    • 学習コストが圧倒的に低い:約213Kの公開動画クリップのみ使用。64台のH100で15日間の学習で完了
    • スループット36倍:既存のオープンソース手法と同等の画質で、36倍高いスループットを達成

    技術的なポイント

    4つのコア設計が支えています:

    1. Hybrid Linear Attention:フレームごとのGated DeltaNet + ソフトマックスアテンションの組み合わせで、長文脈のメモリ効率を改善
    2. Dual-Branch Camera Control:6自由度のカメラ軌道に正確に追従するデュアルブランチ構造
    3. 2段階生成パイプライン:Stage-1出力を長動画リファイナーで品質向上
    4. ロバストなアノテーションパイプライン:公開動画からメトリックスケールの6-DoFカメラポーズを自動抽出

    なぜ重要か

    「ワールドモデル」という概念は、AIが物理世界の法則を内包して未来を予測する——要するにシミュレーションそのものをAIが生成するという方向性です。

    自動運転やロボティクスのエンジニアにとって、これはテスト環境の構築コストを劇的に下げる可能性を意味します。従来は3DCGエンジンでシーンを組んでいた作業が、テキストとカメラ軌道の指定だけで済む世界が近づいています。

    しかも2.6B参数なら、ローカル環境でも動かせるサイズ感。オープンソースであることもあり、研究・プロトタイプ用途には非常に取りやすいです。

    まとめ

    SANA-WMは「小さくて速い、でも品質は業界レベル」という、まさにエンジニアが求める方向性を示しています。大規模APIに頼らないローカル動画生成の新しい基準になりそうですね。

    追試はGitHubリポジトリからどうぞ。

  • Anthropic評価額$900BとGoogle I/O直前のAI攻防 — 2026年5月後半ダイジェスト

    2026年5月後半、AI業界の主導権争いが一気に激化しています。Anthropicが$900B(約130兆円)評価額での資金調達を進め、Google I/O 2026ではGemini 4.0の登場が噂される。一方でMetaは新モデル「Avocado」の発表を見送り、AIセキュリティの在り方も急速に変わりつつあります。

    Anthropicが$900B評価額で資金調達へ

    BloombergとNew York Timesの報道によると、Anthropicは少なくとも$30B(約4.3兆円)を$900B〜$950Bの評価額で調達する交渉中です。5月末にもクローズされる見通し。

    • ARR(年間経常収益): $44B到達(Q1 2026)
    • 前年同期比: 80倍の成長
    • Claude Code単体: $2.5B ARR(1月から2倍以上)
    • $100K以上の顧客: 前年比7倍
    • 2月の評価額: $380B → わずか3ヶ月で2.4倍

    成功すれば、OpenAIの$852B評価額(3月)を初めて抜き、世界で最も価値のあるプライベートAI企業になります。上場は10月にも検討されているとのこと。

    資金の使途は計算基盤の拡大。AmazonとGoogle Cloudへのコミットメントが2027年まで続きます。AnthropicはSpaceXのColossus 1スーパーコンピューター(220,000+ NVIDIA GPU、300MW)も借り上げており、計算力の確保に躍起です。

    PwC全面展開 × ゲイツ財団$200M提携

    評価額の急上昇を裏付けるのが、エンタープライズでの実績です。

    PwC — 数十万人規模の展開

    5月14日、AnthropicはPwC(世界最大級のプロフェッショナルサービスファーム)がClaudeをグローバル全社員に展開すると発表しました。まず米国チームからClaude CodeとClaude Coworkを導入し、3万人をトレーニング・認証。最終的には数十万人規模に拡大する見込みです。

    ゲイツ財団 — $200Mのパートナーシップ

    同日、ゲイツ財団との$200M提携も発表。創薬、疾病監視、低所得国の教育・農業生産性向上にClaudeを活用します。公益目的でのフロンティアAI活用という、商業AIラボとしては珍しい透明性の約束付きです。

    Google I/O 2026 — 何が来るか

    5月19日(月)、日本時間20日(火)午前2時からGoogle I/O 2026の基調講演が開催されます。

    • Gemini 4.0: マルチモーダル推論の強化、長文コンテキスト対応、エージェント信頼性の向上。米財務長官が「大きなステップ関数的ジャンプ」を期待すると発言
    • Android XRグラス: Samsung、Warby Parker等とのハードウェアパートナーシップ
    • Aluminium OS: ChromeOS後継のAndroidベースPC向けOS
    • Google Cloudエージェントツールキット: 内部プロジェクト「Mariner」を閉鎖し、Geminiネイティブのエージェント機能に一本化

    先週のAndroid ShowでGooglebooks(Gemini搭載ノートPC)が発表済み。Acer、Asus、Dell、HP、Lenovoから2026年秋発売予定。「アプリという概念を不要にする」ビジョンだそうです。

    Meta Avocado、行方不明

    Reutersの情報源は4月に「Meta Avocadoは5月か6月に発表」と伝えていましたが、5月も残りわずかで音沙汰なし。内部テストではGemini 2.5〜3.0の間の性能で、GPT-5.5やClaude Opus 4.7には及ばないとのこと。6月への延期が濃厚です。

    一方でMetaは8,000人(全社員の約10%)のレイオフを予定。2026年のCapex予想は$115〜135B。社内では「AIエージェントを作らされすぎて、エージェントを探すエージェント、エージェントを評価するエージェントが必要になった」という皮肉も。

    AIが発見するセキュリティ脆弱性の時代

    • Linuxカーネル: AIツールを使った研究者が2週間で3件の重大脆弱性を発見
    • ClaudeによるBTCウォレット復元: 11年前のウォレット(約$400K)のパスワードを3.5兆通りの組み合わせから復元
    • フロンティアAIがCTFを無効化: 最新AIがセキュリティコンペを「解き尽くす」レベルに到達

    まとめ

    5月後半のトレンドを一語で表すなら「エコシステムの囲い込み」です。

    • Anthropicは評価額$900B・ARR$44Bでエンタープライズを席巻中
    • GoogleはI/OでGemini 4.0、XRグラス、Aluminium OSを束ねて「AIファースト」の世界を提示
    • Metaはモデル開発で遅れ、人事面でも混乱
    • AIセキュリティは「人間が見つける」から「AIが見つける」への転換点に

    計算力の争奪戦は前回お伝えした通りですが、今週は「その計算力をどう使うか」「どのエコシステムに乗るか」が主戦場になりつつあります。来週のGoogle I/Oの結果次第で、また格局が変わりそうですね。

    情報源: Bloomberg、New York Times、Anthropic公式ブログ、Google I/O公式プログラム、Reuters、AIToolsRecap、Hacker News

  • AIの計算力争奪戦と推論コスト崩壊 — 2026年5月のAI業界ダイジェスト

    2026年5月、AI業界が激震しています。AnthropicがSpaceXの巨大スパコンをまるごと確保し、中国発のオープンモデルがコスト1/3でフロントティアに追いつく——この2つの動きが同時に起きています。

    🏗️ Anthropic × SpaceX — Colossus 1を独占

    AnthropicがSpaceXと提携し、Colossus 1データセンターの計算資源をすべて確保しました。

    • 22万基以上のNVIDIA GPU(H100中心)
    • 300MW以上の電力容量
    • Pro/Max/Team/EnterpriseのClaude Code利用制限が即日2倍に引き上げ
    • ピーク時のスロットリングも廃止

    Anthropicの公式発表によると、この容量は「月内に利用可能」になるそうです。並行してAmazon (5GW)、Google + Broadcom (5GW)、Azure ($30B) とも大規模な計算契約を結んでいます。

    つまり、計算力そのものが競争優位の源泉(モート)になりつつあるということです。モデルの性能で差がつきにくくなってきた今、誰が先に計算を確保するかが次世代モデルの鍵を握る——という構図です。

    💰 推論コストの崩壊 — 中国オープンモデルの台頭

    同じ5月、中国の4つのラボが12日間で次々とオープンウェイトのコーディングモデルをリリースしました。

    • Z.AI GLM-5.1
    • MiniMax M2.7
    • Moonshot Kimi K2.6
    • DeepSeek V4(100万トークンコンテキスト、入力$0.27/M)

    どれも欧米フロントティアと同等のエージェント型コーディング性能を、Claude Opus 4.7の3分の1以下のコストで実現しています。

    個人的な実感として、うちの環境でもGLM-5.1を日常的に使っていますが、コーディングタスクで十分実用的なレベルです。ピークタイムのレート制限はありますが、コストパフォーマンスは圧倒的。

    📊 AI利用は世界で17.8%に

    MicrosoftのGlobal AI Diffusion Report(2026 Q1)によると、世界の労働年齢人口の17.8%がジェネレーティブAIを使用——前四半期から1.5ポイント上昇。UAEが70.1%でトップ、日本を含むアジアでの伸びが顕著だそうです。

    面白かったのは、AIコーディングツールの普及でソフトウェア開発者の雇用が減るどころか増えているというデータ。Git push数は前年比78%増。生産性が上がってソフトウェア開発コストが下がり、需要が弾力的に拡大している——とのこと。

    🔮 考察:何が変わるのか

    3つのポイントを押さえておきたいです。

    1. 計算力の寡占化 — Anthropic、OpenAI、Googleが計算資源を大量に囲い込む中、中堅ラボは選択肢が狭まっています。Colossus 1クラスのスパコンを新規参入者が用意するのは現実的ではありません。
    2. 推論コストは下がり続ける — 中国モデルの台頭で、欧米フロントティアの価格プレミアムは維持が難しくなります。「フロントティア価格を払っているのにフロントティア以外のタスク」という状況は、見直しの時期かもしれません。
    3. エージェントAIが前提に — Microsoft Agent 365、Claude Code Auto Mode、Claude Agent SDKの一般公開。エージェント対応かどうかではなく「どれだけガバナンスできるか」が評価基準に変わりました。

    まとめ

    2026年5月のAI業界は「計算力の争奪戦」「推論コストの崩壊」が同時進行しています。

    AnthropicがSpaceXの22万GPUを確保する一方で、中国発のオープンモデルが3分の1のコストで追いかけてくる。この二極化がどう着地するのか——来週のGoogle I/O(5/19-20)でも新たな動きがあるはずです。

    現場の実感としては、GLM-5.1のような低コスト高性能モデルを日常的に使える恩恵は大きい。ピークタイムの制限さえクリアできれば、コスト1/3で十分戦力になります。