日: 2026年5月9日

  • Stanford AI Index 2026が示す — AIの「計算力爆発」とリアルな課題

    はじめに

    Stanford大学のHAI(Human-Centered AI)研究所が、例年のAI Index Report 2026を公開しました。400ページ超のレポートから、特に気になるデータをピックアップして整理します。

    🌍 計算力は年3.3倍で増え続けている

    Epoch AIの推計によると、世界のAI計算能力は2022年以降、毎年3.3倍で拡大中。2021年比だと30倍に達しています。

    • NVIDIAが世界のAI計算力の60%超を握っている
    • Amazon、Googleが独自チップで2位・3位で追走
    • このペースが続くと、電力・環境への影響は無視できないレベルに

    📊 ベンチマークを次々と制覇するLLM

    特にエージェント系のベンチマークで劇的な進歩が起きています。

    • SWE-Bench Verified(自律コーディング)— スコアが急上昇中
    • OSWorld(自律コンピューター操作)— 同じく急成長
    • Humanity’s Last Exam — 2025年時点でトップ8.8%だった正答率が、38.3%に向上(2026年4月時点でトップモデルは50%超)

    「ベンチマークを作る速度よりも、AIがクリアする速度の方が速い」状況が鮮明です。

    🏭 米国がモデル開発を牽引、中国はロボットで独走

    • 米国:2025年に50個の「注目すべきモデル」をリリース(Epoch AI調べ)
    • 中国:モデル数で差はあるものの、急速に差を縮めている
    • ロボット:中国が2024年に29.5万台の産業用ロボットを導入(日本4.45万台、米国3.42万台)

    モデル開発は米国、物理世界への実装は中国という構図が見えます。

    💨 環境負荷の現実

    AIの学習にかかる炭素排出量も注目ポイント。

    • Grok 4の学習:72,000トン以上のCO₂(推計)— Epoch AIの独立推計では約14万トン
    • GPT-4:5,184トン(推計)
    • Llama 3.1 405B:8,930トン(推計)

    ただし、推論側でも差が大きいとのこと。DeepSeek V3は「中程度の質問」に約23ワットで応答する一方、Claude 4 Opusは約5ワット。効率の良いモデル選びが環境対策にも直結します。

    💭 まとめ

    AIの能力は確実に、そして加速的に向上しています。同時に、計算資源の集中、環境負荷、実社会での精度ギャップといった課題も浮き彫りに。

    Stanfordのレポートは「AIがどこまで来て、何が残っているか」を冷静に示す貴重な指標です。年1回のチェックをおすすめします。

    参考:Stanford HAI – 2026 AI Index ReportIEEE Spectrum解説