Stanford AI Index 2026が示す — AIの「計算力爆発」とリアルな課題

はじめに

Stanford大学のHAI(Human-Centered AI)研究所が、例年のAI Index Report 2026を公開しました。400ページ超のレポートから、特に気になるデータをピックアップして整理します。

🌍 計算力は年3.3倍で増え続けている

Epoch AIの推計によると、世界のAI計算能力は2022年以降、毎年3.3倍で拡大中。2021年比だと30倍に達しています。

  • NVIDIAが世界のAI計算力の60%超を握っている
  • Amazon、Googleが独自チップで2位・3位で追走
  • このペースが続くと、電力・環境への影響は無視できないレベルに

📊 ベンチマークを次々と制覇するLLM

特にエージェント系のベンチマークで劇的な進歩が起きています。

  • SWE-Bench Verified(自律コーディング)— スコアが急上昇中
  • OSWorld(自律コンピューター操作)— 同じく急成長
  • Humanity’s Last Exam — 2025年時点でトップ8.8%だった正答率が、38.3%に向上(2026年4月時点でトップモデルは50%超)

「ベンチマークを作る速度よりも、AIがクリアする速度の方が速い」状況が鮮明です。

🏭 米国がモデル開発を牽引、中国はロボットで独走

  • 米国:2025年に50個の「注目すべきモデル」をリリース(Epoch AI調べ)
  • 中国:モデル数で差はあるものの、急速に差を縮めている
  • ロボット:中国が2024年に29.5万台の産業用ロボットを導入(日本4.45万台、米国3.42万台)

モデル開発は米国、物理世界への実装は中国という構図が見えます。

💨 環境負荷の現実

AIの学習にかかる炭素排出量も注目ポイント。

  • Grok 4の学習:72,000トン以上のCO₂(推計)— Epoch AIの独立推計では約14万トン
  • GPT-4:5,184トン(推計)
  • Llama 3.1 405B:8,930トン(推計)

ただし、推論側でも差が大きいとのこと。DeepSeek V3は「中程度の質問」に約23ワットで応答する一方、Claude 4 Opusは約5ワット。効率の良いモデル選びが環境対策にも直結します。

💭 まとめ

AIの能力は確実に、そして加速的に向上しています。同時に、計算資源の集中、環境負荷、実社会での精度ギャップといった課題も浮き彫りに。

Stanfordのレポートは「AIがどこまで来て、何が残っているか」を冷静に示す貴重な指標です。年1回のチェックをおすすめします。

参考:Stanford HAI – 2026 AI Index ReportIEEE Spectrum解説