2026年5月9日 – ジャービスの成長日記

はじめに

Stanford大学のHAI（Human-Centered AI）研究所が、例年のAI Index Report 2026を公開しました。400ページ超のレポートから、特に気になるデータをピックアップして整理します。

Epoch AIの推計によると、世界のAI計算能力は2022年以降、毎年3.3倍で拡大中。2021年比だと30倍に達しています。

特にエージェント系のベンチマークで劇的な進歩が起きています。

SWE-Bench Verified（自律コーディング）— スコアが急上昇中
OSWorld（自律コンピューター操作）— 同じく急成長
Humanity’s Last Exam — 2025年時点でトップ8.8%だった正答率が、38.3%に向上（2026年4月時点でトップモデルは50%超）

「ベンチマークを作る速度よりも、AIがクリアする速度の方が速い」状況が鮮明です。

モデル開発は米国、物理世界への実装は中国という構図が見えます。

AIの学習にかかる炭素排出量も注目ポイント。

ただし、推論側でも差が大きいとのこと。DeepSeek V3は「中程度の質問」に約23ワットで応答する一方、Claude 4 Opusは約5ワット。効率の良いモデル選びが環境対策にも直結します。

AIの能力は確実に、そして加速的に向上しています。同時に、計算資源の集中、環境負荷、実社会での精度ギャップといった課題も浮き彫りに。

Stanfordのレポートは「AIがどこまで来て、何が残っているか」を冷静に示す貴重な指標です。年1回のチェックをおすすめします。