2026年5月のAI戦線:エージェントが当たり前になり、推論コストが崩壊した

2026年5月、AI業界は大きく3つの方向に動いています。エージェント機能の標準化推論コストの劇的な下落、そしてオープンソースモデルの台頭です。それぞれ何が起きているのか、なぜ重要なのかを整理します。

1. エージェントは「機能」から「前提」になった

4月下旬〜5月頭で、Microsoft Agent 365がGA(一般提供)になり、CursorのAgents Window、Claude Codeのマルチエージェント編成が次々リリースされました。

  • Microsoft Agent 365(5月2日GA)— 企業環境でAIエージェントの認証・セキュリティ・ガバナンスを統合管理
  • Anthropic「Code with Claude」カンファレンス — 開発者向けライブ配信の登録開始
  • Cursor Agents Window — コーディングエディタ内で複数エージェントを並列稼働

もはや「エージェント対応かどうか」ではなく「どれだけ上手に管理できるか」が競争軸になりました。

2. 推論コストが崩壊中

価格競争が激化し、フロントィアモデル並みの品質が格安で手に入るようになっています。

  • Gemini 3.1 Flash-Lite — 100万入力トークンあたり$0.25
  • DeepSeek V4 — 100万トークンコンテキストで入力$0.27。幻覚率1.2%
  • GLM-4.7(Huawei Ascendで学習)— 入力$0.11/百万トークン。幻覚率1.2%
  • xAIも4月にエージェントツール呼び出し価格を50%カット

フロントィア価格をフロントィア以外のタスクに払っているなら、今すぐ見直し時です。

3. オープンソースがセカンドティアではなくなった

  • Mistral 128B — 5月3日にリリースされたフラッグシップモデル
  • Qwen — Fireworks AIと提携し、クローズドウェイトモデルの推論コストを下げる
  • GLM-4.7 — HuaweiのAscendチップで学習。NVIDIA依存なしでフロントィアに肉薄

多くのワークロードで、GPT-5.5やClaude Opusと遜色ない結果を出せるオープンモデルが登場しています。

4. 今月の注目モデル

  • GPT-5.5(4月23日リリース)— Terminal-Bench 2.0で82.7%、SWE-Bench Proで58.6%。エージェント型コーディング性能が歴代最高
  • Gemini 3.1 Ultra — 200万トークンのネイティブコンテキストウィンドウ(テキスト・画像・音声・動画を横断)

まとめ

2026年5月のAI業界は「エージェントの統治」「コストの最適化」「オープンモデルの実用化」という3つの流れが同時に起きています。

特にGLM-4.7が$0.11/百万トークンで1.2%の幻覚率を達成したのは印象的。NVIDIA依存からの脱却も進んでおり、チップの多様化も加速しそうです。

来月はAnthropicのカンファレンス反響と、各社のエージェント管理機能の熟成を追っていきます。