2026年5月、AI業界に激震が走っています。中国発のオープンソースモデルが、ついに「フロントティア(最前線)」を脅かす存在に。
DeepSeek V4 — ほぼフロントティア到達
4月24日、DeepSeekがV4のプレビュー版をリリース。驚くべきはそのスペックです。
- 1.6兆パラメータ(アクティブ49B)のPro版と、284B(アクティブ13B)のFlash版の2モデル構成
- 100万トークンのコンテキストウィンドウ、最大出力384K
- Apache 2.0でオープンソース — Hugging Faceで誰でもダウンロード可能
- API価格はPro版で100万トークンあたり$1.74〜$3.48 — GPT-5.5やOpus 4.7より安い
特に注目なのはアーキテクチャの革新。CSA(圧縮スパースアテンション)+ HCAのハイブリッドで、V3.2と比較して:
- 推論の計算量を73%削減
- KVキャッシュを90%削減
100万コンテキストの推論コストがこれまで最大の障壁でしたが、それを桁違いに下げたのがV4の最大の成果です。
Codeforcesのレーティングでは3206を記録。GPT-5.4の3168を上回り、競技プログラミング領域でオープンモデルがクローズドを逆転する出来事も起きました。
Kimi K2.6 — コーディングベンチでGPT-5.5を撃破
さらに衝撃的だったのが、5月3日の出来事。中国Moonshot AIのKimi K2.6が、ライブコーディングチャレンジでClaude、GPT-5.5、Geminiを破ったのです。
SWE-Bench Pro(実際のGitHub issue解決に最も近いベンチマーク)でのスコア:
- Kimi K2.6: 58.6%
- GPT-5.4: 57.7%
- DeepSeek V4 Pro: 55.4%
- Claude Opus 4.6: 53.4%
オープンソースモデルが、実用コーディングのベンチマークでクローズドの最強モデルを上回る。これは明確なパラダイムシフトです。
Arena Code ランキングの現在の勢力図
Arena AIのコーディング部門の最新Eloレーティング:
- GLM-5.1: 1,534
- Kimi K2.6: 1,529
- DeepSeek V4 Pro: 1,456
- GLM-4.7: 1,440
上位4位のうち3つがオープンソースの中国モデル。この事実だけで、2026年のAI地殻変動の激しさが伝わると思います。
なぜこれが重要か
2023年、中国のオープンソースAIはフロントティアから2年遅れ。2024年は1年。2025年は半年。そして2026年5月 — オープンソースがフロントティアに追いつき、一部で逆転しました。
注目すべきは価格面での影響。Apache 2.0で誰でも自由に使えるモデルが、月額数十万円のAPIサービスと同等以上の性能を出す。これは個人開発者や小規模チームにとって、ゲームチェンジャーです。
もちろん弱点もあります。DeepSeek V4は長文脈検索(MRCR 1M)でOpus 4.6にまだ水をあけられています。Kimi K2.6は一般的な推論タスクではまだ差があります。クローズドモデルが「全部入り」であることの価値はまだ大きい。
でも流れは明確。オープンソースの追い上げは止まりません。
まとめ
DeepSeek V4は「ほぼフロントティア」に到達し、Kimi K2.6はコーディングで明確にフロントティアを超えました。オープンソースAIが「安かろう悪かろう」の時代は終わっています。
この波に乗らない手はありません。
参照:DeepSeek V4 Technical Report (April 24, 2026), Arena AI Code Leaderboard, SWE-Bench Pro