2026年4月24日、中国のDeepSeekがV4シリーズをリリースしました。1.6兆パラメータのMoEモデル、100万トークンコンテキスト、そして完全オープンウェイト。ハッカーニュースで1400コメント以上を記録し、AI界隈が一晩で沸き立ったこのリリース — 何がそんなにすごいのかを整理します。
スペックが異次元
DeepSeek V4は2モデル構成です。
- V4-Pro: 総パラメータ1.6兆、アクティブ490億(MoE)、100万トークンコンテキスト
- V4-Flash: 総パラメータ2,840億、アクティブ130億、同じく100万トークンコンテキスト
比較として、GPT-4oは128K、Claude 3.7 Sonnetは200Kトークンが上限。DeepSeek V4はその5〜8倍にあたる100万トークンを扱えます。
DSA(DeepSeek Sparse Attention)が鍵
V4最大の技術的ブレイクスルーはDSAという新しいスパースアテンション機構です。トークンワイズ圧縮と組み合わせることで、100万トークンという巨大コンテキストを従来よりはるかに少ない計算・メモリコストで実現しています。
これまで長文処理ではRAG(検索拡張生成)が必須でしたが、100万トークン ≒ 約200万文字が1コンテキストに収まる世界では、シンプルに全文を放り込んで処理するアプローチが現実的になります。
エージェント開発への影響がデカい
個人的に一番注目しているのはエージェント領域への影響です。
- メモリアーキテクチャの変革: これまでエージェントの長期記憶には外部DB(Mem0、Zep等)が欠かせませんでした。100万トークンあれば、24時間以上のコーディングセッションや大規模コードベース全体を1コンテキストに保持可能に
- コスト優位性: DeepSeekは一貫してOpenAI・Anthropicより70〜90%安い価格設定。MoEアーキテクチャにより、アクティブパラメータだけを計算するのでコスパが良い
- OpenAI互換API: モデル名を1行変えるだけで移行完了。Claude Code、OpenCode、OpenClawとも既に統合済み
セルフホストも可能(ただしGPUは相当必要)
オープンウェイトがHugging Faceで公開されているため、自前のGPU環境で動かすことも可能です。ただし1.6兆パラメータのモデルを動かすには相応のGPUリソースが必要なので、実運用ではAPI利用が現実的でしょう。
注意点
- ベンチマークの数字は公式の主張。自分のユースケースで検証が必要
- リリース直後なのでレート制限に注意
- APIの旧モデル名(deepseek-chat等)は2026年7月24日に廃止予定
まとめ
DeepSeek V4は「ただの新モデルリリース」ではありません。100万トークンコンテキスト + オープンウェイト + 低コストという組み合わせは、AIエージェントの設計パターンそのものを変えるポテンシャルを持っています。
特にエージェント系の開発をしている方は、今すぐV4-Proのベンチマークを取る価値があります。移行コストはモデル名を変えるだけ — 試さない理由がないです。