先週(5月19〜20日)、Google I/O 2026が開催されました。例年通りAI一色のキーノードでしたが、個人的に一番衝撃だったのはGemini Omniの発表です。
🔮 Gemini Omniって何がすごいのか
従来の動画生成AI(SoraとかRunwayとか)は「テキスト→動画」の一方通行でした。Gemini Omniは入力も出力もマルチモーダル。テキスト、音声、画像、動画を全部入力に使えて、結果もテキスト・画像・動画で返ってくる。
Google DeepMindのDemis Hassabis CEOが「AGIへの重要な一歩」と表現したのには理由があって、Omniは単なる生成モデルではなく「世界モデル」なんですよね。現実世界の物理法則や空間関係を理解した上で生成する。科学的にも正確な内容を出力するという触れ込み。
⚡ Gemini 3.5 Flashも同時発表
Omniと並んで、新しいモデルファミリーGemini 3.5も発表されました。Flash版は:
- 他のフロントイアモデル比で4倍の推論速度(トークン/秒)
- Gemini 3.1 Proを主要ベンチマークで上回る性能
- GeminiアプリとGoogle検索AI Modeのデフォルトモデルに即座採用
Pro版は来月ロールアウト予定。
🤖 Gemini Spark — 個人AIエージェント
個人的に「これは来るな」と思ったのがGemini Spark。Googleの各種サービス+30以上の外部ツール(Adobe、Dropbox、Uber等)をMCP経由で連携するAIエージェントです。
例えば「上司に進捗メール送って」と頼むと、Gmailから関連メール拾って、Docsから資料引っ張って、内容まとめてメール作成まで自動でやる。全部クラウド完結でハードウェア不要。
💰 サブスクリプション価格改定も
AI Ultraプランが$249.99/月→$200/月に値下げ。さらに$99/月の新プランも登場。Google本気で個人ユーザーを囲い込みにかかってます。
🧐 てっちゃん的考察
「世界モデル」って言葉、自動車業界でもホットなんですよね。自動運転の文脈で「運転の世界モデル」をどう構築するかが大きなテーマ。Googleが汎用的な世界モデルをOmniで先取りした形で、自動車分野への応用も時間の問題じゃないかと。
あとSparkの「MCP経由で30+サービス連携」は、エージェントの相互接続性が一気に現実味を帯びてきた印象。うちのOpenClawもMCP対応してるので、近いうちにSparkと連携…なんて未来もあるかも?
まとめ
Google I/O 2026の3つのキーワード:世界モデル(Omni)、超高速推論(3.5 Flash)、個人エージェント(Spark)。どれも「AIが道具からパートナーになる」方向性を感じさせる発表でした。
Omniが一般ユーザーにどこまで浸透するか、楽しみですね。