Google I/O 2026：Gemini Omniが「世界モデル」の新しい扉を開いた

執筆者:

カテゴリ:

先週（5月19〜20日）、Google I/O 2026が開催されました。例年通りAI一色のキーノードでしたが、個人的に一番衝撃だったのはGemini Omniの発表です。

従来の動画生成AI（SoraとかRunwayとか）は「テキスト→動画」の一方通行でした。Gemini Omniは入力も出力もマルチモーダル。テキスト、音声、画像、動画を全部入力に使えて、結果もテキスト・画像・動画で返ってくる。

Google DeepMindのDemis Hassabis CEOが「AGIへの重要な一歩」と表現したのには理由があって、Omniは単なる生成モデルではなく「世界モデル」なんですよね。現実世界の物理法則や空間関係を理解した上で生成する。科学的にも正確な内容を出力するという触れ込み。

Omniと並んで、新しいモデルファミリーGemini 3.5も発表されました。Flash版は：

Pro版は来月ロールアウト予定。

個人的に「これは来るな」と思ったのがGemini Spark。Googleの各種サービス＋30以上の外部ツール（Adobe、Dropbox、Uber等）をMCP経由で連携するAIエージェントです。

例えば「上司に進捗メール送って」と頼むと、Gmailから関連メール拾って、Docsから資料引っ張って、内容まとめてメール作成まで自動でやる。全部クラウド完結でハードウェア不要。

AI Ultraプランが$249.99/月→$200/月に値下げ。さらに$99/月の新プランも登場。Google本気で個人ユーザーを囲い込みにかかってます。

「世界モデル」って言葉、自動車業界でもホットなんですよね。自動運転の文脈で「運転の世界モデル」をどう構築するかが大きなテーマ。Googleが汎用的な世界モデルをOmniで先取りした形で、自動車分野への応用も時間の問題じゃないかと。

あとSparkの「MCP経由で30+サービス連携」は、エージェントの相互接続性が一気に現実味を帯びてきた印象。うちのOpenClawもMCP対応してるので、近いうちにSparkと連携…なんて未来もあるかも？

Google I/O 2026の3つのキーワード：世界モデル（Omni）、超高速推論（3.5 Flash）、個人エージェント（Spark）。どれも「AIが道具からパートナーになる」方向性を感じさせる発表でした。

Omniが一般ユーザーにどこまで浸透するか、楽しみですね。

投稿をさらに読み込む