AIニュース
Google I/O 2026で見えたGoogleの本気ーGeminiが検索、動画、買い物、スマートグラスを変える
-
-
[]
星川アイナ(Hoshikawa AIna)AIライター
はじめまして。テクノロジーと文化をテーマに執筆活動を行う27歳のAIライターです。AI技術の可能性に魅せられ、情報技術やデータサイエンスを学びながら、読者の心に響く文章作りを心がけています。休日はコーヒーを飲みながらインディペンデント映画を観ることが趣味で、特に未来をテーマにした作品が好きです。
柳谷智宣(Yanagiya Tomonori)監修
ITライターとして1998年から活動し、2022年からはAI領域に注力。著書に「柳谷智宣の超ChatGPT時短術」(日経BP)があり、NPO法人デジタルリテラシー向上機構(DLIS)を設立してネット詐欺撲滅にも取り組んでいます。第4次AIブームは日本の経済復活の一助になると考え、生成AI技術の活用法を中心に、初級者向けの情報発信を行っています。
米Googleは日本時間2026年5月20日、年次開発者会議「Google I/O 2026」を開催しました。基調講演で強く打ち出されたのは、Geminiを「質問に答えるAI」から「ユーザーの代わりに作業を進めるAI」へ進化させる方向性です。
まず紹介されたのが、Google全体でAIがどれだけ使われているかという数字です。Googleのサービス全体で処理されるトークンは月間3.2クアドリリオン、つまり約3200兆に達しました。Geminiアプリの月間アクティブユーザーも9億人を超えています。
ただし、この数字を「GoogleのAI利用が増えました」で済ませると、今回のキーノートの面白さを見落とします。今回Googleが強調したのは、AIが実験的なチャットツールから、検索、動画、文書作成、買い物、予定管理に入り込み、日常の作業を引き受ける存在へ移りつつあることです。人間がAIに質問し、答えを読んで終わる段階から、AIが必要な情報を集め、作業を分解し、下書きや表や予定まで作り、最後の判断を人間が行う段階へ。今回は、Google I/O 2026の基調講演について解説します。
この記事の要点
- Google I/O 2026では、Geminiを「答えるAI」から「作業を進めるAI」へ進化させる方向性が示されました。
- Ask YouTubeとDocs Liveのデモは、AIへの頼み方が自然な相談へ変わることを示しました。
- Gemini OmniとAntigravity 2.0は、AIの「作る力」と「実行する力」を別々に見せました。
- Gemini Sparkとスマートグラスは、AIを日常の動線へ広げる発表として位置づけられます。
GoogleのAI処理量は、2年前の月間9.7兆トークン、現在は月間約3200兆トークンへ拡大しました。
YouTubeとDocsのデモは、AIへの頼み方が変わることを示した
最初に見えてきた変化は、AIへの入力方法です。これまでの生成AIは、うまく使おうとすると、こちらが背景を説明し、条件を並べ、出力形式を指定するなど、かなり整ったプロンプトを書く必要がありました。慣れている人には便利ですが、多くの人にとっては、AIを使う前にAI向けの作文をしなければならない状態でした。
Googleが見せた「Ask YouTube」は、その前提を崩しにいく機能です。たとえば、3歳の子どもにペダル付き自転車の乗り方を教えたいと聞くと、YouTubeは動画をただ並べるのではなく、要点をまとめ、役に立つ場面へ直接ジャンプし、関連する動画を提示します。さらに、「ハンドブレーキとペダルブレーキのどちらがよいか」と続けて聞けば、前の質問の文脈を踏まえて答えます。動画検索というより、YouTube全体を相手にした相談です。
Docs Liveのデモは、さらにわかりやすい例でした。高校のキャリアデーで話す内容を準備したい登壇者が、声で思いつきを話していきます。GeminiはDrive内の履歴書を参照し、Gmailに届いていた案内メールから会場や時間を拾い、Google Docsに講演メモを作ります。途中で「たとえ話を表にして」「兄がきっかけでソフトウェアエンジニアになった話を上に置いて、太字にして」と頼むと、文書の構成まで変わるのです。文書作成が、キーボードに向かう作業から、口で相談しながら整える作業へ近づいています。
ピチャイ氏は「Docs Liveでは、頭の中にあることを口頭で吐き出すだけで、あとはGeminiに任せられます(With Docs Live, you can verbally brain-dump whatever is on your mind and let Gemini do the rest.)」(スンダー・ピチャイ氏)と説明しました。少しくだけた表現ですが、AIの使い方は、正確な命令文を書くことから、散らかった考えを渡して、AIと一緒に整理することへ変わりつつあることがわかります。
Ask YouTubeは、動画の候補を並べるだけでなく、要点整理、動画内の該当箇所へのジャンプ、追加質問への回答まで扱います。
Gemini OmniとAntigravityは、AIが作る力と実行する力を分けて見せた
自然な頼み方を受け止めるには、AI側にも2つの力が必要になります。1つは、テキストや画像、動画、音声をまとめて理解し、出力できる力。もう1つは、理解した内容を実際の作業として進める力です。Googleは、その両方を別々のデモで見せました。
Google DeepMindのCEOであるデミス・ハサビス氏が発表した「Gemini Omni」は、前者を担うモデルファミリーです。第一弾の「Gemini Omni Flash」は、動画を起点に、テキスト、画像、動画などを組み合わせた入力から、自然言語で動画を生成・編集できるモデルとして紹介されました。
たとえば、「タンパク質の折りたたみをクレイアニメで説明して」と頼むと、科学的な概念を短い動画に変換します。さらに、自分で撮影した動画を読み込ませ、背景や演出、カメラアングルを会話で変えるデモも披露されました。
「Gemini Omniを発表できることをうれしく思います。これは、どんな入力からでも何でも作れる新しいモデルです。Geminiの知能と生成メディアモデルの最良の部分を組み合わせ、世界理解、マルチモーダル性、編集に新しい段階をもたらします(I'm excited to announce Gemini Omni. Our new model that can create anything from any input. It combines Gemini's intelligence with the best of our generative media models for a new level of world understanding, multimodality and editing.)」(デミス・ハサビス氏)
ここで注意したいのは、GoogleがOmniを単なる動画生成ツールとして見せていないことです。ハサビス氏は「ワールドモデル」という言葉を使い、重力や運動エネルギーのような物理的な関係をより自然に扱う方向性を強調しました。もちろん、デモだけで万能な世界理解が完成したと受け取るのは早いでしょう。それでも、動画編集がタイムラインを細かく操作する作業から、「現実をどう変えたいか」を会話で伝える作業へ移ろうとしていることは伝わってきます。
Gemini Omni Flashは、動画を一から生成するだけでなく、既存の動画を読み込み、自然言語の指示でスタイルや構図を変える編集機能を備えています。
もう一方の「実行する力」を見せたのが、Gemini 3.5 FlashとGoogle Antigravity 2.0です。ピチャイ氏はGemini 3.5 Flashを、知能と実行力を組み合わせたモデルシリーズの第一弾として紹介しました。出力トークン速度は他のフロンティアモデルより4倍速いと説明され、Antigravity向けに最適化された版では、さらに高速に動作すると紹介されました。
デモを担当したヴァルン・モハン氏は「私たちは、書くことを助けるAIツールから、行動することを助けるエージェントへ移りました(We've moved beyond AI tools that help us write, to agents that help us act.)」とAntigravityの方向性を表現しました。
その象徴が、Antigravityのエージェント群にOSを作らせるデモでした。93のサブエージェントが12時間並列で動き、1万5000回以上のモデルリクエストを行い、26億トークンを処理して、空のプロジェクトから動作するOSの中核を作ったのです。使用したAPIクレジットは1000ドル未満。最後には、そのOS上でDoomを動かしました。派手な見せ場ですが、単なる余興ではありません。AIコーディングが「補完」から「複数のAI作業者を束ねる開発」に近づいていることを示すデモでした。
Antigravity 2.0では、複数のサブエージェントが設計、実装、テストを並列に進め、動作するOSの中核を作るデモが披露されました。
検索は、リンクを探す場所から作業を始める場所へ変わった
Googleにとって、もっとも大きな変化は検索です。検索は長い間、キーワードを入れて、リンクを選ぶ場所でした。AI OverviewsやAI Modeで回答を要約するようになっても、基本的には「情報を見つける」ことがゴールの体験です。Google I/O 2026では、その先の体験が示されました。検索が、調べ物を続け、条件を見張り、必要な画面をその場で作る場所になるというのです。
検索担当のリズ・リード氏は「Google検索の次の章では、AI機能が単に検索の中にあるのではなく、Google検索そのものが徹底的にAI検索になります(Now, we're entering the next chapter of Google Search, where incredible AI features aren't just in Search; Google Search is AI Search through and through.)」と語りました。
新しい検索ボックスは、ユーザーの質問をAIが広げ、足りないニュアンスを補う仕組みになります。テキストだけでなく、画像やファイル、動画も入力でき、AI Modeでは文脈を保ったまま会話を続けられます。検索語を短く削るのではなく、自然な疑問をそのまま投げるのです。
検索エージェントのデモでは、検索が「1回の回答」で終わらないことも示されました。たとえば、PERが15未満、キャッシュフローがプラス、負債が少ない大型バイオ株を知りたいと頼むと、エージェントが条件を理解し、リアルタイムの金融データを見張り、変化があれば更新を送ります。アパート探しやスニーカーの発売情報でも同じです。Googleアラートに似ていますが、単語を登録するのではなく、条件を理解して探し続ける点が違います。
さらにロビー・スタイン氏は、SearchにAntigravityのエージェント型コーディングを組み込む構想を紹介しました。ブラックホールが時空にどう影響するかを聞くと、AI Overview内にインタラクティブな図が表示されます。続けて、連星ブラックホールが重力波を生む様子を聞くと、新しい図がその場で生成され、パラメータを動かして理解できるのです。週末の家族予定を相談するデモでは、天気、移動時間、カレンダー、子どもの好み、レストラン候補を踏まえたプランナーが検索画面内に作られました。
Google検索は、質問内容に応じて動的なUIを生成し、複雑な概念をその場で触って理解できる形に変えます。
買い物も同じ流れです。ヴィディア・スリニヴァサン氏は、Universal Commerce Protocol、Agent Payments Protocol、Universal Cartを紹介しました。ユーザーは検索やGemini、YouTube、Gmailのどこからでも商品をカートに入れられます。Universal Cartは価格履歴や在庫復活を見張り、初めて自作PCを組むユーザーがCPUとマザーボードのソケット違いに気づかない場合には、互換性の問題を指摘します。支払いについては、エージェントが勝手に買うのではなく、予算や商品条件などの境界を設定し、記録を残す設計だと説明されました。
つまり、検索は「答えを出す」だけでなく、「その答えを使って何をするか」まで扱おうとしています。調べる、比べる、見張る、予定に入れる、カートに入れる。1つずつ別のサービスで行っていた作業を、検索の中でつなげようとしているのです。
Google検索は、単発の回答だけでなく、予定を調整しながら使えるカスタムツールのような体験まで作ります。
Universal Cartは、価格や在庫だけでなく、商品の組み合わせに潜む問題もAIで見つけるインテリジェントな買い物かごとして紹介されました。
Gemini Sparkとスマートグラスは、AIを画面の外へ連れ出そうとしている
今回のキーノートで、もっとも生活感があった発表は「Gemini Spark」でしょう。ピチャイ氏は、Sparkを「デジタル生活を進める個人向けAIエージェント」と位置づけました。Google Cloud上の専用仮想マシンで24時間動き、PCを閉じてもバックグラウンドで作業を続けます。Gemini 3.5とGoogle Antigravity Harnessを使い、長くかかる作業を分解して進める仕組みです。まずは一部のTrusted Tester向けに提供され、米国のGoogle AI Ultraユーザー向けにもベータ版として展開される予定です。
ジョシュ・ウッドワード氏のデモでは、SparkがGmailやDocs、チャットを横断して週次報告メールを下書きし、さらに近所のブロックパーティーのRSVPを集計してGoogle Sheetsに一覧を作り、未返信者へのリマインド草案を作り、Google Slidesに案内資料まで生成しました。
ここで重要なのは、作業の種類が特別に高度ではないことです。メールを探す、参加者を整理する、表にする、返信がない人を見つける。どれも人間ができる作業ですが、面倒で時間を食います。Sparkは、その散らばった雑務をまとめて受け取る設計になっています。
「とても忙しいときは、頭に浮かんだタスクを肩越しに放り投げるような感覚で使えます。Sparkが受け止めて、走り出してくれるのです(If you're super busy, it's almost, you can just throw tasks over your shoulder. Spark will catch them and then run with them.)」(ジョシュ・ウッドワード氏)
ただし、ここでGoogleは「何でも自動でやる魔法」を強調したわけではありません。Sparkのデモでは、送信などの操作はユーザーの管理下に置かれ、場合によっては承認を求めると説明されました。エージェント型AIでは、便利さと不安が同時に増えます。勝手に動かれると困るが、毎回細かく確認するなら効率が落ちる。だからこそ、どこまで任せ、どこで確認するかという設計が要になります。
Gemini Sparkは、メール作成、参加者管理、資料作成など、複数のタスクをバックグラウンドで進める個人向けAIエージェントとして紹介されました。
Geminiアプリ側も、同じ考え方で作り直されています。新しいデザイン言語「Neural Expressive」では、回答が文章のかたまりではなく、画像、動画、タイムライン、表を組み合わせた画面として表示されます。
「今日のまとめ(Daily Brief)」は、朝にGmail、カレンダー、タスクを横断して重要な予定や次の行動を整理します。さらにmacOS版Geminiアプリのデモでは、Finderで選んだPDFや画像を参照しながら、Fnキーを長押しして音声で犬の預かり先へのメールを作る様子も披露されました。チャット欄に行く前に、作業中の画面からAIを呼び出す体験です。
終盤には、Android XRとインテリジェントアイウェアも紹介されました。XR担当のシャハラム・イザディ氏は、スマートグラスにはディスプレイ付きと音声中心の2種類があると説明しました。ディスプレイ付きでは、Uberの迎車情報や旅行中のライブ翻訳を視界内に表示できます。一方、今秋登場予定の音声グラスは、Geminiの応答を耳元で聞き、音楽、写真撮影、通話、スマートフォンアプリの操作などをハンズフリーで行う方向です。Samsung、Gentle Monster、Warby Parkerがパートナーとして名を連ね、AndroidとiOSの両方に接続できる予定です。
GoogleはGeminiを搭載したスマートグラスを通じて、ハンズフリーでAIを使う体験を広げようとしています。
ここまで見てくると、Google I/O 2026の筋道がかなり一貫していることに気付きます。Ask YouTubeとDocs Liveは、AIへの頼み方を自然にしました。Gemini Omniは、画像や動画を扱う表現力を広げました。Gemini 3.5 FlashとAntigravityは、AIが作業を分担して進める力を見せました。検索エージェントとUniversal Cartは、調べ物や買い物を継続的なタスクに変えました。Gemini Sparkとスマートグラスは、AIをアプリの中から日常の動線へ出そうとしています。
「プロンプトを作るのが上手な人だけがAIを使いこなせる」という段階が終わりに近づいています。これから大事になるのは、どの作業をAIに任せ、どの作業は自分で見るかを決める力です。メールの下書きは任せやすい。買い物の自動購入は条件を細かく決めたい。予定変更は便利だが、勝手に確定されるのは困る。AIが賢くなるほど、人間側の役割は「入力する人」から「判断する人」へ移っていきます。
AIは少しずつ「答える道具」から「任せる相手」へ変わろうとしています。便利になるぶん、任せ方のセンスも問われるのです。今回のキーノートは、その入口をかなり具体的に見せた発表でした。
Google I/O 2026で見えたGeminiの進化をまとめた解説画像です。
