AIニュース

Gemini3 特徴や活用方法を解説!

-

-

  • facebook
  • line
  • twitter
Gemini3 特徴や活用方法を解説!

2025年11月18日にGoogleが「Gemini 3」を発表しました。あらゆる機能が進化しており、最先端の推論能力ゆえに「空気を読む能力がある」とも言われ、大きな話題を呼んでいます。

今までのAIと何が違うのか?特徴や使い方などを解説します!

📌 Gemini 3とは

Gemini 3(ジェミニ・スリー)は、Googleが2025年11月18日に発表した最新かつ最も高性能なAIです。

Gemini 3は、ChatGPTを開発したOpenAIの「GPT-5.1」や、AnthropicのClaude「4.5」と競合する、世界最高水準のAIモデルです。Googleの過去モデル(Gemini 1、Gemini 2、Gemini 2.5)の進化系として登場しました。

開発の歴史:

  • Gemini 1: マルチモーダル(テキスト・画像・動画・音声を同時に理解)の基礎を構築
  • Gemini 2: 思考能力とエージェント機能(自律的にタスクを実行)を追加
  • Gemini 3: これらすべての能力を統合し、「推論力(じっくり考える力)」を大幅に強化

🎯 主要な特徴

1. マルチモーダル理解(Multimodal Understanding)

マルチモーダルとは、複数の種類の情報(テキスト、画像、動画、音声、コード)を同時に理解できる能力のこと。

例:

  • 手書きレシピの写真を撮って「これを英語に翻訳して料理手順を教えて」と頼むと、文字を読み取り→翻訳→調理手順を生成できる
  • テニスの試合動画を見せると、フォーム改善のアドバイスと練習プランを作成してくれる

2. 最高水準の推論能力(State-of-the-art Reasoning)

推論とは、情報を分析して論理的に結論を導く能力のこと。

Gemini 3は「PhD(博士号)レベルの推論能力」を持つと評価されています。つまり、大学院生が研究で使うような高度な問題解決ができるということです。

例:

  • 複雑な数学問題を段階的に解く
  • 科学論文を読んで重要なポイントを抽出
  • プログラミングのバグ(エラー)を見つけて修正方法を提案

3. バイブコーディング(Vibe Coding)

バイブコーディングは、ざっくりとしたイメージや説明から、実際に動くプログラムやウェブページを生成する機能です。

    どう動くの?

  • 「レトロゲーム風の3Dゲームを作って」→ 実際にプレイできるゲームのコードを生成
  • 「モーゲージ(住宅ローン)を比較する計算機」→ インタラクティブな計算ツールを自動作成

4. エージェント機能(Agentic Capabilities)

エージェントとは、人間の指示に基づいて自律的に複数のタスクを実行するAIのこと。

例:

  • 「明日の出張の準備」と頼むと、フライトをチェック→遅延を検知→自動でタクシーを手配
  • メールの整理を依頼すると、重要度を判断して分類・アーカイブ

5. 100万トークンのコンテキストウィンドウ

トークンは、AIが処理する情報の最小単位(単語や文字の一部)です。 コンテキストウィンドウは、AIが一度に記憶できる情報量のこと。

Gemini 3は100万トークン(約75万語、本1冊分以上)を一度に処理できます。

  • 長い学術論文を丸ごと分析
  • 数時間の動画講義から要点を抽出
  • 大量のコードファイルを理解してバグ修正

🧠強化推論ー Deep Thinkモード

Deep Think(ディープ・シンク)は、Gemini 3がさらに深く考えるための特別モードです。通常の「Gemini 3 Pro」よりも時間をかけて、より複雑な問題を解決します。

    仕組み

  • 並列思考: 複数のアイデアを同時に検討して、最適な解決策を選ぶ
  • 強化学習: 過去の成功・失敗から学んで改善し続ける

性能の違い

ベンチマーク Gemini 3 Pro Gemini 3 Deep Think 改善率
Humanity's Last Exam 37.5% 41.0% +9%
GPQA Diamond 91.9% 93.8% +2%
ARC-AGI-2 31.1% 45.1% +45% 🚀

出典: Google Blog - Gemini 2.5 Deep Think

いつ使う?

  • アルゴリズム開発: 複雑なプログラムの設計
  • 科学研究: データ分析や仮説検証
  • 戦略的計画: ビジネス戦略や長期プロジェクト

注意点

  • 通常より処理時間が長い(数分かかることも)
  • 最初は安全性テストのため、AI Ultraサブスクライバーのみが利用可能(数週間後に一般公開予定)

🔬 技術的革新 - セキュリティやAntigravityの解説

1. セキュリティ強化

Gemini 3は「最も安全なGoogleモデル」として設計されています。

プロンプトインジェクション耐性(Prompt Injection Resistance):

  • プロンプトインジェクションとは、悪意のある指示を紛れ込ませてAIを誤動作させる攻撃
  • Gemini 3は不正な指示を識別して無視する能力が向上

Sycophancy(ごますり)の削減:

  • Sycophancyとは、AIがユーザーの意見に無批判に同意してしまう傾向
  • Gemini 3は「正しいが厳しい意見」も提示するようになった

サイバー攻撃耐性:

  • ハッキングやマルウェア生成の要求を拒否
  • 機密情報の漏洩防止

安全性評価

  • UK AISI(英国AI安全研究所)との連携
  • Apollo、Vaultis、Dreadnodeなどの独立機関による監査

2. Google Antigravity(アンチグラビティ)

Antigravityとは?

「重力に逆らう」という名前の通り、従来のIDE(統合開発環境)の限界を超える新しい開発プラットフォームです。

従来のIDEとの違い

項目 従来のIDE Google Antigravity
開発スタイル 人間が全コードを書く AIが大部分を自律的に生成
AIの役割 コード補完のみ タスク全体を理解して実装
テスト 人間が手動実行 AIが自動でブラウザテスト
マルチタスク 一度に1つずつ 複数タスクを並行実行

主要機能

1. エージェント専用サーフェス(Agent Surface)

  • AIエージェントに専用の操作パネルを提供
  • エディタ、ターミナル、ブラウザを直接制御

2. ブラウザ制御(Browser Control)

  • Gemini 2.5 Computer Useモデルを統合
  • ウェブアプリの動作を実際にテストして検証

3. マルチモデル統合

  • Gemini 3 Pro: メインのコーディングエンジン
  • Gemini 2.5 Computer Use: ブラウザ自動操作
  • Nano Banana (Gemini 2.5 Image): 画像編集

使用例

プロンプト: 「天気予報アプリを作って、位置情報から3日間の予報を表示」

    Antigravityの動き

  1. APIを調査(OpenWeatherMap等)
  2. フロントエンド生成(HTML/CSS/JS)
  3. バックエンド実装(APIリクエスト処理)
  4. ブラウザで自動テスト
  5. エラーがあれば自己修正
  6. 完成したアプリを提示

アクセス: antigravity.google

📊 ベンチマークスコア - 詳細な性能比較表

ベンチマークとは、AIの性能を測るための標準テストのこと。学校のテストのようなものです。

主要ベンチマーク比較(2025年11月時点)

ベンチマーク名 測定内容 Gemini 3 Pro Gemini 2.5 Pro Claude 4.5 GPT-5.1
LMArena 総合AIランキング(Eloスコア) 1501 🏆 1451 - -
Humanity's Last Exam 超難問学術推論(ツールなし) 37.5% 🏆 21.6% 13.7% 26.5%
ARC-AGI-2 未知の問題解決能力 31.1% 🏆 4.9% 13.6% 17.6%
GPQA Diamond 科学知識(大学院レベル) 91.9% 🏆 86.4% 83.4% 88.1%
AIME 2025 数学コンテスト(ツールなし) 95.0% 🏆 88.0% 87.0% 94.0%
MathArena Apex 超高難度数学 23.4% 🏆 0.5% 1.6% 1.0%
MMMU-Pro 複合マルチモーダル理解 81.0% 🏆 68.0% 68.0% 76.0%
Video-MMMU 動画理解 87.6% 🏆 83.6% 77.8% 80.4%
SWE-Bench Verified コーディングエージェント能力 76.2% 59.6% 77.2% 🏆 76.3%
SimpleQA Verified 事実精度(正確性) 72.1% 🏆 54.5% 29.3% 34.9%

スコアの意味

  • LMArena Eloスコア: チェスのレーティングのような仕組み。1501は「世界王者クラス」
  • Humanity's Last Exam: ハーバード大学の研究者が作った「AIが解けるか」を試す超難問
  • ARC-AGI-2: 全く新しいパターンの問題を解く能力(AGI = 汎用人工知能に近づく指標)
  • SWE-Bench: 実際のGitHubのバグ修正タスク

🔄 Gemini 2.5との比較

主要な改善点

項目 Gemini 2.5 Pro Gemini 3 Pro 改善内容
推論能力 良好 50%以上向上 🚀 PhD級の思考力を獲得
マルチモーダル性能 68% (MMMU-Pro) 81% (+19%) 画像・動画理解が大幅強化
コーディング能力 59.6% (SWE-Bench) 76.2% (+28%) 自律コーディングが大幅改善
事実精度 54.5% (SimpleQA) 72.1% (+32%) 正確な情報提供が向上
長期計画能力 $573 (Vending-Bench) $5,478 (+856%) 長期的な判断力が劇的改善
ツール使用 54.9% (2-bench) 85.4% (+56%) 複数ツールの連携が上手に

新機能

思考レベル制御(Thinking Level)

  • Low: 高速応答(簡単な質問向け)
  • High: 深い思考(複雑な問題向け)

メディア解像度調整(Media Resolution)

  • 画像・動画の詳細度を選択可能
  • PDF: Medium推奨、動画のOCR: High推奨

Thought Signatures(思考署名)

  • AIの思考プロセスを暗号化して保存
  • 連続した会話で文脈を維持

💻 使い方 - 具体的な手順

Webアプリ

  • 1.Geminiを開く
  • gemini.google.com
  • 2.ログイン
  • Googleアカウントでサインイン

  • 3.使用開始
  • チャット画面で質問を入力。チャット欄右下からモードを選択することができます。

      無料版

    • Gemini 3 Proへのアクセスは限定的
    • 高度な機能(Deep Think等)は利用不可

      AI Pro / Ultra プラン(有料)

    • AI Pro: $19.99/月 - Gemini 3 Proにフルアクセス
    • AI Ultra: $249.99/月 - Deep Think + エージェント機能 + 優先サポート

    🚀 活用方法 - 具体的なユースケース

    学習支援

    ケース1: 手書きレシピの翻訳

    状況: おばあちゃんの手書きイタリア語レシピを英語に翻訳したい

      手順

    1. レシピの写真をアップロード
    2. 「このイタリア語レシピを英語に翻訳して、料理手順を箇条書きで教えて」
    3. Gemini 3が文字認識→翻訳→手順整理

    ケース2: 動画講義の要約

    状況: 3時間の大学講義動画を短時間で理解したい

      手順

    1. YouTube URLまたは動画ファイルを入力
    2. 「この講義の重要ポイントを箇条書きで、理解度チェック用の問題も作って」
    3. 要約 + 練習問題 + 解説を生成

    ビジネス

    ケース3: 文書分析

    状況: 50ページの契約書から重要条項を抽出したい

      手順

    1. PDFファイルをアップロード
    2. 「この契約書で注意すべき条項を表形式でまとめて」
    3. 重要な契約条件、リスク、期限などを構造化して提示

    ケース4: プレゼン資料生成

    状況: 競合分析のスライドが必要

      プロンプト

      「以下の情報から競合比較プレゼン資料を作って」
      - 自社製品: [特徴]
      - 競合A: [特徴]
      - 競合B: [特徴]

    結果: 表、グラフ、要点をまとめたスライド形式の出力

    クリエイティブ

    ケース5: ゲーム制作

      プロンプト

      「80年代風のボクセルアート3Dゲームを作って。宇宙船を操作できるようにして」

    結果: 実際にプレイできるレベルのインタラクティブなゲームのコードを生成

    💰 料金プラン - 個人・開発者向けの価格体系

    個人向けプラン

    プラン 月額料金 主な機能
    無料版 $0 Gemini 3へ限定的アクセス、基本機能
    Google AI Pro $19.99 Gemini 3 Pro完全利用、Gemini アプリフル機能
    Google AI Ultra $249.99 Deep Think、エージェント機能、優先サポート

    開発者向けAPI料金(従量課金)

    Gemini 3 Pro Preview

    項目 無料枠 有料(100万トークンあたり)
    入力(≤20万トークン) 無料 $2.00
    入力(>20万トークン) 無料 $4.00
    出力(≤20万トークン) 無料 $12.00
    出力(>20万トークン) 無料 $18.00
    Context Caching(保存) 利用不可 $0.125 / $0.25 + 時間課金
    Google Search連携 利用不可 1日1,500回まで無料、以降$35/1,000回

    競合比較(API料金)

    モデル 入力(100万トークン) 出力(100万トークン)
    Gemini 3 Pro $2.00 / $4.00 $12.00 / $18.00
    GPT-5.1 $2.50 $10.00
    Claude 4.5 $3.00 $15.00

    注意: Gemini 3は文脈量によって価格が変動する点が特徴

    ⚔️ 競合比較 - GPT-5.1、Claude 4.5との違い

    総合性能比較

    指標 Gemini 3 Pro GPT-5.1 Claude 4.5 勝者
    LMArena Elo 1501 - - Gemini 3 🏆
    推論(Humanity's Last Exam) 37.5% 26.5% 13.7% Gemini 3 🏆
    未知問題(ARC-AGI-2) 31.1% 17.6% 13.6% Gemini 3 🏆
    コーディング(SWE-Bench) 76.2% 76.3% 77.2% Claude 4.5 🏆
    事実精度(SimpleQA) 72.1% 34.9% 29.3% Gemini 3 🏆
    動画理解(Video-MMMU) 87.6% 80.4% 77.8% Gemini 3 🏆
    音声理解 高い 中程度 低い Gemini 3 🏆

    それぞれの強み

    Gemini 3 の強み

    • マルチモーダル性能: 画像・動画・音声処理で圧倒的
    • Google統合: 検索、マップ、YouTubeなどとシームレス連携
    • 長期計画: Vending-Bench 2で856%の改善(ビジネスシミュレーション)
    • 事実精度: 誤情報が少ない(幻覚(ハルシネーション)の削減)

    ハルシネーション(Hallucination)とは、AIが事実でない情報を勝手に作り出してしまうこと。

    GPT-5.1 の強み

    • 汎用性: あらゆるタスクで安定した性能
    • エコシステム: ChatGPTアプリの普及率が高い
    • プラグイン: 豊富なサードパーティツール

    Claude 4.5 の強み

    • コーディング: SWE-Benchで最高スコア
    • 安全性: 倫理的判断に優れる
    • 長文処理: 最大200万トークン(Gemini 3の2倍)

    どれを選ぶべき?

    用途 おすすめ 理由
    動画・画像分析 Gemini 3 マルチモーダル性能が最高
    数学・科学研究 Gemini 3 PhD級の推論力
    プロ開発者向けコーディング Claude 4.5 実務コード生成で微差優位
    汎用チャット GPT-5.1 エコシステムが成熟
    コスト重視 Gemini 3 Flash 高速かつ低価格

    ❓ FAQ - よくある質問

    Q1: Gemini 3は無料で使えますか?

    A: 部分的に可能です。

    • Gemini アプリ: 無料版でも基本機能は利用可能(制限あり)
    • Google AI Studio: 無料枠あり(APIキー必要)
    • フル機能: AI Pro($19.99/月)またはUltra($249.99/月)が必要

    Q2: Gemini 3の知識はいつまで?

    A: 2025年1月までのデータで学習しています。最新情報が必要な場合は、Google Search連携機能を使います。

    Q3: Deep Thinkはいつ使えますか?

    A: 2025年12月上旬からGoogle AI Ultraサブスクライバー向けに段階的に公開予定。安全性テストを経て一般展開します。

    Q4: プログラミング初心者でも使えますか?

    A: 使えます!

    • Gemini アプリ: コーディング不要でチャット形式で利用
    • Antigravity: 自然言語でアプリを作れる(例: 「Todoリストを作って」)

    Q5: スマホで使えますか?

    A: 可能です。

    • iOS/Android: Gemini アプリをダウンロード
    • ブラウザ: gemini.google.comにスマホからアクセス

    Q6: ChatGPTと何が違うの?

    A: 主な違い:

    項目 Gemini 3 ChatGPT (GPT-5.1)
    動画理解 非常に強い 中程度
    Google連携 完璧(検索、マップ等) なし
    推論力 PhD級 大学院級
    価格 変動制($2~18) 固定制($2.50~10)

    Q7: 日本語対応していますか?

    A: 完全対応しています。91.8%のスコアを記録したMMMLU(多言語理解)ベンチマークで証明済み。

    Q8: ビジネスで使う場合、データは安全?

    A: 有料プラン(Paid Tier)では:

    • データは学習に使われない
    • 暗号化通信(HTTPS)
    • エンタープライズ版では追加のセキュリティ機能(専任サポート、コンプライアンス)

    Q9: プログラミング言語は何に対応?

    A: 主要な言語すべて対応:

    • Python、JavaScript、Java、C++、Go、Rust、Swift、Kotlin など

    Q10: Gemini 3 Flashって何?

    A: Gemini 3の軽量版です。

    • 速度: Pro版の2倍速
    • 価格: Pro版の約1/5($0.30 入力、$2.50 出力 / 100万トークン)
    • 用途: 大量処理、チャットボット、リアルタイム応答

    📝 まとめ

    最新・高性能のGemini3、ぜひ使ってみてください!

    天秤AI byGMO

    今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!

    無料で天秤AI by GMOを試す

    この記事は2025年11月19日時点の情報に基づいています。最新情報は公式サイトをご確認ください。

    天秤AI by GMOイメージ

    最新のAIが勢ぞろい! 天秤AI by GMOなら、最大6つのAIを同時に試せる!

    無料天秤AI by GMOを試す