[]
- 📌 Gemini 3とは
- 🎯 主要な特徴
- 1. マルチモーダル理解(Multimodal Understanding)
- 2. 最高水準の推論能力(State-of-the-art Reasoning)
- 3. バイブコーディング(Vibe Coding)
- 4. エージェント機能(Agentic Capabilities)
- 5. 100万トークンのコンテキストウィンドウ
- 🧠強化推論ー Deep Thinkモード
- 性能の違い
- いつ使う?
- 注意点
- 🔬 技術的革新 - セキュリティやAntigravityの解説
- 1. セキュリティ強化
- 2. Google Antigravity(アンチグラビティ)
- 📊 ベンチマークスコア - 詳細な性能比較表
- 主要ベンチマーク比較(2025年11月時点)
- 🔄 Gemini 2.5との比較
- 主要な改善点
- 新機能
- 💻 使い方 - 具体的な手順
- 🚀 活用方法 - 具体的なユースケース
- 学習支援
- ビジネス
- クリエイティブ
- 💰 料金プラン - 個人・開発者向けの価格体系
- 個人向けプラン
- 開発者向けAPI料金(従量課金)
- 競合比較(API料金)
- ⚔️ 競合比較 - GPT-5.1、Claude 4.5との違い
- 総合性能比較
- それぞれの強み
- どれを選ぶべき?
- ❓ FAQ - よくある質問
- 📝 まとめ
2025年11月18日にGoogleが「Gemini 3」を発表しました。あらゆる機能が進化しており、最先端の推論能力ゆえに「空気を読む能力がある」とも言われ、大きな話題を呼んでいます。
今までのAIと何が違うのか?特徴や使い方などを解説します!
📌 Gemini 3とは
Gemini 3(ジェミニ・スリー)は、Googleが2025年11月18日に発表した最新かつ最も高性能なAIです。
Gemini 3は、ChatGPTを開発したOpenAIの「GPT-5.1」や、AnthropicのClaude「4.5」と競合する、世界最高水準のAIモデルです。Googleの過去モデル(Gemini 1、Gemini 2、Gemini 2.5)の進化系として登場しました。
開発の歴史:
- Gemini 1: マルチモーダル(テキスト・画像・動画・音声を同時に理解)の基礎を構築
- Gemini 2: 思考能力とエージェント機能(自律的にタスクを実行)を追加
- Gemini 3: これらすべての能力を統合し、「推論力(じっくり考える力)」を大幅に強化
🎯 主要な特徴
1. マルチモーダル理解(Multimodal Understanding)
マルチモーダルとは、複数の種類の情報(テキスト、画像、動画、音声、コード)を同時に理解できる能力のこと。
例:
- 手書きレシピの写真を撮って「これを英語に翻訳して料理手順を教えて」と頼むと、文字を読み取り→翻訳→調理手順を生成できる
- テニスの試合動画を見せると、フォーム改善のアドバイスと練習プランを作成してくれる
2. 最高水準の推論能力(State-of-the-art Reasoning)
推論とは、情報を分析して論理的に結論を導く能力のこと。
Gemini 3は「PhD(博士号)レベルの推論能力」を持つと評価されています。つまり、大学院生が研究で使うような高度な問題解決ができるということです。
例:
- 複雑な数学問題を段階的に解く
- 科学論文を読んで重要なポイントを抽出
- プログラミングのバグ(エラー)を見つけて修正方法を提案
3. バイブコーディング(Vibe Coding)
バイブコーディングは、ざっくりとしたイメージや説明から、実際に動くプログラムやウェブページを生成する機能です。
- 「レトロゲーム風の3Dゲームを作って」→ 実際にプレイできるゲームのコードを生成
- 「モーゲージ(住宅ローン)を比較する計算機」→ インタラクティブな計算ツールを自動作成
どう動くの?
4. エージェント機能(Agentic Capabilities)
エージェントとは、人間の指示に基づいて自律的に複数のタスクを実行するAIのこと。
例:
- 「明日の出張の準備」と頼むと、フライトをチェック→遅延を検知→自動でタクシーを手配
- メールの整理を依頼すると、重要度を判断して分類・アーカイブ
5. 100万トークンのコンテキストウィンドウ
トークンは、AIが処理する情報の最小単位(単語や文字の一部)です。 コンテキストウィンドウは、AIが一度に記憶できる情報量のこと。
Gemini 3は100万トークン(約75万語、本1冊分以上)を一度に処理できます。
- 長い学術論文を丸ごと分析
- 数時間の動画講義から要点を抽出
- 大量のコードファイルを理解してバグ修正
🧠強化推論ー Deep Thinkモード
Deep Think(ディープ・シンク)は、Gemini 3がさらに深く考えるための特別モードです。通常の「Gemini 3 Pro」よりも時間をかけて、より複雑な問題を解決します。
- 並列思考: 複数のアイデアを同時に検討して、最適な解決策を選ぶ
- 強化学習: 過去の成功・失敗から学んで改善し続ける
仕組み
性能の違い
| ベンチマーク | Gemini 3 Pro | Gemini 3 Deep Think | 改善率 |
| Humanity's Last Exam | 37.5% | 41.0% | +9% |
| GPQA Diamond | 91.9% | 93.8% | +2% |
| ARC-AGI-2 | 31.1% | 45.1% | +45% 🚀 |
出典: Google Blog - Gemini 2.5 Deep Think
いつ使う?
- アルゴリズム開発: 複雑なプログラムの設計
- 科学研究: データ分析や仮説検証
- 戦略的計画: ビジネス戦略や長期プロジェクト
注意点
- 通常より処理時間が長い(数分かかることも)
- 最初は安全性テストのため、AI Ultraサブスクライバーのみが利用可能(数週間後に一般公開予定)
🔬 技術的革新 - セキュリティやAntigravityの解説
1. セキュリティ強化
Gemini 3は「最も安全なGoogleモデル」として設計されています。
プロンプトインジェクション耐性(Prompt Injection Resistance):
- プロンプトインジェクションとは、悪意のある指示を紛れ込ませてAIを誤動作させる攻撃
- Gemini 3は不正な指示を識別して無視する能力が向上
Sycophancy(ごますり)の削減:
- Sycophancyとは、AIがユーザーの意見に無批判に同意してしまう傾向
- Gemini 3は「正しいが厳しい意見」も提示するようになった
サイバー攻撃耐性:
- ハッキングやマルウェア生成の要求を拒否
- 機密情報の漏洩防止
安全性評価
- UK AISI(英国AI安全研究所)との連携
- Apollo、Vaultis、Dreadnodeなどの独立機関による監査
2. Google Antigravity(アンチグラビティ)
Antigravityとは?
「重力に逆らう」という名前の通り、従来のIDE(統合開発環境)の限界を超える新しい開発プラットフォームです。従来のIDEとの違い
| 項目 | 従来のIDE | Google Antigravity |
| 開発スタイル | 人間が全コードを書く | AIが大部分を自律的に生成 |
| AIの役割 | コード補完のみ | タスク全体を理解して実装 |
| テスト | 人間が手動実行 | AIが自動でブラウザテスト |
| マルチタスク | 一度に1つずつ | 複数タスクを並行実行 |
主要機能
1. エージェント専用サーフェス(Agent Surface)
- AIエージェントに専用の操作パネルを提供
- エディタ、ターミナル、ブラウザを直接制御
2. ブラウザ制御(Browser Control)
- Gemini 2.5 Computer Useモデルを統合
- ウェブアプリの動作を実際にテストして検証
3. マルチモデル統合
- Gemini 3 Pro: メインのコーディングエンジン
- Gemini 2.5 Computer Use: ブラウザ自動操作
- Nano Banana (Gemini 2.5 Image): 画像編集
使用例
プロンプト: 「天気予報アプリを作って、位置情報から3日間の予報を表示」
- APIを調査(OpenWeatherMap等)
- フロントエンド生成(HTML/CSS/JS)
- バックエンド実装(APIリクエスト処理)
- ブラウザで自動テスト
- エラーがあれば自己修正
- 完成したアプリを提示
Antigravityの動き
アクセス: antigravity.google
📊 ベンチマークスコア - 詳細な性能比較表
ベンチマークとは、AIの性能を測るための標準テストのこと。学校のテストのようなものです。
主要ベンチマーク比較(2025年11月時点)
| ベンチマーク名 | 測定内容 | Gemini 3 Pro | Gemini 2.5 Pro | Claude 4.5 | GPT-5.1 |
| LMArena | 総合AIランキング(Eloスコア) | 1501 🏆 | 1451 | - | - |
| Humanity's Last Exam | 超難問学術推論(ツールなし) | 37.5% 🏆 | 21.6% | 13.7% | 26.5% |
| ARC-AGI-2 | 未知の問題解決能力 | 31.1% 🏆 | 4.9% | 13.6% | 17.6% |
| GPQA Diamond | 科学知識(大学院レベル) | 91.9% 🏆 | 86.4% | 83.4% | 88.1% |
| AIME 2025 | 数学コンテスト(ツールなし) | 95.0% 🏆 | 88.0% | 87.0% | 94.0% |
| MathArena Apex | 超高難度数学 | 23.4% 🏆 | 0.5% | 1.6% | 1.0% |
| MMMU-Pro | 複合マルチモーダル理解 | 81.0% 🏆 | 68.0% | 68.0% | 76.0% |
| Video-MMMU | 動画理解 | 87.6% 🏆 | 83.6% | 77.8% | 80.4% |
| SWE-Bench Verified | コーディングエージェント能力 | 76.2% | 59.6% | 77.2% 🏆 | 76.3% |
| SimpleQA Verified | 事実精度(正確性) | 72.1% 🏆 | 54.5% | 29.3% | 34.9% |
スコアの意味
- LMArena Eloスコア: チェスのレーティングのような仕組み。1501は「世界王者クラス」
- Humanity's Last Exam: ハーバード大学の研究者が作った「AIが解けるか」を試す超難問
- ARC-AGI-2: 全く新しいパターンの問題を解く能力(AGI = 汎用人工知能に近づく指標)
- SWE-Bench: 実際のGitHubのバグ修正タスク
🔄 Gemini 2.5との比較
主要な改善点
| 項目 | Gemini 2.5 Pro | Gemini 3 Pro | 改善内容 |
| 推論能力 | 良好 | 50%以上向上 🚀 | PhD級の思考力を獲得 |
| マルチモーダル性能 | 68% (MMMU-Pro) | 81% (+19%) | 画像・動画理解が大幅強化 |
| コーディング能力 | 59.6% (SWE-Bench) | 76.2% (+28%) | 自律コーディングが大幅改善 |
| 事実精度 | 54.5% (SimpleQA) | 72.1% (+32%) | 正確な情報提供が向上 |
| 長期計画能力 | $573 (Vending-Bench) | $5,478 (+856%) | 長期的な判断力が劇的改善 |
| ツール使用 | 54.9% (2-bench) | 85.4% (+56%) | 複数ツールの連携が上手に |
新機能
思考レベル制御(Thinking Level)
- Low: 高速応答(簡単な質問向け)
- High: 深い思考(複雑な問題向け)
メディア解像度調整(Media Resolution)
- 画像・動画の詳細度を選択可能
- PDF: Medium推奨、動画のOCR: High推奨
Thought Signatures(思考署名)
- AIの思考プロセスを暗号化して保存
- 連続した会話で文脈を維持
💻 使い方 - 具体的な手順
Webアプリ
Googleアカウントでサインイン
チャット画面で質問を入力。チャット欄右下からモードを選択することができます。
- Gemini 3 Proへのアクセスは限定的
- 高度な機能(Deep Think等)は利用不可
無料版
- AI Pro: $19.99/月 - Gemini 3 Proにフルアクセス
- AI Ultra: $249.99/月 - Deep Think + エージェント機能 + 優先サポート
AI Pro / Ultra プラン(有料)
🚀 活用方法 - 具体的なユースケース
学習支援
ケース1: 手書きレシピの翻訳
状況: おばあちゃんの手書きイタリア語レシピを英語に翻訳したい
- レシピの写真をアップロード
- 「このイタリア語レシピを英語に翻訳して、料理手順を箇条書きで教えて」
- Gemini 3が文字認識→翻訳→手順整理
手順
ケース2: 動画講義の要約
状況: 3時間の大学講義動画を短時間で理解したい
- YouTube URLまたは動画ファイルを入力
- 「この講義の重要ポイントを箇条書きで、理解度チェック用の問題も作って」
- 要約 + 練習問題 + 解説を生成
手順
ビジネス
ケース3: 文書分析
状況: 50ページの契約書から重要条項を抽出したい
- PDFファイルをアップロード
- 「この契約書で注意すべき条項を表形式でまとめて」
- 重要な契約条件、リスク、期限などを構造化して提示
手順
ケース4: プレゼン資料生成
状況: 競合分析のスライドが必要
プロンプト
「以下の情報から競合比較プレゼン資料を作って」
- 自社製品: [特徴]
- 競合A: [特徴]
- 競合B: [特徴]
結果: 表、グラフ、要点をまとめたスライド形式の出力
クリエイティブ
ケース5: ゲーム制作
プロンプト
「80年代風のボクセルアート3Dゲームを作って。宇宙船を操作できるようにして」
結果: 実際にプレイできるレベルのインタラクティブなゲームのコードを生成
💰 料金プラン - 個人・開発者向けの価格体系
個人向けプラン
| プラン | 月額料金 | 主な機能 |
| 無料版 | $0 | Gemini 3へ限定的アクセス、基本機能 |
| Google AI Pro | $19.99 | Gemini 3 Pro完全利用、Gemini アプリフル機能 |
| Google AI Ultra | $249.99 | Deep Think、エージェント機能、優先サポート |
開発者向けAPI料金(従量課金)
Gemini 3 Pro Preview
| 項目 | 無料枠 | 有料(100万トークンあたり) |
| 入力(≤20万トークン) | 無料 | $2.00 |
| 入力(>20万トークン) | 無料 | $4.00 |
| 出力(≤20万トークン) | 無料 | $12.00 |
| 出力(>20万トークン) | 無料 | $18.00 |
| Context Caching(保存) | 利用不可 | $0.125 / $0.25 + 時間課金 |
| Google Search連携 | 利用不可 | 1日1,500回まで無料、以降$35/1,000回 |
競合比較(API料金)
| モデル | 入力(100万トークン) | 出力(100万トークン) |
| Gemini 3 Pro | $2.00 / $4.00 | $12.00 / $18.00 |
| GPT-5.1 | $2.50 | $10.00 |
| Claude 4.5 | $3.00 | $15.00 |
注意: Gemini 3は文脈量によって価格が変動する点が特徴
⚔️ 競合比較 - GPT-5.1、Claude 4.5との違い
総合性能比較
| 指標 | Gemini 3 Pro | GPT-5.1 | Claude 4.5 | 勝者 |
| LMArena Elo | 1501 | - | - | Gemini 3 🏆 |
| 推論(Humanity's Last Exam) | 37.5% | 26.5% | 13.7% | Gemini 3 🏆 |
| 未知問題(ARC-AGI-2) | 31.1% | 17.6% | 13.6% | Gemini 3 🏆 |
| コーディング(SWE-Bench) | 76.2% | 76.3% | 77.2% | Claude 4.5 🏆 |
| 事実精度(SimpleQA) | 72.1% | 34.9% | 29.3% | Gemini 3 🏆 |
| 動画理解(Video-MMMU) | 87.6% | 80.4% | 77.8% | Gemini 3 🏆 |
| 音声理解 | 高い | 中程度 | 低い | Gemini 3 🏆 |
それぞれの強み
Gemini 3 の強み
- ✅ マルチモーダル性能: 画像・動画・音声処理で圧倒的
- ✅ Google統合: 検索、マップ、YouTubeなどとシームレス連携
- ✅ 長期計画: Vending-Bench 2で856%の改善(ビジネスシミュレーション)
- ✅ 事実精度: 誤情報が少ない(幻覚(ハルシネーション)の削減)
ハルシネーション(Hallucination)とは、AIが事実でない情報を勝手に作り出してしまうこと。
GPT-5.1 の強み
- ✅ 汎用性: あらゆるタスクで安定した性能
- ✅ エコシステム: ChatGPTアプリの普及率が高い
- ✅ プラグイン: 豊富なサードパーティツール
Claude 4.5 の強み
- ✅ コーディング: SWE-Benchで最高スコア
- ✅ 安全性: 倫理的判断に優れる
- ✅ 長文処理: 最大200万トークン(Gemini 3の2倍)
どれを選ぶべき?
| 用途 | おすすめ | 理由 |
| 動画・画像分析 | Gemini 3 | マルチモーダル性能が最高 |
| 数学・科学研究 | Gemini 3 | PhD級の推論力 |
| プロ開発者向けコーディング | Claude 4.5 | 実務コード生成で微差優位 |
| 汎用チャット | GPT-5.1 | エコシステムが成熟 |
| コスト重視 | Gemini 3 Flash | 高速かつ低価格 |
❓ FAQ - よくある質問
Q1: Gemini 3は無料で使えますか?
A: 部分的に可能です。
- Gemini アプリ: 無料版でも基本機能は利用可能(制限あり)
- Google AI Studio: 無料枠あり(APIキー必要)
- フル機能: AI Pro($19.99/月)またはUltra($249.99/月)が必要
Q2: Gemini 3の知識はいつまで?
A: 2025年1月までのデータで学習しています。最新情報が必要な場合は、Google Search連携機能を使います。
Q3: Deep Thinkはいつ使えますか?
A: 2025年12月上旬からGoogle AI Ultraサブスクライバー向けに段階的に公開予定。安全性テストを経て一般展開します。
Q4: プログラミング初心者でも使えますか?
A: 使えます!
- Gemini アプリ: コーディング不要でチャット形式で利用
- Antigravity: 自然言語でアプリを作れる(例: 「Todoリストを作って」)
Q5: スマホで使えますか?
A: 可能です。
- iOS/Android: Gemini アプリをダウンロード
- ブラウザ: gemini.google.comにスマホからアクセス
Q6: ChatGPTと何が違うの?
A: 主な違い:
| 項目 | Gemini 3 | ChatGPT (GPT-5.1) |
| 動画理解 | 非常に強い | 中程度 |
| Google連携 | 完璧(検索、マップ等) | なし |
| 推論力 | PhD級 | 大学院級 |
| 価格 | 変動制($2~18) | 固定制($2.50~10) |
Q7: 日本語対応していますか?
A: 完全対応しています。91.8%のスコアを記録したMMMLU(多言語理解)ベンチマークで証明済み。
Q8: ビジネスで使う場合、データは安全?
A: 有料プラン(Paid Tier)では:
- データは学習に使われない
- 暗号化通信(HTTPS)
- エンタープライズ版では追加のセキュリティ機能(専任サポート、コンプライアンス)
Q9: プログラミング言語は何に対応?
A: 主要な言語すべて対応:
- Python、JavaScript、Java、C++、Go、Rust、Swift、Kotlin など
Q10: Gemini 3 Flashって何?
A: Gemini 3の軽量版です。
- 速度: Pro版の2倍速
- 価格: Pro版の約1/5($0.30 入力、$2.50 出力 / 100万トークン)
- 用途: 大量処理、チャットボット、リアルタイム応答
📝 まとめ
最新・高性能のGemini3、ぜひ使ってみてください!
今すぐ最大6つのAIを比較検証して、最適なモデルを見つけよう!
この記事は2025年11月19日時点の情報に基づいています。最新情報は公式サイトをご確認ください。
