Gemini Deep Thinkとは?仕組み・料金・活用事例・他モデルとの違いをわかりやすく解説

Gemini Deep Think(ジェミニ ディープシンク)は、GoogleのAIモデル「Gemini」に搭載された推論特化モードで、複雑な数学・科学・論理的推論を高精度に処理する機能です。 回答前に内部で「思考の連鎖」を実行し、段階的に検証・自己修正しながら結論を導く点が通常のGeminiとの大きな違いです。
2026年4月7日には、第35回日本数学オリンピック本選で満点を達成したことがGoogleから公式に発表されました。
この記事では、以下の内容を整理しています。
- Gemini Deep Thinkの仕組みと通常モードとの違い
- 料金プラン(無料版・Pro・Ultra・API)と費用感
- ベンチマークで見る推論性能と具体的な活用事例
- よく混同される「Deep Research」との使い分け
- GPT・Claudeの推論モードとの比較
- こんな方におすすめ/おすすめしないケース
「Deep Thinkって何がすごいの?」「普通のGeminiと何が違うの?」「月額3万円以上のUltraプランは本当に必要?」といった疑問をお持ちの方に向けて、導入判断に必要な情報をまとめています。
Gemini Deep Thinkの基本情報 — 何ができるモードなのか
Gemini Deep Thinkは、独立したAIモデルではなく、Gemini Proモデルの推論能力を最大化する特別なモードです。通常のGeminiが即座に回答を返すのに対し、Deep Thinkは回答前に数十秒〜数分かけて内部で思考プロセスを実行します。

項目 | 内容 |
|---|---|
開発元 | Google / Google DeepMind |
提供形態 | Geminiアプリ内のモード / Google AI Studio / Vertex AI(API) |
最新版 | Gemini 3.1 Pro Deep Think(2026年4月時点) |
カテゴリ | 推論特化型AIモード(Gemini Proの推論強化モード) |
コンテキストウィンドウ | 192,000トークン |
公式発表 | 2026年2月12日(大型アップグレード)、2026年4月7日(日本語能力の公式発表) |
名称の変遷 — 古い記事を読む際の注意
Deep Thinkは短期間でバージョンが更新されており、ネット上には古い名称の情報が混在しています。
時期 | 名称 | 備考 |
|---|---|---|
2025年前半 | Gemini 2.5 Pro Deep Think | 初期版 |
2025年12月〜 | Gemini 3 Deep Think | Geminiアプリで利用開始 |
2026年2月〜 | Gemini 3.1 Pro Deep Think | 大型アップグレード版(現行) |
現時点で最新のモデルは「Gemini 3.1 Pro Deep Think」です。古い記事で「2.5 Deep Think」と書かれている場合は、性能が大きく異なるため参考値として読む必要があります。
Gemini Deep Thinkの仕組み — なぜ「深く考える」ことができるのか
Deep Thinkの核心は、Chain of Thought(思考の連鎖) と呼ばれる内部推論プロセスにあります。
通常モードとDeep Thinkの処理の違い
通常のGemini(Gemini 3.1 Pro):
- 質問を受け取る
- 最も確率の高い回答を生成する
- 即座に回答を返す(数秒)
Deep Thinkモード:
- 質問を受け取る
- 問題を複数のステップに分解する
- 各ステップの論理を検証する
- 矛盾や誤りを検出した場合、自己修正する
- 最終的な結論を導き出す(数十秒〜数分)
この違いを人間に例えると、通常モードが「直感で即答する」のに対し、Deep Thinkは「紙とペンを取り出して計算しながら考える」イメージです。時間はかかりますが、複雑な問題での正答率が大幅に上がります。
Thinkingトークンの仕組み
Deep Thinkでは、ユーザーに見える回答とは別にThinkingトークン(思考トークン) が内部で生成されます。これはモデルが「自分の推論を検証するための独り言」のようなもので、API利用時には出力トークンの一部として課金対象になります。
Google AI StudioやGeminiアプリでは、この思考プロセスの一部を画面上で確認できる場合があり、モデルがどのような手順で結論に至ったかを追跡できます。
Gemini Deep Thinkのベンチマーク実績 — 何がどこまでできるのか

Deep Thinkの性能は、複数の国際的なベンチマークで検証されています。特に数学・科学分野で顕著な成果を上げています。
主要ベンチマーク結果(2026年4月時点)
ベンチマーク | スコア | 分野 |
|---|---|---|
ARC-AGI-2 | 84.6% | 抽象推論(ARC Prize Foundation検証済み) |
Humanity's Last Exam(ツールなし) | 48.4% | 超高難度の学際的試験 |
Humanity's Last Exam(ツール使用) | 53.4% | 同上(検索+コード実行時) |
GPQA Diamond | 90%超 | 大学院レベル質問応答 |
MMMU-Pro | 81.5% | マルチモーダル理解 |
IMO 2025(国際数学オリンピック) | 金メダルレベル | 数学 |
IPO 2025(国際物理オリンピック) | 87.7% | 物理学 |
ICO 2025(国際化学オリンピック) | 82.8% | 化学 |
Codeforces | Elo 3455 | 競技プログラミング |
これらの数値は、現時点で公開されているAIモデルの中でもトップクラスの推論性能を示しています。
日本語での実績 — 日本数学オリンピックで満点
2026年4月7日、Googleは日本語における数学・コーディング能力を公式に発表しました。これは競合記事ではほとんど取り上げられていない最新情報です。
コンテスト | モデル | 成績 |
|---|---|---|
第35回日本数学オリンピック本選 | Gemini 3.1 Pro Deep Think | 満点(大会最高得点80%を凌駕) |
第35回日本数学オリンピック本選 | Gemini 3.1 Pro(通常モード) | 70.0% |
ICPC 2025横浜大会 国内予選 | Gemini 3.1 Pro Deep Think | 満点 |
ICPC 2025横浜大会 国内予選 | Gemini 3.1 Pro(通常モード) | 97.8% |
日本数学オリンピックでの満点は、人間の参加者の最高得点(80%)を超えた結果です。日本語の数学的な問題文を正確に理解し、論理的に解答できることが公式に確認されています。
通常モードのGemini 3.1 Proが70.0%であるのに対してDeep Thinkが満点というのは、「同じモデルでも推論モードの有無でここまで差が出る」ことを示す好例です。
Gemini Deep Thinkの具体的な活用事例

Deep Thinkは「深く考える必要があるタスク」に特化しています。具体的にどのような場面で使えるのか、分野別に整理します。
数学・科学研究
- 未解決問題の解決: Erdos予想データベースから4つの開問題を自律的に解決した実績
- 論文の論理的欠陥検出: 研究論文の推論プロセスをステップごとに検証し、誤りを指摘
- 査読支援: 学会論文の査読時に、証明の妥当性を検証するツールとして活用
エンジニアリング
- 手描きスケッチから3Dプリント用ファイルを生成: 概念スケッチをCAD形式に変換
- 物理システムのコード化: 物理現象のシミュレーションコードを自動生成
- アーキテクチャ比較: 複数のシステム設計案を論理的に比較・評価
競技プログラミング
- 高度なアルゴリズム問題の解決: Codeforces Elo 3455はトッププレイヤーレベルに相当
- コンテスト問題の解説作成: 解法の論理的な説明を生成
企業の意思決定支援
- 戦略立案のシミュレーション: 複数の変数を考慮した戦略シナリオの論理的評価
- 価格シミュレーション: 価格変更による影響を多角的に分析
Aletheia(アレテイア) — Deep Thinkを基盤とする研究エージェント
GoogleはDeep Thinkを基盤とした自律型数学研究エージェント「Aletheia」も開発しています。以下の3段階ループで動作します。
- Generator(生成): 候補解を生成
- Verifier(検証): 自然言語で欠陥を特定し、正解/軽微修正/根本的欠陥に分類
- Reviser(修正): フィードバックに基づいて解を修正
Aletheiaの特徴は、Google検索とWebブラウジング機能を統合している点です。虚偽の引用や計算誤りを防止でき、「解けない」と判断した問題には正直にそう報告します。
ただし、Aletheiaは現時点で一般ユーザーに公開されておらず、研究プロジェクトとしての位置づけです。Geminiアプリから直接利用できるわけではない点に注意してください。
Deep Thinkの強み — 通常のGeminiや他モデルにない利点
1. 推論精度が段違いに高い
日本数学オリンピックの例が端的に示す通り、同じGemini 3.1 Proでも通常モード(70.0%)とDeep Think(満点)では大きな差があります。数学・科学・論理的分析など「正解が1つ」のタスクで、この推論精度の差が顕著に表れます。
2. 自己修正機能がある
Deep Thinkは推論の途中で「自分の考えに誤りがないか」をチェックし、間違いに気づけば自動的に修正します。通常のLLMは一度生成した回答を修正しないため、この自己修正プロセスはDeep Think特有の強みです。
3. 思考プロセスが可視化される
ユーザーは、Deep Thinkがどのような手順で結論に至ったかを確認できます。数学の証明や論理的な分析では、「答えが正しいかどうか」だけでなく「なぜその答えになるのか」が重要です。推論過程の透明性は、研究や教育用途で特に価値があります。
4. 国際的ベンチマークで実績がある
IMO、IPO、ICO、ICPC、ARC-AGI-2など、複数の権威あるベンチマークで金メダルレベルのスコアを達成しており、推論能力が第三者機関によって検証されています。
Deep Thinkの弱み・制約 — 使う前に知っておくべきこと
Deep Thinkには明確な制約もあります。導入前に以下の点を理解しておく必要があります。
1. 回答速度が遅い
深い推論プロセスを経るため、回答に数十秒〜数分かかることがあります。チャットのように即座にやり取りしたい場面では不向きです。簡単な質問や雑談には、Gemini FlashやGemini Proの通常モードを使う方が効率的です。
2. 利用回数に制限がある
もっともアクセス権限が広いGoogle AI Ultraプランでも、1日あたり10プロンプトまでという制限があります。1日中Deep Thinkを使い続けることはできないため、「本当に深い推論が必要な質問」に絞って使う運用が求められます。
3. コンテキストウィンドウが通常版より小さい
通常のGemini 3.1 Proが約100万トークンのコンテキストを持つのに対し、Deep Thinkのコンテキストウィンドウは192,000トークンです。長大なドキュメントを一括で処理するタスクには通常モードの方が適しています。
4. ウェブ検索・最新情報の取得はできない
Deep Thinkは内部の学習データのみで推論します。「今日のニュース」「最新の論文」など、リアルタイム情報が必要なタスクには対応できません。最新情報の調査には、後述する「Deep Research」モードを使い分ける必要があります。
5. 学習データが薄い分野ではハルシネーションリスクがある
極めてニッチな専門分野や、学習データが不足している領域では、誤った情報を生成する可能性があります。FutureMath Basic(博士課程レベル)で38%にとどまっている点からも、現時点の限界は認識しておくべきです。
6. 過剰な安全フィルタが発動することがある
問題のないリクエストでも安全フィルタが過剰にブロックするケースが報告されています。特に化学・医療系のトピックでは、正当な学術的質問がブロックされることがあります。
Gemini Deep Thinkの料金・プラン — いくらかかるのか

Deep Thinkのフル利用には高額なプランが必要です。プラン別のアクセス範囲を整理します。
Geminiアプリの料金プラン(2026年4月時点)
プラン | 月額料金 | Deep Think利用 | AIクレジット | その他の特典 |
|---|---|---|---|---|
無料 | ¥0 | 1日数回の厳しい制限 | 1日50クレジット | — |
Google AI Plus | ¥1,200/月 | 利用不可 | 月200クレジット | — |
Google AI Pro | ¥2,900/月 | 制限付きで利用可能 | 月1,000クレジット | — |
Google AI Ultra | ¥36,400/月 | フルアクセス(1日10プロンプト) | 月25,000クレジット | 30TBストレージ、YouTube Premium、Veo 3.1フルアクセス |
重要なポイント:
- Deep Thinkをフルに使うには Google AI Ultra(月額¥36,400 / $249.99)が必要
- Ultraは初回3ヶ月50%オフで約¥18,000/月。まずはこの割引期間で試すのが現実的
- Google AI Plus(¥1,200/月)ではDeep Thinkは使えない。ここを間違えないよう注意
- Proプラン(¥2,900/月)でも制限付きで利用できるが、回数は厳しめ
API料金(開発者向け)
API経由でDeep Thinkを利用する場合の料金は以下の通りです。
項目 | 料金 |
|---|---|
入力トークン(200Kトークンまで) | $2.00 / 100万トークン |
入力トークン(200Kトークン超) | $4.00 / 100万トークン |
出力トークン(Thinkingトークン含む、200Kまで) | $12.00 / 100万トークン |
出力トークン(200Kトークン超) | $18.00 / 100万トークン |
注意: Thinkingトークン(Deep Thinkの内部推論で消費されるトークン)は出力トークン料金に含まれます。Deep Thinkでは通常モードよりも出力トークンが大幅に多くなるため、API利用時のコストは通常のGemini 3.1 Proよりも高くなります。
API経由のDeep Thinkは、現時点ではアーリーアクセスプログラムで提供されています。Google AI StudioまたはVertex AIから利用可能です。
「Ultraプランは本当に必要か?」判断のポイント
月額¥36,400は決して安くない金額です。以下の基準で判断することをおすすめします。
Ultraプランが向いているケース:
- 数学・科学・物理学の研究で高精度な推論を日常的に使う
- 競技プログラミングの練習や解法検証に使いたい
- API利用が難しく、GUIで手軽にDeep Thinkを使いたい
- YouTube Premium、30TBストレージなどUltraの付帯サービスも活用する
Proプランで十分なケース:
- Deep Thinkを使う頻度が週に数回程度
- 普段はGemini Proの通常モードで十分だが、難しい問題だけDeep Thinkを使いたい
無料プランまたはAPI利用がおすすめのケース:
- まず試してみたい(無料プランで1日数回使える)
- プログラムから自動的にDeep Thinkを呼び出したい(API)
- コストを細かく管理したい(API従量課金)
Deep Think vs Deep Research — 混同しやすい2つの機能の使い分け
Geminiには「Deep Think」と「Deep Research」という似た名前の機能がありますが、役割はまったく異なります。「何かを深く考えたいのか、何かを広く調べたいのか」で使い分けます。

項目 | Deep Think | Deep Research |
|---|---|---|
一言で言うと | 「深く考える」モード | 「広く調べる」モード |
役割 | 内部の推論能力を最大化 | 外部情報の収集能力を最大化 |
情報源 | 内部の学習データのみ | ウェブ検索で外部情報を収集 |
得意なこと | 数学・論理的分析・証明・コード | 最新トレンドの調査・ファクトチェック・市場分析 |
苦手なこと | 最新情報の取得 | 高度な論理的推論 |
回答速度 | 数十秒〜数分 | 数分〜数十分(調査のため長い) |
例えると | 「一人で深く考える研究者」 | 「広く調べて報告する調査チーム」 |
具体的な使い分け例
質問例 | 適切なモード | 理由 |
|---|---|---|
「この数学の証明に誤りはないか検証して」 | Deep Think | 論理的推論が必要 |
「2026年のAI市場動向を調査して」 | Deep Research | 最新情報の収集が必要 |
「このアルゴリズムの計算量を分析して」 | Deep Think | 内部推論で解ける |
「競合他社のAI戦略を比較して」 | Deep Research | 外部情報が必要 |
「この物理学の問題を解いて」 | Deep Think | 論理的推論が必要 |
「最新の物理学論文のトレンドは?」 | Deep Research | 最新情報の調査が必要 |
迷った場合の簡単な判断基準は、「答えが自分の知識(学習データ)の中にあるか、外の世界にあるか」 です。前者ならDeep Think、後者ならDeep Research を選びます。
Gemini Deep Thinkの使い方 — 3つの利用方法
Deep Thinkは、大きく3つの方法で利用できます。
方法1: Geminiアプリ(もっとも手軽)
- gemini.google.com にアクセス
- Google AI ProまたはUltraプランに加入(無料プランでも回数制限付きで利用可能)
- チャット画面でモデル選択から「Deep Think」モードを選択
- 質問を入力して送信
Geminiアプリでの利用は、もっとも手軽ですぐに始められます。ただし、2026年4月時点でGeminiアプリのDeep Thinkは利用地域に制限がある場合があります。
方法2: Google AI Studio(開発者・研究者向け)
- Google AI Studio にアクセス
- モデル一覧から「Gemini 3.1 Pro」を選択
- Thinking設定で推論の深さをHigh(Deep Think相当)に設定
- プロンプトを入力して実行
Google AI Studioでは、思考プロセスの詳細を確認でき、推論の深さ(Low / Medium / High)を段階的に制御できます。研究や検証用途に適しています。
方法3: Vertex AI / Gemini API(プロダクション向け)
API経由での利用は、自動化やアプリケーション組み込みに適しています。現時点ではアーリーアクセスプログラムで提供されており、企業・研究者向けです。
他のAIモデルの推論モードとの比較
Deep Thinkと競合するのは、OpenAIやAnthropicが提供する推論特化モデル・モードです。
主要推論モデルの比較表
比較項目 | Gemini Deep Think | OpenAI o3 | Claude Extended Thinking |
|---|---|---|---|
開発元 | Google DeepMind | OpenAI | Anthropic |
提供形態 | Gemini Proの推論モード | 独立した推論モデル | Claudeの拡張思考モード |
ARC-AGI-2 | 84.6% | 非公開 | 非公開 |
数学(IMO級) | 金メダルレベル | 金メダルレベル | 非公開 |
日本語数学実績 | 日本数学オリンピック満点 | 公式発表なし | 公式発表なし |
コーディング | Codeforces Elo 3455 | 高水準 | 高水準 |
フルアクセス月額 | ¥36,400(Ultra) | $200(Pro) | $200(Max 5x) |
利用制限 | 1日10プロンプト | プランにより異なる | プランにより異なる |
思考プロセス可視化 | あり | あり | あり |
マルチモーダル | テキスト・画像入力 | テキスト・画像入力 | テキスト・画像入力 |
各モデルの特徴を一言で
- Gemini Deep Think: Google製品との統合と日本語推論の実績が強み。Ultraプランの付帯サービス(YouTube Premium、30TBストレージ等)も含めた総合コスパで判断する
- OpenAI o3: GPTシリーズの推論特化モデル。ChatGPTユーザーにとって追加学習コストが低い
- Claude Extended Thinking: 文章理解・コード生成に定評のあるClaudeの推論強化版。長文の論理分析に強い
現時点では、各モデルとも推論特化の性能は拮抗しています。どのモデルがベストかは、既存の利用環境や用途次第です。
Geminiファミリー内での位置づけ — Flash・Pro・Deep Thinkの使い分け
Deep Thinkの使いどころを正しく判断するには、Geminiファミリー全体での位置づけを理解しておくと便利です。
モデル | 特徴 | 最適な用途 | 回答速度 |
|---|---|---|---|
Gemini 3 Flash | 高速・低コスト | 日常タスク、即時応答、チャット | 非常に速い |
Gemini 3.1 Pro | 高性能・大容量コンテキスト | 文書分析、コード生成、汎用業務 | 速い |
Gemini 3.1 Pro Deep Think | 推論特化・超高精度 | 数学、科学、複雑な論理的推論 | 遅い(数十秒〜数分) |
判断基準はシンプルです。
- 速さ優先・日常タスク → Flash
- 品質と速度のバランス → Pro
- 精度最優先・複雑な推論 → Deep Think
Deep Thinkは「すべての質問に使うモード」ではなく、本当に深い推論が必要な質問に絞って使うのが効率的な運用方法です。
セキュリティとデータプライバシーの注意点
企業や研究機関でDeep Thinkを利用する場合、データの取り扱いについて以下の点を確認してください。
データプライバシー
- Geminiアプリ: Googleの利用規約・AIポリシーに準拠。入力データがモデルの改善に使用される可能性がある(オプトアウト設定あり)
- Vertex AI(API): エンタープライズ向けのデータ保護。顧客データはモデルトレーニングに使用されない
- Google AI Studio: Google AIのサービス利用ポリシーに準拠
業務利用時の注意
- 機密情報や個人情報をDeep Thinkに入力する場合は、Vertex AI経由の利用を検討する
- Geminiアプリでの利用時は、データ利用ポリシーを確認し、必要に応じてアクティビティのオフ設定を行う
- Deep Thinkの出力を業務の最終判断にそのまま使うのではなく、人間による検証を挟むことを推奨
こんな方におすすめ/おすすめしないケース
Deep Thinkが役立つ方
- 数学・物理・化学の研究者: 証明の検証、問題解決、論文の論理チェックに活用できる
- 競技プログラミングの練習をする方: 高難度のアルゴリズム問題の解法検証に有効
- エンジニア・データサイエンティスト: 複雑なシステム設計の論理的評価、アルゴリズム分析に使える
- 大学生・大学院生: 数学や理論系科目の学習補助として、解法のステップを確認できる
- すでにGoogle AI Ultraを契約している方: 追加コストなしでDeep Thinkを活用できる
Deep Thinkをおすすめしないケース
- 日常的な質問や雑談がメイン: 天気、翻訳、簡単な文章作成にはFlashや通常のProで十分。Deep Thinkでは回答が遅くなるだけ
- 即座の応答が必要な業務: カスタマーサポートやリアルタイムチャットなど、速度重視の用途には不向き
- 最新情報の調査をしたい方: Deep Thinkは外部検索できない。最新ニュースの調査にはDeep Researchを使う
- 月額¥36,400の費用対効果が合わない方: Ultraプランの付帯サービスも含めて検討し、月に数回しか使わないなら無料プランやAPIの方がコスパが良い
- 大量のドキュメントを一括処理したい方: コンテキストウィンドウが192Kトークンのため、大量ドキュメント処理には通常のGemini 3.1 Pro(100万トークン)の方が適している
よくある質問(FAQ)
Q1. Gemini Deep Thinkは日本語で使えますか?
日本語での利用は可能です。2026年4月7日にGoogleが公式に日本語での数学・コーディング能力を発表しており、第35回日本数学オリンピック本選で満点を達成しています。ただし、Geminiアプリでの利用地域に制限がある場合は、Google AI StudioやAPI経由での利用が確実です。
Q2. 無料プランでもDeep Thinkは使えますか?
無料プランでもDeep Thinkは利用できますが、1日数回という厳しい制限があります。「まず試してみたい」という段階では無料プランで体験し、継続的に使いたい場合はProプラン(¥2,900/月)以上を検討するのが現実的です。
Q3. Deep ThinkとDeep Researchの違いは何ですか?
Deep Thinkは「深く考える」モードで、内部の学習データをもとに複雑な推論を行います。Deep Researchは「広く調べる」モードで、ウェブ検索を使って最新情報を収集します。論理的推論が必要ならDeep Think、情報収集が必要ならDeep Researchを選びます。
Q4. 「Thinking Level」とDeep Thinkは同じですか?
異なります。Gemini FlashにはThinking Level(Low / Medium / High)という推論の深さを調整する機能がありますが、これはFlash向けの軽量な推論調整です。Deep ThinkはGemini Proに搭載された、より本格的な推論特化モードです。
Q5. API利用時のDeep Think 1回あたりのコストはどのくらいですか?
入出力のトークン数に依存しますが、Deep Thinkでは通常より多くのThinkingトークンが消費されます。たとえば、入力5,000トークン+出力(Thinking含む)50,000トークンの場合、約$0.61になります。複雑な問題ではThinkingトークンがさらに増えるため、事前にGoogle AI Studioで試算することをおすすめします。
Q6. 「Google AI Ultra」と旧「Gemini Advanced」は同じものですか?
実質的には同じプランの後継です。旧名「Gemini Advanced」が「Google AI Ultra」に改称されました。古い記事で「Gemini Advanced」と書かれている場合は、現在のGoogle AI Ultraに相当します。
まとめ — Deep Thinkは「本当に考える必要がある問題」のためのモード
Gemini Deep Thinkは、Googleが開発した推論特化AIモードとして、数学・科学・論理的分析の分野でトップクラスの性能を発揮しています。日本語でも日本数学オリンピックで満点を達成するなど、言語を問わず高い推論力が確認されています。
一方で、利用回数制限(1日10プロンプト)、回答速度の遅さ、月額¥36,400のコストなど、日常利用には向かない側面もあります。「すべてをDeep Thinkで」ではなく、通常モード・Flash・Deep Think・Deep Researchを場面に応じて使い分けるのが、現時点でのもっとも効率的な活用方法です。
まずは無料プランで数回試してみて、推論品質に価値を感じたらProプランやUltraプランへのアップグレードを検討してください。
関連記事:
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。




