Gemini 3.2 Flashとは？$0.25/M入力リーク・3.1 Pro超え性能・iOS先行漏洩を整理【2026年5月最新】

Gemini 3.2 Flashは、Google（Google DeepMind）が次に投入すると見られるFlashティアの新モデルですが、2026年5月7日時点ではGoogleから公式発表されていません。 iOS版Geminiアプリのモデルピッカーと、Google AI Studioのメタデータ、そしてLM Arenaでの匿名ベンチマークで先行観測されているリーク段階のモデルです。

公式モデルカードも公式料金表もまだ存在せず、現在出回っている「$0.25/M入力・$2.00/M出力」「Gemini 3.1 Pro超えの性能」といった情報はすべてリークと観測ベースです。本記事は、その「リーク／観測／推測」の境界線を一切ぼかさず、2026年5月7日時点で公開情報から確実に言える範囲だけを整理します。

この記事でわかること

Gemini 3.2 Flashの観測経緯と「リーク／公式」の現状
リークされた料金（$0.25/$2.00）が事実なら何を意味するか
LM Arenaで観測された「3.1 Pro超え」の具体的タスク
Gemini 3 / 3.1 Flash-Lite / 3.1 Proとの位置取り
Google I/O 2026（5/19–20）で確認すべきチェック項目
いま導入判断すべきか、待つべきか

こんな方向け

業務用AI APIの調達担当・エンジニアで、Flashティアの最新動向を追っている
Gemini 3.1 ProとFlashの選び分けに迷っている
リーク情報と公式情報を切り分けて理解したい

⚠️ 本記事は2026年5月7日時点のリーク・観測情報を整理したものです。 Google I/O 2026（5/19–20）で公式発表された場合は、本記事を全面リライトします。記事中の料金・性能・仕様は、必ず公式ドキュメント（Google AI for Developers、DeepMindモデルカード、Vertex AIドキュメント）で最終確認してください。

Gemini 3.2 Flashの基本情報（2026年5月7日時点）

Google DeepMindが提供するGeminiモデルファミリーの公式キービジュアル

出典: Google DeepMind — Gemini

Gemini 3.2 Flashは、リーク観測の構造から「Gemini 3.1 Flash-LiteとGemini 3.1 Proの中間ポジション」を狙う、コスト重視Flashティアの次期モデルと推定されます。Google公式の発表はまだ出ていません。

項目	内容
モデル名	Gemini 3.2 Flash
開発元	Google（Google DeepMind）
ティア	Flash（速度・コスト最適化）
ポジション（推測）	3.1 Flash-Liteと3.1 Proの中間。「Pro並の性能をFlash価格で」
観測経路	iOS版Geminiアプリ／Google AI Studio／LM Arena
公式発表	未発表（2026-05-07時点）
初観測日	2026-05-05（Reddit r/GeminiAIでの最初の報告）
公式発表予測	Google I/O 2026（2026-05-19〜20）

「3.5」ではなく「3.2」というナンバリングが採用されている点も特徴です。複数の海外メディアは「Googleがインクリメンタル（小刻み）バージョニング戦略へ転換し、Flashティアでの高速イテレーションに注力するシグナル」と解釈しています。

関連: Geminiファミリ全体の体系・各ティアの位置づけは Geminiとは｜できること・料金・各モデルの違いを総整理も参照してください。

なぜ「リーク段階」なのか — 観測の経緯

Gemini 3.2 Flashの存在は、2026年5月5日前後に複数の経路で同時に「目撃」されました。

観測ルート1: iOS版Geminiアプリのモデルピッカー

Reddit（r/GeminiAI）で、iOS版Geminiアプリのモデル選択ドロップダウンに「Gemini 3 Flash → 3.1 Flash → 3.2 Flash」が約24時間ごとに循環表示される現象が報告されました。これはGoogleがA/Bテスト段階でモデルを差し替えていることを示唆しています。

同時に、iOS 26のLiquid Glassデザイン言語に準拠した新UI（ピル型プロンプトボックス、脈動グラデーション背景、左上ドロップダウン式モデルピッカー）もロールアウトされており、「モデル本体のリリース」と「アプリUIのリニューアル」が並行して進んでいる可能性が高いです。

ただし、Reddit投稿でも「自分のアプリには出ていない」というコメントが多数あり、全ユーザーが観測できたわけではない点に注意が必要です。

観測ルート2: Google AI Studio内のメタデータ

Google AI Studio（https://aistudio.google.com）の内部メタデータに「Gemini 3.2 Flash」のエントリと、$0.25/M入力・$2.00/M出力という料金値が含まれていたとの報告があります。これがリーク料金値の出どころです。

この値は2026-05-07時点でAI Studioの公式価格表（Pricingページ）にも、Vertex AIドキュメントにも掲載されていません。

観測ルート3: LM Arenaでの匿名ベンチマーク

LM Arena（旧 Chatbot Arena、Eleuther AI Arena）で、匿名のGemini系モデルがサイレントベンチマーク稼働しているとの報告が複数媒体から出ています。後述する「ASCII都市スカイラインアニメーション」プロンプトでGemini 3.1 Proを上回る出力をした事例は、このLM Arena経由で観測されたものです。

「公式 / リーク / 推測」の3段階整理

情報	ステータス
iOS Geminiアプリでのモデル名表示	リーク（複数媒体・Redditが報告）
Google AI Studio内のメタデータ	リーク（複数媒体報告）
$0.25/M入力・$2.00/M出力	リーク（要公式確認）
LM Arenaでの匿名稼働	観測（ベンチマーク参加自体は事実だが3.2 Flashである確証は限定的）
1Mトークンコンテキスト・マルチモーダル対応	推測（Gemini 3系の踏襲予想）
Google I/O 2026での公式発表	推測（最有力ウィンドウだが公式アナウンスなし）
モデルカード・SLA・安全性評価	未公開（リークすらない）

リーク料金の意味 — $0.25/$2.00は何を変えるか

⚠️ 以下はGoogle未公表のリーク値です。記事執筆時点では公式料金表に掲載されていないため、実装判断は必ずGoogle AI for DevelopersのPricingページで再確認してください。

リーク値が事実だった場合の、Gemini 3系内での価格ポジションは次のとおりです（公式既存料金は2026年5月7日時点のGoogle AI for Developers Pricingページに基づく）。

モデル	入力 / M token	出力 / M token	ステータス
Gemini 3.1 Pro Preview	$2.00	$12.00	公式
Gemini 3.1 Flash Live Preview	$0.75（テキスト）	$4.50（テキスト）	公式
Gemini 3 Flash Preview	$0.50	$3.00	公式
Gemini 3.2 Flash（リーク値）	$0.25	$2.00	リーク
Gemini 3.1 Flash-Lite Preview	$0.25	$1.50	公式

読み取れること（リーク値が事実なら）

入力単価はFlash-Liteと同水準（$0.25/M）。これは「最廉価帯と同じ入力コスト」で動作することを意味します
出力単価はGemini 3 Flashより約33%安い（$3.00 → $2.00）。Flash-Lite（$1.50）よりは高めですが、性能差を考慮すると合理的な位置取りです
Gemini 3.1 Proとの比較では、入力で1/8、出力で1/6。仮にコーディング性能が3.1 Proに迫るなら、価格性能比は劇的に改善します

注意 — 公式発表で変動する可能性が高い

過去のGeminiモデルでも、リーク値と最終的な公式料金が一致しなかった事例があります。とくに以下の項目はリーク段階では不明であり、公式発表時に大きく印象が変わり得ます。

200kトークン超のコンテキスト時の追加料金（Gemini 3.1 Proは200k超で入力$3.00/出力$18.00へ上昇）
バッチAPI割引・コンテキストキャッシュ割引の対応有無
マルチモーダル入力（画像・音声・動画）の追加料金体系
Vertex AI経由とGoogle AI for Developers経由での価格差

LM Arenaでの「3.1 Pro超え」 — 何がどこまで観測されたか

Gemini公式ブログのキービジュアル — 新モデル発表時にGoogleが使用するOGP画像

出典: Google Blog — DeepMind

リーク観測のなかで最も注目を集めたのが、コーディング系タスクでGemini 3.1 Proを上回ったとの報告です。ただし、現状は特定のプロンプトでの単発観測例であり、広範なベンチマーク（MMLU、GPQA、SWE-bench Verified等）の公式スコアは出ていません。

報告されている観測例

タスク	観測内容	ソース
ASCII都市スカイラインの動的アニメーション	Gemini 3.1 Proが壊れたコードを返したのに対し、3.2 Flashは約2分で動作する完成コード（風車付き）を生成	LM Arena観測・複数テックメディア
SVG生成	より高い精度・少ないエラー・詳細表現が複数媒体で報告	テックメディア観測
3D・インタラクティブコーディング	ボクセル風ジオラマ、3Dシミュレーション、インタラクティブ環境の生成でGemini 3 Flashを上回る	LM Arena観測
HTML+Canvasアニメーション	フレームベースのアニメーション処理で安定生成	テックメディア観測

この観測の解釈

これらは「特定タスクでの単発勝利」であり、Gemini 3.1 Proが全領域で劣ることを意味しません。現に、Gemini 3.1 Proは公式ベンチマークで以下の極めて高いスコアを記録しています（参考: Gemini 3.1 Proモデルカード）。

ARC-AGI-2: 77.1%
SWE-bench Verified: 80.6%
GPQA Diamond: 94.3%
主要16ベンチマーク中13で当時の業界首位

Flash級モデルがコーディング系の特定タスクでProモデルを瞬間的に超えるのは、Flashティアが「フロンティアモデルの蒸留・最適化」によって作られる構造から十分にあり得る現象です。 3.2 Flashが「Pro超えのフラッグシップ」になったわけではなく、「Flash価格でPro並の出力を返せるシーンがある」と読むのが現状妥当です。

公式ベンチマークが出るまでは、用途を限定した観測例として受け取ることを推奨します。

関連: Gemini 3.1 Pro搭載のリサーチ製品については Google Deep Research Maxとは｜Gemini 3.1 Pro搭載の高速リサーチ機能を解説を参照してください。

機能・できること（観測ベース）

ここから先は、「もし公式発表通りであれば」という前提でしか語れない領域です。観測情報と推測を分けて整理します。

観測ベースで確認されている能力

コーディング: ASCIIアニメーション、SVG、3Dシミュレーション、HTML+Canvasで安定した出力
思考モードの統合（観測）: 従来の専用「Thinking」モードが全モデル共通のグローバル推論ON/OFFトグルに置き換わっているとの目撃情報。iOS Geminiアプリ内UIでのみ確認

推測される仕様（Gemini 3系の踏襲予想）

項目	推測値	確度
コンテキスト長	1Mトークン	Gemini 3系全モデルで共通のため踏襲予想
マルチモーダル入力	テキスト／画像／音声／動画／PDF	同上
Function Calling	対応	同上
構造化出力（JSON Schema）	対応	同上
Code Execution	対応	同上
Search Grounding	対応	同上

これらはあくまで推測です。Gemini 3.1 Flash-LiteのようにコンテキストやモーダリティをFlashティア内で簡略化する可能性も残っています。

制約・できないこと（2026-05-07時点）

公式API・Vertex AIで一般提供されていない（テストUI内のみ）
モデルカード未発行（安全性評価・ハルシネーション率・公式ベンチマーク未公表）
コンテキスト長・マルチモーダル仕様の正式値は未確認
A/Bテスト段階のため、iOS Geminiアプリで全ユーザーが利用できない
LM Arenaでの広範囲の公式ベンチマークスコア未公開
商用利用のSLA・サポート対象外（テストUI経由のため）

競合モデルとの位置取り

価格と用途で見たときの、競合する「Flash級フラッグシップ」モデルとの比較です。価格は2026-05-07時点の公式情報で確認した値、3.2 Flashのみリーク値です。

モデル	提供元	入力 / M	出力 / M	想定強み
Gemini 3.2 Flash（リーク）	Google	$0.25	$2.00	コーディング、3D生成、低コスト推論
GPT-5.5 Instant	OpenAI	（公式参照）	（公式参照）	汎用対話、ツール連携の安定性
Claude Opus 4.7	Anthropic	（公式参照）	（公式参照）	長文処理、エージェント駆動、コードレビュー
Grok 5（該当ティア）	xAI	（公式参照）	（公式参照）	リアルタイム情報統合

関連: GPT-5.5 Instantとの詳細比較は GPT-5.5 Instantとは｜料金・性能・GPT-5との違いを整理を、Claudeとの比較は Claude vs Gemini｜両者の違い・選び分けポイントを整理を参照してください。

各社の価格は頻繁にアップデートされるため、表内の「公式参照」項目は各社公式ページで最終確認してください。Gemini 3.2 Flashの真の競争力は、公式ベンチマークが出るまで未確定です。

いつ使うべきか — シーン別判断（公式リリース後を想定）

公式発表され、リーク通りの料金・性能で提供開始された場合の用途別判断目安です。現時点では推奨ではなく、「どう使えそうか」のシナリオ整理として読んでください。

用途	Gemini 3.2 Flash（公開後）	Gemini 3.1 Pro	Gemini 3.1 Flash-Lite
大量バッチ処理（要約・分類）	◎ コスト最強	△ 高すぎる	◎
ハイレベルな推論・難問題	○ Pro超え報告あり	◎ 公式最強	△
コーディング（中規模）	◎ 観測例で優勢	◎	○
エンタープライズ本番運用	✕ SLA未確認	◎ 公式・SLA対応	○
マルチモーダル（画像/動画解析）	？仕様未確認	◎	○
長文（>200k tokens）	？仕様未確認	◎	△
エージェントの中間推論層	○ レイテンシ次第	○	◎ コスト面

こんな方におすすめ

新Flashモデルの動向を早期にキャッチアップしたいエンジニア: I/O 2026前後に大きな選択肢変更が起きる可能性が高い
コーディング支援用途で、Pro料金が重い開発チーム: リーク通りなら入力コストが1/8になる
既存のGemini 3 Flash / Flash-Liteユーザー: 段階的アップグレード経路として有力
AIエージェントを構築するスタートアップ: 中間推論層のコスト構造を再設計できる可能性
iOS版Geminiアプリのヘビーユーザー: A/Bテストでアクセス可能なら早期に体験できる

Google I/O 2026で確認すべきチェックリスト

Geminiランディングページのキービジュアル — Google I/O 2026での新モデル発表が予測される

出典: Gemini — Google

公式発表はGoogle I/O 2026（2026-05-19〜20、Mountain View・Shoreline Amphitheatre）が最有力です。発表後に確認すべき項目を、リライト用にまとめておきます。

必須確認項目

Google AI for Developers Pricingページに Gemini 3.2 Flash が追加されたか
入力／出力料金がリーク値（$0.25 / $2.00）と一致するか
200kトークン超の追加料金体系
DeepMindモデルカードページに 3.2 Flashモデルカード が公開されたか
公式ベンチマーク（MMLU、SWE-bench Verified、GPQA Diamond、ARC-AGI-2）のスコア
コンテキスト長（1Mトークンか）
マルチモーダル対応（テキスト／画像／音声／動画／PDF）
Vertex AIドキュメントへの掲載
Gemini API（gemini-3.2-flash モデルID）での利用可否
バッチAPI・コンテキストキャッシュ割引の対応
Function Calling / 構造化出力 / Code Execution / Search Grounding の対応状況
Thinking モードの統合方式（グローバルトグル化が事実か）
安全性評価・レッドチーム結果の公開
エンタープライズ向けSLA・サポート対象範囲

「3.5」ではなく「3.2」になった理由の解説

Googleがインクリメンタルバージョニング戦略へ転換した背景説明が公式チャネル（Sundar PichaiまたはDemis Hassabisの基調講演）でなされる可能性があります。これにより、Pro系統とFlash系統が独立して進化する「並行リリースモデル」が確立されるかが見えてきます。

よくある質問（FAQ）

Q. Gemini 3.2 Flashはいつ使えますか？

2026年5月7日時点で公式リリースされていません。一部のiOS版Geminiアプリ・Google AI Studioのテストユーザーに限定的に表示されており、A/Bテスト段階です。Google I/O 2026（5/19–20）が公式発表の最有力ウィンドウとされています。

Q. $0.25/M入力という料金は本当ですか？

複数のテックメディアがGoogle AI Studioのメタデータから観測したリーク値です。Google公式の料金表（Google AI for Developers Pricing）には2026-05-07時点で掲載されておらず、公式発表で変動する可能性があります。

Q. 本当にGemini 3.1 Proを超えていますか？

ASCII都市スカイラインアニメーション、SVG生成、3Dコーディングといった特定タスクでの単発観測例でProを上回った報告があります。しかし、MMLU・GPQA・SWE-bench Verified等の広範な公式ベンチマークは未公開で、全領域でPro超えと断定するのは時期尚早です。

Q. Gemini 3.1 Flash-Liteとの違いは何ですか？

リーク料金では入力単価が同じ$0.25/Mです。出力は3.2 Flashが$2.00、3.1 Flash-Liteが$1.50で3.2 Flashの方が高めですが、その分性能で上回ると見られます。Flash-Liteは「最廉価」、3.2 Flashは「コスト・性能バランス」のポジションです。

Q. 1Mトークンのコンテキスト長に対応していますか？

未確認です。Gemini 3系（Pro / 3 Flash / 3.1 Flash-Lite）が共通して1Mトークンに対応しているため踏襲が予想されますが、公式モデルカードが出るまで断定できません。

Q. Vertex AIで使えますか？

2026-05-07時点で未提供です。観測されているのはiOS版Geminiアプリ（A/Bテスト）とGoogle AI Studio内部のメタデータのみで、本番Vertex AIエンドポイントには到達していません。

Q. 商用本番に投入してよいですか？

推奨しません。モデルカード未発行、SLA未確認、安全性評価未公開の状態です。本番投入は公式発表（I/O 2026以降）と公式ドキュメント整備を待ってください。

まとめ — 「待つ」を選ぶか、「先行検証」するか

Gemini 3.2 Flashは、2026年5月7日時点でiOS版GeminiアプリとGoogle AI Studioで先行観測されているリーク段階のモデルです。$0.25/M入力・$2.00/M出力というリーク料金が事実なら、Gemini 3.1 Pro比で入力1/8・出力1/6という劇的な価格性能比をFlashティアで実現する可能性があります。

ただし、現時点で確実なのは「観測されたこと」のみで、料金・性能・仕様はいずれも公式裏取りが取れていません。エンタープライズ用途ではGoogle I/O 2026（5/19–20）の公式発表後に判断するのが妥当です。一方、新モデル動向を素早くキャッチアップしたい開発者は、iOS版Geminiアプリやその後のAI Studioでの段階的ロールアウトを観察しておくとよいでしょう。

本記事はI/O 2026以後、公式情報が出次第リライトします。料金・性能・仕様の最終判断は、必ず以下の公式ページでご確認ください。