AIツール2026年5月更新

Gemini 3.2 Flashとは?$0.25/M入力リーク・3.1 Pro超え性能・iOS先行漏洩を整理【2026年5月最新】

公開日: 2026/05/07
Gemini 3.2 Flashとは?$0.25/M入力リーク・3.1 Pro超え性能・iOS先行漏洩を整理【2026年5月最新】

この記事のポイント

Gemini 3.2 Flashは2026年5月7日時点でGoogle未発表のリークモデル。iOS版GeminiアプリとAI Studioでの目撃、$0.25/$2.00のリーク料金、Gemini 3.1 Proを超えるコーディング性能の観測例、Google I/O 2026での発表予測まで、現時点で確認できる事実のみ整理します。

Gemini 3.2 Flashは、Google(Google DeepMind)が次に投入すると見られるFlashティアの新モデルですが、2026年5月7日時点ではGoogleから公式発表されていません。 iOS版Geminiアプリのモデルピッカーと、Google AI Studioのメタデータ、そしてLM Arenaでの匿名ベンチマークで先行観測されているリーク段階のモデルです。

公式モデルカードも公式料金表もまだ存在せず、現在出回っている「$0.25/M入力・$2.00/M出力」「Gemini 3.1 Pro超えの性能」といった情報はすべてリークと観測ベースです。本記事は、その「リーク/観測/推測」の境界線を一切ぼかさず、2026年5月7日時点で公開情報から確実に言える範囲だけを整理します。

この記事でわかること

  • Gemini 3.2 Flashの観測経緯と「リーク/公式」の現状
  • リークされた料金($0.25/$2.00)が事実なら何を意味するか
  • LM Arenaで観測された「3.1 Pro超え」の具体的タスク
  • Gemini 3 / 3.1 Flash-Lite / 3.1 Proとの位置取り
  • Google I/O 2026(5/19–20)で確認すべきチェック項目
  • いま導入判断すべきか、待つべきか

こんな方向け

  • 業務用AI APIの調達担当・エンジニアで、Flashティアの最新動向を追っている
  • Gemini 3.1 ProとFlashの選び分けに迷っている
  • リーク情報と公式情報を切り分けて理解したい

⚠️ 本記事は2026年5月7日時点のリーク・観測情報を整理したものです。 Google I/O 2026(5/19–20)で公式発表された場合は、本記事を全面リライトします。記事中の料金・性能・仕様は、必ず公式ドキュメント(Google AI for Developers、DeepMindモデルカード、Vertex AIドキュメント)で最終確認してください。

Gemini 3.2 Flashの基本情報(2026年5月7日時点)

Google DeepMindが提供するGeminiモデルファミリーの公式キービジュアル

出典: Google DeepMind — Gemini

Gemini 3.2 Flashは、リーク観測の構造から「Gemini 3.1 Flash-LiteとGemini 3.1 Proの中間ポジション」を狙う、コスト重視Flashティアの次期モデルと推定されます。Google公式の発表はまだ出ていません。

項目

内容

モデル名

Gemini 3.2 Flash

開発元

Google(Google DeepMind)

ティア

Flash(速度・コスト最適化)

ポジション(推測)

3.1 Flash-Liteと3.1 Proの中間。「Pro並の性能をFlash価格で」

観測経路

iOS版Geminiアプリ/Google AI Studio/LM Arena

公式発表

未発表(2026-05-07時点)

初観測日

2026-05-05(Reddit r/GeminiAIでの最初の報告)

公式発表予測

Google I/O 2026(2026-05-19〜20)

「3.5」ではなく「3.2」というナンバリングが採用されている点も特徴です。複数の海外メディアは「Googleがインクリメンタル(小刻み)バージョニング戦略へ転換し、Flashティアでの高速イテレーションに注力するシグナル」と解釈しています。

関連: Geminiファミリ全体の体系・各ティアの位置づけは Geminiとは|できること・料金・各モデルの違いを総整理 も参照してください。

なぜ「リーク段階」なのか — 観測の経緯

Gemini 3.2 Flashの存在は、2026年5月5日前後に複数の経路で同時に「目撃」されました。

観測ルート1: iOS版Geminiアプリのモデルピッカー

Reddit(r/GeminiAI)で、iOS版Geminiアプリのモデル選択ドロップダウンに「Gemini 3 Flash → 3.1 Flash → 3.2 Flash」が約24時間ごとに循環表示される現象が報告されました。これはGoogleがA/Bテスト段階でモデルを差し替えていることを示唆しています。

同時に、iOS 26のLiquid Glassデザイン言語に準拠した新UI(ピル型プロンプトボックス、脈動グラデーション背景、左上ドロップダウン式モデルピッカー)もロールアウトされており、「モデル本体のリリース」と「アプリUIのリニューアル」が並行して進んでいる可能性が高いです。

ただし、Reddit投稿でも「自分のアプリには出ていない」というコメントが多数あり、全ユーザーが観測できたわけではない点に注意が必要です。

観測ルート2: Google AI Studio内のメタデータ

Google AI Studio(https://aistudio.google.com)の内部メタデータに「Gemini 3.2 Flash」のエントリと、$0.25/M入力・$2.00/M出力という料金値が含まれていたとの報告があります。これがリーク料金値の出どころです。

この値は2026-05-07時点でAI Studioの公式価格表(Pricingページ)にも、Vertex AIドキュメントにも掲載されていません。

観測ルート3: LM Arenaでの匿名ベンチマーク

LM Arena(旧 Chatbot Arena、Eleuther AI Arena)で、匿名のGemini系モデルがサイレントベンチマーク稼働しているとの報告が複数媒体から出ています。後述する「ASCII都市スカイラインアニメーション」プロンプトでGemini 3.1 Proを上回る出力をした事例は、このLM Arena経由で観測されたものです。

「公式 / リーク / 推測」の3段階整理

情報

ステータス

iOS Geminiアプリでのモデル名表示

リーク(複数媒体・Redditが報告)

Google AI Studio内のメタデータ

リーク(複数媒体報告)

$0.25/M入力・$2.00/M出力

リーク(要公式確認)

LM Arenaでの匿名稼働

観測(ベンチマーク参加自体は事実だが3.2 Flashである確証は限定的)

1Mトークンコンテキスト・マルチモーダル対応

推測(Gemini 3系の踏襲予想)

Google I/O 2026での公式発表

推測(最有力ウィンドウだが公式アナウンスなし)

モデルカード・SLA・安全性評価

未公開(リークすらない)

リーク料金の意味 — $0.25/$2.00は何を変えるか

⚠️ 以下はGoogle未公表のリーク値です。記事執筆時点では公式料金表に掲載されていないため、実装判断は必ずGoogle AI for DevelopersのPricingページで再確認してください。

リーク値が事実だった場合の、Gemini 3系内での価格ポジションは次のとおりです(公式既存料金は2026年5月7日時点のGoogle AI for Developers Pricingページに基づく)。

モデル

入力 / M token

出力 / M token

ステータス

Gemini 3.1 Pro Preview

$2.00

$12.00

公式

Gemini 3.1 Flash Live Preview

$0.75(テキスト)

$4.50(テキスト)

公式

Gemini 3 Flash Preview

$0.50

$3.00

公式

Gemini 3.2 Flash(リーク値)

$0.25

$2.00

リーク

Gemini 3.1 Flash-Lite Preview

$0.25

$1.50

公式

読み取れること(リーク値が事実なら)

  • 入力単価はFlash-Liteと同水準($0.25/M)。これは「最廉価帯と同じ入力コスト」で動作することを意味します
  • 出力単価はGemini 3 Flashより約33%安い($3.00 → $2.00)。Flash-Lite($1.50)よりは高めですが、性能差を考慮すると合理的な位置取りです
  • Gemini 3.1 Proとの比較では、入力で1/8、出力で1/6。仮にコーディング性能が3.1 Proに迫るなら、価格性能比は劇的に改善します

注意 — 公式発表で変動する可能性が高い

過去のGeminiモデルでも、リーク値と最終的な公式料金が一致しなかった事例があります。とくに以下の項目はリーク段階では不明であり、公式発表時に大きく印象が変わり得ます。

  • 200kトークン超のコンテキスト時の追加料金(Gemini 3.1 Proは200k超で入力$3.00/出力$18.00へ上昇)
  • バッチAPI割引・コンテキストキャッシュ割引の対応有無
  • マルチモーダル入力(画像・音声・動画)の追加料金体系
  • Vertex AI経由とGoogle AI for Developers経由での価格差

LM Arenaでの「3.1 Pro超え」 — 何がどこまで観測されたか

Gemini公式ブログのキービジュアル — 新モデル発表時にGoogleが使用するOGP画像

出典: Google Blog — DeepMind

リーク観測のなかで最も注目を集めたのが、コーディング系タスクでGemini 3.1 Proを上回ったとの報告です。ただし、現状は特定のプロンプトでの単発観測例であり、広範なベンチマーク(MMLU、GPQA、SWE-bench Verified等)の公式スコアは出ていません。

報告されている観測例

タスク

観測内容

ソース

ASCII都市スカイラインの動的アニメーション

Gemini 3.1 Proが壊れたコードを返したのに対し、3.2 Flashは約2分で動作する完成コード(風車付き)を生成

LM Arena観測・複数テックメディア

SVG生成

より高い精度・少ないエラー・詳細表現が複数媒体で報告

テックメディア観測

3D・インタラクティブコーディング

ボクセル風ジオラマ、3Dシミュレーション、インタラクティブ環境の生成でGemini 3 Flashを上回る

LM Arena観測

HTML+Canvasアニメーション

フレームベースのアニメーション処理で安定生成

テックメディア観測

この観測の解釈

これらは「特定タスクでの単発勝利」であり、Gemini 3.1 Proが全領域で劣ることを意味しません。現に、Gemini 3.1 Proは公式ベンチマークで以下の極めて高いスコアを記録しています(参考: Gemini 3.1 Proモデルカード)。

  • ARC-AGI-2: 77.1%
  • SWE-bench Verified: 80.6%
  • GPQA Diamond: 94.3%
  • 主要16ベンチマーク中13で当時の業界首位

Flash級モデルがコーディング系の特定タスクでProモデルを瞬間的に超えるのは、Flashティアが「フロンティアモデルの蒸留・最適化」によって作られる構造から十分にあり得る現象です。 3.2 Flashが「Pro超えのフラッグシップ」になったわけではなく、「Flash価格でPro並の出力を返せるシーンがある」と読むのが現状妥当です。

公式ベンチマークが出るまでは、用途を限定した観測例として受け取ることを推奨します。

関連: Gemini 3.1 Pro搭載のリサーチ製品については Google Deep Research Maxとは|Gemini 3.1 Pro搭載の高速リサーチ機能を解説 を参照してください。

機能・できること(観測ベース)

ここから先は、「もし公式発表通りであれば」という前提でしか語れない領域です。観測情報と推測を分けて整理します。

観測ベースで確認されている能力

  • コーディング: ASCIIアニメーション、SVG、3Dシミュレーション、HTML+Canvasで安定した出力
  • 思考モードの統合(観測): 従来の専用「Thinking」モードが全モデル共通のグローバル推論ON/OFFトグルに置き換わっているとの目撃情報。iOS Geminiアプリ内UIでのみ確認

推測される仕様(Gemini 3系の踏襲予想)

項目

推測値

確度

コンテキスト長

1Mトークン

Gemini 3系全モデルで共通のため踏襲予想

マルチモーダル入力

テキスト/画像/音声/動画/PDF

同上

Function Calling

対応

同上

構造化出力(JSON Schema)

対応

同上

Code Execution

対応

同上

Search Grounding

対応

同上

これらはあくまで推測です。Gemini 3.1 Flash-LiteのようにコンテキストやモーダリティをFlashティア内で簡略化する可能性も残っています。

制約・できないこと(2026-05-07時点)

  • 公式API・Vertex AIで一般提供されていない(テストUI内のみ)
  • モデルカード未発行(安全性評価・ハルシネーション率・公式ベンチマーク未公表)
  • コンテキスト長・マルチモーダル仕様の正式値は未確認
  • A/Bテスト段階のため、iOS Geminiアプリで全ユーザーが利用できない
  • LM Arenaでの広範囲の公式ベンチマークスコア未公開
  • 商用利用のSLA・サポート対象外(テストUI経由のため)

競合モデルとの位置取り

価格と用途で見たときの、競合する「Flash級フラッグシップ」モデルとの比較です。価格は2026-05-07時点の公式情報で確認した値、3.2 Flashのみリーク値です。

モデル

提供元

入力 / M

出力 / M

想定強み

Gemini 3.2 Flash(リーク)

Google

$0.25

$2.00

コーディング、3D生成、低コスト推論

GPT-5.5 Instant

OpenAI

(公式参照)

(公式参照)

汎用対話、ツール連携の安定性

Claude Opus 4.7

Anthropic

(公式参照)

(公式参照)

長文処理、エージェント駆動、コードレビュー

Grok 5(該当ティア)

xAI

(公式参照)

(公式参照)

リアルタイム情報統合

関連: GPT-5.5 Instantとの詳細比較は GPT-5.5 Instantとは|料金・性能・GPT-5との違いを整理 を、Claudeとの比較は Claude vs Gemini|両者の違い・選び分けポイントを整理 を参照してください。

各社の価格は頻繁にアップデートされるため、表内の「公式参照」項目は各社公式ページで最終確認してください。Gemini 3.2 Flashの真の競争力は、公式ベンチマークが出るまで未確定です。

いつ使うべきか — シーン別判断(公式リリース後を想定)

公式発表され、リーク通りの料金・性能で提供開始された場合の用途別判断目安です。現時点では推奨ではなく、「どう使えそうか」のシナリオ整理として読んでください。

用途

Gemini 3.2 Flash(公開後)

Gemini 3.1 Pro

Gemini 3.1 Flash-Lite

大量バッチ処理(要約・分類)

◎ コスト最強

△ 高すぎる

ハイレベルな推論・難問題

○ Pro超え報告あり

◎ 公式最強

コーディング(中規模)

◎ 観測例で優勢

エンタープライズ本番運用

✕ SLA未確認

◎ 公式・SLA対応

マルチモーダル(画像/動画解析)

? 仕様未確認

長文(>200k tokens)

? 仕様未確認

エージェントの中間推論層

○ レイテンシ次第

◎ コスト面

こんな方におすすめ

  • 新Flashモデルの動向を早期にキャッチアップしたいエンジニア: I/O 2026前後に大きな選択肢変更が起きる可能性が高い
  • コーディング支援用途で、Pro料金が重い開発チーム: リーク通りなら入力コストが1/8になる
  • 既存のGemini 3 Flash / Flash-Liteユーザー: 段階的アップグレード経路として有力
  • AIエージェントを構築するスタートアップ: 中間推論層のコスト構造を再設計できる可能性
  • iOS版Geminiアプリのヘビーユーザー: A/Bテストでアクセス可能なら早期に体験できる

おすすめしない方

  • 本番運用のSLAが必須のエンタープライズ: 2026-05-07時点でSLA・モデルカード・安全性評価が未公開。導入判断はI/O 2026以降の公式発表を待つべき
  • 規制業界(医療・金融)でのコンプライアンス用途: モデルカード未発行のため、リスク評価ができない
  • 公式料金表ベースで予算を組む必要がある組織: リーク料金は変動する可能性が高い
  • マルチモーダル処理(音声・動画)が業務必須の用途: 3.2 Flashのモダリティ仕様は未確認
  • 「最強モデル」を前提に検証したいユーザー: 3.2 FlashはあくまでFlashティア。フロンティアはGemini 3.1 Pro(および後継)

Google I/O 2026で確認すべきチェックリスト

Geminiランディングページのキービジュアル — Google I/O 2026での新モデル発表が予測される

出典: Gemini — Google

公式発表はGoogle I/O 2026(2026-05-19〜20、Mountain View・Shoreline Amphitheatre)が最有力です。発表後に確認すべき項目を、リライト用にまとめておきます。

必須確認項目

  • Google AI for Developers Pricingページに Gemini 3.2 Flash が追加されたか
  • 入力/出力料金がリーク値($0.25 / $2.00)と一致するか
  • 200kトークン超の追加料金体系
  • DeepMindモデルカードページに 3.2 Flashモデルカード が公開されたか
  • 公式ベンチマーク(MMLU、SWE-bench Verified、GPQA Diamond、ARC-AGI-2)のスコア
  • コンテキスト長(1Mトークンか)
  • マルチモーダル対応(テキスト/画像/音声/動画/PDF)
  • Vertex AIドキュメントへの掲載
  • Gemini API(gemini-3.2-flash モデルID)での利用可否
  • バッチAPI・コンテキストキャッシュ割引の対応
  • Function Calling / 構造化出力 / Code Execution / Search Grounding の対応状況
  • Thinking モードの統合方式(グローバルトグル化が事実か)
  • 安全性評価・レッドチーム結果の公開
  • エンタープライズ向けSLA・サポート対象範囲

「3.5」ではなく「3.2」になった理由の解説

Googleがインクリメンタルバージョニング戦略へ転換した背景説明が公式チャネル(Sundar PichaiまたはDemis Hassabisの基調講演)でなされる可能性があります。これにより、Pro系統とFlash系統が独立して進化する「並行リリースモデル」が確立されるかが見えてきます。

関連発表として警戒する項目

  • Gemini 3.2 Pro の有無(Pro側の3.2は未観測)
  • Gemini 3.2 Flash Live(リアルタイム音声)の有無
  • Gemini 3.2 Flash-Lite の有無
  • Gemini Robotics や Project Mariner(エージェント)への展開

よくある質問(FAQ)

Q. Gemini 3.2 Flashはいつ使えますか?

2026年5月7日時点で公式リリースされていません。一部のiOS版Geminiアプリ・Google AI Studioのテストユーザーに限定的に表示されており、A/Bテスト段階です。Google I/O 2026(5/19–20)が公式発表の最有力ウィンドウとされています。

Q. $0.25/M入力という料金は本当ですか?

複数のテックメディアがGoogle AI Studioのメタデータから観測したリーク値です。Google公式の料金表(Google AI for Developers Pricing)には2026-05-07時点で掲載されておらず、公式発表で変動する可能性があります。

Q. 本当にGemini 3.1 Proを超えていますか?

ASCII都市スカイラインアニメーション、SVG生成、3Dコーディングといった特定タスクでの単発観測例でProを上回った報告があります。しかし、MMLU・GPQA・SWE-bench Verified等の広範な公式ベンチマークは未公開で、全領域でPro超えと断定するのは時期尚早です。

Q. Gemini 3.1 Flash-Liteとの違いは何ですか?

リーク料金では入力単価が同じ$0.25/Mです。出力は3.2 Flashが$2.00、3.1 Flash-Liteが$1.50で3.2 Flashの方が高めですが、その分性能で上回ると見られます。Flash-Liteは「最廉価」、3.2 Flashは「コスト・性能バランス」のポジションです。

Q. 1Mトークンのコンテキスト長に対応していますか?

未確認です。Gemini 3系(Pro / 3 Flash / 3.1 Flash-Lite)が共通して1Mトークンに対応しているため踏襲が予想されますが、公式モデルカードが出るまで断定できません。

Q. Vertex AIで使えますか?

2026-05-07時点で未提供です。観測されているのはiOS版Geminiアプリ(A/Bテスト)とGoogle AI Studio内部のメタデータのみで、本番Vertex AIエンドポイントには到達していません。

Q. 商用本番に投入してよいですか?

推奨しません。モデルカード未発行、SLA未確認、安全性評価未公開の状態です。本番投入は公式発表(I/O 2026以降)と公式ドキュメント整備を待ってください。

まとめ — 「待つ」を選ぶか、「先行検証」するか

Gemini 3.2 Flashは、2026年5月7日時点でiOS版GeminiアプリとGoogle AI Studioで先行観測されているリーク段階のモデルです。$0.25/M入力・$2.00/M出力というリーク料金が事実なら、Gemini 3.1 Pro比で入力1/8・出力1/6という劇的な価格性能比をFlashティアで実現する可能性があります。

ただし、現時点で確実なのは「観測されたこと」のみで、料金・性能・仕様はいずれも公式裏取りが取れていません。エンタープライズ用途ではGoogle I/O 2026(5/19–20)の公式発表後に判断するのが妥当です。一方、新モデル動向を素早くキャッチアップしたい開発者は、iOS版Geminiアプリやその後のAI Studioでの段階的ロールアウトを観察しておくとよいでしょう。

本記事はI/O 2026以後、公式情報が出次第リライトします。料金・性能・仕様の最終判断は、必ず以下の公式ページでご確認ください。

  • Google AI for Developers — Pricing
  • Google DeepMind — Geminiモデルカード
  • Vertex AIドキュメント
  • Google AI Studio

関連記事:

AIツールの導入でお困りですか?

お客様のビジネスに最適なAIツールをご提案します。まずは無料相談から。

この記事の著者

AI革命

AI革命

編集部

AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。

AI活用ならAI革命にお任せ。サービスを見てみる
AI Revolution Growth Arrow

AIでビジネスを革新しませんか?

あなたのビジネスにAIがどのような価値をもたらすかをご提案いたします。