Gemini 3.5 Flashとは?Google I/O 2026発表・性能・料金・Managed Agents・3.2 Flashとの違いを徹底解説【2026年5月】

この記事のポイント
Gemini 3.5 FlashはGoogleが2026年5月19日に発表した最新AIモデル。フロンティア級の性能とFlash速度を両立し、Managed Agentsでエージェント開発を大幅に簡略化。料金・ベンチマーク・3.2 Flashとの違い・使い方を公式情報をもとに解説します。
Gemini 3.5 Flashは、Googleが2026年5月19日のGoogle I/O 2026で発表・即日提供開始した最新AIモデルです。「フロンティア知能 × アクション(frontier intelligence with action)」をコンセプトに、エージェント・コーディング用途に特化して設計されており、他フロンティアモデルの4倍の出力速度とGemini 3.1 Proを超えるベンチマーク性能を両立しています。
この記事でわかること:
- Gemini 3.5 Flashの機能・スペック(公式確認値)
- 料金・プラン体系と「Flashなのに高い」問題の整理
- Managed Agents・Google Antigravity 2.0の仕組みと実装観点
- Gemini 3.2 Flash(未発売リーク)との関係と経緯
- 他モデル(Gemini 3.1 Pro、Claude Opus 4.7)との比較
- こんな用途に向いている / 向いていない
対象読者: API開発者、生成AIの導入検討をしている企業担当者、Geminiシリーズを業務利用しているユーザー、最新モデルの動向を追っているAI関係者。
Gemini 3.5 Flashとは — 定義と位置づけ

出典: Google Blog — Gemini 3.5: frontier intelligence with action
Gemini 3.5 Flashは、Google DeepMindが開発した汎用マルチモーダルAIモデルで、Geminiシリーズの「Flash」ライン(高速・高コスパ)に属しながら、初めてフロンティア級の性能を備えた点が最大の特徴です。
項目 | 内容 |
|---|---|
開発元 | Google / Google DeepMind |
API ID |
|
発表・提供開始日 | 2026年5月19日(Google I/O 2026) |
利用可能な環境 | Geminiアプリ、Google AI Studio、Google Antigravity 2.0、Vertex AI(Google Cloud)、Gemini Enterprise Agent Platform、AI Mode in Google Search |
内部コードネーム | Cappuccino(複数テックメディア報告、公式未確認) |
従来の「Flash」モデルは「Pro より安く、速いが性能は一歩下」という位置づけでした。しかし Gemini 3.5 Flash は、公式ベンチマーク上でコーディング性能・エージェントタスク性能の複数指標で Gemini 3.1 Pro を上回り、Pro と同等以上の知能を Flash 速度で提供するという従来の分類を超えた存在です。
Googleは「来月(2026年6月)に Gemini 3.5 Pro を提供予定」と発表しており、現時点では 3.5 Flash が Gemini 3.5 ファミリーの先陣を切っています。
Gemini 3.5 Flashでできること — 主な機能一覧

出典: Google AI for Developers — What's new in Gemini 3.5 Flash
スペック(公式確認値)
項目 | 値 |
|---|---|
入力コンテキスト上限 | 1,048,576トークン(約100万トークン) |
最大出力トークン | 65,536トークン |
出力速度 | 他フロンティアモデルの4倍(Antigravity内では12倍) |
マルチモーダル入力 | テキスト・画像・音声・動画・PDF |
出力形式 | テキスト |
思考(Thinking) | デフォルト: medium(minimal / low / medium / high から選択可) |
対応機能(公式確認済み)
- Function Calling(関数呼び出し)— ツール統合・エージェント構築の基盤
- 構造化出力(JSON Schema)— 定型フォーマットで確実にデータ抽出
- Code Execution(コード実行)— Python などをサンドボックス内で直接実行
- Search Grounding(検索グラウンディング)— Google 検索結果を根拠にリアルタイム情報を付加
- コンテキストキャッシング— 同一コンテキストの繰り返し利用でコスト削減
- バッチ API— 非同期・大量処理で最大50%割引
- Dynamic Thinking— タスク難易度に応じて思考量を自動調整
- Managed Agents — 単一 API コールでフルエージェントを起動
思考レベル(thinking_level)の変更点
前バージョン(gemini-3-flash-preview)ではデフォルト思考レベルが high でしたが、Gemini 3.5 Flash では medium に変更されています。API 移行時はコスト・速度の変化に注意が必要です。
また、パラメータの整理も行われており、以下は非推奨または削除推奨になっています:
temperature、top_p、top_k→ 削除推奨(thinking_levelに移行)thinking_budget→thinking_levelに置き換えFunctionResponseにidとnameの追加が必須に
ベンチマーク — 性能の実態
Googleが公式発表したベンチマーク値は以下の通りです。
ベンチマーク | Gemini 3.5 Flash | Gemini 3.1 Pro | 概要 |
|---|---|---|---|
Terminal-Bench 2.1 | 76.2% | 70.3% | コーディング性能 |
GDPval-AA(Elo) | 1656 | 1314 | 実世界エージェントタスク |
MCP Atlas | 83.6% | 78.2% | スケールしたツール使用の信頼性 |
CharXiv Reasoning | 84.2% | — | マルチモーダル理解 |
Finance Agent v2 | 57.9% | 43.0% | 金融エージェントタスク |
コーディング・エージェント系タスクでは Gemini 3.1 Pro を明確に上回っています。一方で、SWE-bench Verified(単一バグ修正)では Claude Opus 4.7 が 87.6% を記録しており、Gemini 3.5 Flash の正式スコアは現時点(2026-05-21)で公式未発表です。深い推論・知識集約型試験(Humanity's Last Exam)では Pro 級モデルに劣る領域も残っています。
⚠️ ベンチマーク値は測定方法・バージョン・プロンプトによって大きく変動します。あくまで参考値として判断材料の一つに留めてください。
より広い視点での Claude との比較は Claude vs Gemini 比較記事 で詳しく解説しています。
料金・プラン — 「Flashなのに高い」問題を整理する

API料金(Google AI for Developers / Vertex AI)
プラン | 入力 / 1M トークン | 出力 / 1M トークン | キャッシュ入力 |
|---|---|---|---|
無料枠(Free Tier) | 無料 | 無料 | 無料 |
有料(標準) | $1.50 | $9.00 | $0.15 |
有料(グローバル外リージョン) | $1.65 | $9.90 | — |
バッチモード | 約50%割引 | 約50%割引 | — |
コンテキストキャッシュ ストレージ | $1.00 / 1M トークン / 時間 | — | — |
Search Grounding | 5,000プロンプト/月(無料)、以降 $14 / 1,000クエリ | — | — |
- 無料枠のデータ利用: 製品改善に使用される(有料プランでは使用されない)
他モデルとの料金比較
モデル | 入力 / 1M | 出力 / 1M | 位置づけ |
|---|---|---|---|
Gemini 3.1 Flash-Lite | $0.25 | $1.50 | 軽量・低コスト |
Gemini 3 Flash Preview | $0.50 | $3.00 | 旧 Flash |
Gemini 3.5 Flash(今回) | $1.50 | $9.00 | フロンティア級 Flash |
Gemini 3.1 Pro | $2.00 | $12.00 | 従来フロンティア |
「Flashなのに高い」の真相
Gemini 3.5 Flash の料金は旧 Flash($0.50/$3.00)比で3倍高く、一部コミュニティで「Flash なのに高い」という批判が発生しています。ただし、この批判にはいくつかの背景があります。
批判側の主な論点:
- Gemini 3.1 Flash-Lite($0.25/$1.50)比で入力6倍・出力6倍
- 「Flash = 低コスト」という従来の期待値との乖離
「実は安い」側の論点:
- Gemini 3.1 Pro($2.00/$12.00)比では入力25%安・出力25%安でPro 性能を安く使える
- バッチモードで約50%割引 → 大量処理なら実効 $0.75/$4.50 まで下がる
- コンテキストキャッシュ活用で同一コンテキスト繰り返し時のコストを大幅削減
- Sundar Pichai:「1日1兆トークンを実行する企業が80%のワークロードを Flash に移行すれば年間 $10億超のコスト削減が可能」
業界トレンドとして: OpenAI GPT-5.5・Claude Opus 4.7 も直近で値上げしており、フロンティア級モデルの価格帯が全体的に上昇している流れの中での価格設定です(Simon Willison 評)。
結論として、「大量バッチ処理や同一コンテキストを繰り返すエージェントワークフロー」では費用対効果が高く、「1リクエスト単発の低コスト用途」には向かない価格設計と言えます。
Managed Agentsとは — Gemini APIの新機能を徹底解説
Managed Agents は、2026年5月19日に Gemini API と同時発表されたエージェント構築機能です。
従来のエージェント構築との違い
従来、LLM を使ったエージェントを構築するには、オーケストレーションフレームワーク(LangChain、LlamaIndex 等)でループ処理・ツール呼び出し・状態管理を自前で実装する必要がありました。Managed Agents では、単一の API コールでフルエージェントをスピンアップできます。
主な仕様
特徴 | 内容 |
|---|---|
実行環境 | 隔離された Linux コンテナ(サンドボックス) |
セッション | ファイルとセッション状態がマルチターン呼び出し間で持続 |
カスタマイズ |
|
インフラ | Google Antigravity エージェントインフラへのアクセス |
複雑なオーケストレーション | コード不要でカスタム指示ベースで設定可能 |
動作フロー(概要)
AGENTS.mdでエージェントの役割・スキルを定義- Gemini API の Managed Agents エンドポイントにリクエスト
- Linux コンテナ内でモデルが推論・ツール使用・コード実行を自律実行
- 「判断分岐点や権限問題」でユーザー入力を一時停止して確認(ヒューマン・イン・ザ・ループ)
- 結果とセッション状態を返却、フォローアップ呼び出しに引き継ぎ
実装時の注意点: コード実行を伴う Managed Agents はサンドボックス環境での動作ですが、外部 API 呼び出しやファイルシステムアクセスを含む場合は権限スコープを慎重に設定してください。
Gemini Enterprise Agent Platform での大規模展開については Gemini Enterprise Agent Platform 解説記事 も参照してください。
Google Antigravity 2.0 — エージェント操作の新中核
Google Antigravity 2.0 は、Google I/O 2026 と同日発表されたデスクトップアプリケーションで、Gemini 3.5 Flash 搭載エージェントを操作する中心ハブです。
主な機能:
- 複数エージェントの並列実行・オーケストレーション
- 動的サブエージェントの作成
- スケジュールタスク(バックグラウンド自動化)
- Google AI Studio、Android、Firebase との統合
- Gemini Antigravity 内部では 3.5 Flash が 12倍高速動作(標準 API 比)
開発者向けには「Google 自身がエージェントを動かすのと同じ技術・インフラ」を公開しているという位置づけです。API 経由での Managed Agents との連携も想定されており、エンタープライズ向け Gemini Enterprise Agent Platform とは異なる開発者フォーカスのプラットフォームです。
Gemini 3.2 Flashとの違い — 「幻のモデル」との経緯を整理する

出典: Google 公式ブログ
当サイトには Gemini 3.2 Flashとは という記事がありますが、Gemini 3.2 Flash は正式にリリースされませんでした。このセクションでは「3.2 → 3.5」に何が起きたのかを整理します。
Gemini 3.2 Flashの位置づけ(リーク段階)
2026年5月5〜14日の間、iOS アプリ・Google AI Studio 内部メタデータ・LM Arena において「Gemini 3.2 Flash」と思われるモデルが観測されていました。当時のリーク情報では:
- 料金: $0.25 / $2.00(入力/出力、1M トークン当たり)
- 位置づけ: Flash-Lite と 3.1 Pro の中間(コスト最適化)
- Managed Agents 対応: 未観測
I/O 2026 で実際に発表されたのは「3.5 Flash」
Google I/O 2026(5月19日)で Googleが発表・リリースしたのは「Gemini 3.5 Flash」であり、「3.2 Flash」は正式にリリースされませんでした。Google から「3.2 をスキップした」「3.5 に統合した」という公式コメントはまだありません(2026-05-21 時点)。
比較項目 | Gemini 3.2 Flash(未発売・リーク値) | Gemini 3.5 Flash(公式 GA) |
|---|---|---|
公式ステータス | 未発売(リーク・内部観測のみ) | 2026-05-19 GA |
料金(入力/出力 per 1M) | $0.25 / $2.00(リーク) | $1.50 / $9.00(公式) |
位置づけ | Flash-Lite と Pro の中間 | Pro 超え・フロンティア級 |
エージェント機能 | 観測なし | Managed Agents 対応 |
コンテキスト | 推測 1M(未確認) | 1,048,576 トークン(公式) |
速度 | 未発表 | フロンティアモデルの4倍 |
差別化の核心: リーク段階の 3.2 Flash は「Flash 価格でそこそこ高性能」という期待値でしたが、実際に発売された 3.5 Flash はさらに Pro を超えた上で「Flash 速度の4倍」という規格外の性能を持ちます。ただし料金は予測の6倍($1.50 vs 予測 $0.25)であり、「安さへの期待」は裏切られた形です。
Gemini 3.1 Pro / Claude Opus 4.7 との比較
Gemini 3.5 Flash の立ち位置を競合モデルと比較します。
項目 | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Opus 4.7 |
|---|---|---|---|
提供元 | Anthropic | ||
入力料金 / 1M | $1.50 | $2.00 | 公式参照 |
出力料金 / 1M | $9.00 | $12.00 | 公式参照 |
コンテキスト | 1,048,576 トークン | 1,048,576 トークン | — |
出力速度 | フロンティアの4倍 | 標準 | 標準 |
Terminal-Bench 2.1 | 76.2% | 70.3% | — |
SWE-bench Verified | 未発表 | 80.6% | 87.6% |
MCP Atlas | 83.6% | 78.2% | — |
エージェント機能 | Managed Agents 対応 | 標準 | — |
Computer Use | 非対応 | — | 対応 |
注目点: SWE-bench Verified(実際のソフトウェアバグ修正)では Claude Opus 4.7 が 87.6% でリードしており、単一バグ修正タスクや深い推論が必要な場面では Claude が優勢です。一方、エージェントの並列実行・ツール統合・大量バッチ処理では Gemini 3.5 Flash の速度とコスト効率が際立ちます。
⚠️ 各社料金・ベンチマークスコアは変動します。最終確認は各社公式ページで行ってください。
使い方 — Google AI Studio と API でのアクセス方法
Google AI Studio での試用(無料・最短)
- Google AI Studio にアクセス(Google アカウント必要)
- モデル選択で「Gemini 3.5 Flash」を選択
- チャット・コード生成・マルチモーダル入力(画像・動画・PDF)を試用可能
- 無料枠でも思考レベル・Function Calling・Search Grounding を試せる
Gemini API(Google AI for Developers)での実装
# Python SDK を使う場合(最新 SDK 要確認)
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel(
model_name="gemini-3.5-flash",
generation_config={
"thinking_level": "medium" # minimal / low / medium / high
}
)
response = model.generate_content("エージェントワークフローの設計を手伝ってください")
print(response.text)⚠️ SDK の正確な API 仕様・パラメータ名は Google AI for Developers 公式ドキュメント で最新版を確認してください。
移行時の注意(旧バージョンからの場合)
gemini-3-flash-preview から移行する場合:
FunctionResponseにidとnameの追加が必須thinking_budget→thinking_levelに変更- デフォルト思考レベルが
high→mediumに変更(コスト・速度に影響あり)
開発者向けの CLI ツール活用については Gemini CLI 解説記事 も参考にしてください。
エンタープライズ採用事例
Google I/O 2026 でGoogleが公式発表した採用事例です。
企業 | 活用内容 |
|---|---|
Shopify | 並列サブエージェントで全世界マーチャント成長予測分析 |
Salesforce(Agentforce) | 複数コンテキスト保持サブエージェントで複雑なエンタープライズタスクを自動化 |
Macquarie Bank | 100ページ超の金融ドキュメントオンボーディング(パイロット) |
Ramp | 請求書 OCR の自動化 |
Xero | 複数週にわたる税務フォームワークフロー自動化 |
Databricks | エージェントワークフロー展開 |
これらの事例はいずれも「大量データ処理 × エージェント化 × 速度」が求められる業務に Gemini 3.5 Flash を活用しています。
セキュリティ・注意事項
Gemini 3.5 Flash には Frontier Safety Framework に基づく以下の安全対策が実装されています。
安全機能(公式確認):
- 強化されたサイバー安全措置: 悪意のあるコード生成などの危険コンテンツ生成リスクを低減
- CBRN安全措置強化: 化学・生物・放射線・核に関する高度な安全トレーニングと軽減策
- 解釈可能性ツール: 応答前にモデルの内部推論をチェック。なぜ拒否・再ルートしたかを説明
- 誤拒否の削減: 安全なクエリを誤って拒否しないよう調整
- センシティブトピックへの適切なエンゲージメント: 単純拒否ではなく適切な回答を設計
Managed Agents 利用時の注意:
- エージェントは隔離された Linux コンテナ内で実行されますが、コード実行を伴う場合は外部アクセスの範囲を事前に確認
- 「判断分岐点や権限問題」でユーザー入力を一時停止する動作設計ですが、プロダクション利用前に動作テストを推奨
- 無料枠では入出力データが製品改善に使用される点に注意(有料プランでは使用されない)
現時点での制限(公式確認済み):
- Computer Use: 未サポート(ロードマップ未発表)
- 音声特化タスク: Gemini の音声スタックは別処理系のため別モデルが適切
- SWE-bench Verified 正式スコア: 未発表
こんな人におすすめ / おすすめしない人

Gemini 3.5 Flash が向いているケース
用途 | 理由 |
|---|---|
エージェント・ワークフロー開発 | Managed Agents で簡単実装、GDPval Elo 1656 のエージェント性能 |
コーディング支援・CI/CD 統合 | Terminal-Bench 76.2%、Function Calling 対応 |
大量バッチ処理 | バッチモード 50%割引 + 4倍高速出力でスループット最大化 |
金融・業務ドキュメント処理 | Finance Agent v2 57.9%、100万トークンコンテキスト |
マルチモーダル解析(画像・動画・PDF) | CharXiv Reasoning 84.2%、幅広い入力形式 |
コスト最適化(Pro 代替) | Gemini 3.1 Pro より入力25%・出力25%安で同等以上の性能 |
Gemini 3.5 Flash が向いていないケース
用途 | 理由 / 代替 |
|---|---|
単一バグ修正・深いコーディング推論 | SWE-bench では Claude Opus 4.7(87.6%)が優位 |
長文コンテキストの深い理解 | MRCR v2 では Gemini 3.1 Pro が依然優位 |
知識集約型試験・深い推論 | Gemini 3.5 Pro(6月予定)待ちが望ましいケースあり |
Computer Use(GUI 操作自動化) | 現状未対応 → Claude Opus 4.7 等を検討 |
低コスト単発クエリ | Gemini 3.1 Flash-Lite($0.25/$1.50)の方が費用対効果が高い |
音声特化タスク | 専用音声スタックのモデルが適切 |
Google I/O 2026 での同時発表ラインナップ
Gemini 3.5 Flash は単独発表ではなく、Google I/O 2026 全体の大型アップデートの一部として発表されました。同日には他にも以下のモデル・機能が発表されています:
- Gemini Sparkとは(同日発表の軽量モデル)
- Gemini Omni Flashとは(マルチモーダル特化)
Gemini シリーズ全体の把握には Geminiとは(ハブ記事) を参照してください。
よくある質問(FAQ)
Q. Gemini 3.5 Flash は今すぐ使えますか?
A. 公式には 2026年5月19日から利用開始です。Geminiアプリ(AI Plus/Pro/Ultra プラン)、Google AI Studio(無料)、Vertex AI、Gemini API から利用できます。無料の Google AI Studio で試用するのが最速の方法です。YouTube Shorts・YouTube Create での無料提供は今後数週間以内とされています(2026-05-21時点)。
Q. 無料で使えますか?
A. Google AI Studio では無料枠で利用可能です。ただし無料枠では入出力データが製品改善に使用される点に注意してください。API 無料枠のレートリミット(RPM・TPM の具体値)は AI Studio で確認してください(公開ドキュメントに数値なし)。
Q. Gemini 3.2 Flash とはどう違いますか?
A. Gemini 3.2 Flash は正式リリースされませんでした。I/O 2026 の 2週間前に内部で観測されていたモデルですが、Googleが実際に発表したのは「3.5 Flash」です。性能は 3.2 Flash のリーク段階の予測を大幅に超えており、一方で価格も予測より高くなっています。詳細は Gemini 3.2 Flashとは(リーク段階の記録) を参照してください。
Q. Gemini 3.5 Pro との違いは何ですか?
A. Gemini 3.5 Pro は 2026年6月に展開予定(発表時点では社内利用段階)です。現時点では公式スペックの公開はありません。Sundar Pichai は「来月まで待ってほしい」と発言しており、Pro は Flash をオーケストレーターとして使う「Pro × Flash タンデム構成」での役割分担が想定されています。
Q. 旧バージョン(gemini-3-flash-preview)からの移行で注意すべき点は?
A. FunctionResponse に id と name の追加が必須になりました。また thinking_budget → thinking_level へのパラメータ名変更、デフォルト思考レベルの high → medium への変更に伴うコスト・速度の変化に注意してください。temperature、top_p、top_k パラメータは削除推奨です。
Q. Vertex AI ではいつから使えますか?
A. 「今後数週間以内」という公式の記述のみで、具体的な日程は未確認です(2026-05-21時点)。YouTube Shorts・YouTube Create への展開と合わせて近い時期に予定されています。
まとめ — Gemini 3.5 Flash の立ち位置
Gemini 3.5 Flash は、「Flash 速度でフロンティア性能」という従来では矛盾していた二つの要求を初めて両立させたモデルです。エージェント・コーディング・大量バッチ処理の用途では、現行最速クラスの性能とコスト効率を実現しています。
一方で、SWE-bench Verified(単一バグ修正)では Claude Opus 4.7 が上回っており、深い推論が必要な領域での選択は慎重に行う必要があります。料金も従来 Flash 比で3倍と高いため、「低コスト単発クエリ」への適用は Gemini 3.1 Flash-Lite の方が合理的です。
選択の判断軸:
- エージェント構築 / コーディング支援 / 大量バッチ処理 → Gemini 3.5 Flash が現時点の最適解
- 深い推論 / 長文コンテキスト → 6月予定の Gemini 3.5 Pro または Gemini 3.1 Pro を検討
- 単一バグ修正 / Computer Use → Claude Opus 4.7 を検討(Claude vs Gemini 比較参照)
- 低コスト運用 → Gemini 3.1 Flash-Lite または Gemini 3 Flash Preview
公式情報源:
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

Claude Code MCP連携ガイド|GitHub・Slack・Notion・freee統合の設定と実践ワークフロー【2026年最新】
2026/04/22

Gemini 4とは?Google I/O 2026発表「Gemini 3.5 Flash」を完全解説|性能・料金・比較
2026/05/20

Claude Code Hooks 使い方|PreToolUse/PostToolUse/Stop/SubagentStop 完全ガイド
2026/04/22

Gemini Sparkとは?Google I/O 2026発表の自律AIエージェント・料金・できること・日本での使い方を解説
2026/05/20

Cursorとは?機能・料金・Composer 2.5まで徹底解説【2026年5月最新】
2026/03/31

Anthropic、Stainless買収とは?SDK・MCPサーバー自動生成でClaude APIの開発者体験を強化——報道3億ドル超取引の全貌【2026年5月速報】
2026/05/19

