Gemini Omni Flashとは?機能・料金・使い方・他ツールとの違いを解説【2026年5月速報】

この記事のポイント
Gemini Omni FlashはGoogleがGoogle I/O 2026(2026年5月19日)で発表したAI動画生成モデルです。会話型編集・日本円での料金プラン・使い方・他ツールとの違い・制約を公式情報をもとに整理しました。
Gemini Omni Flashは、Googleが2026年5月19日のGoogle I/O 2026で発表した、テキスト・画像・音声・動画を組み合わせた入力から高品質な動画を生成し、自然言語の会話を通じて段階的に編集できるマルチモーダルAIモデルです。
この記事では、Gemini Omni Flashの機能・料金(日本円)・使い方・他の動画生成AIとの違い・現時点の制約を公式情報をもとに整理します。「Gemini Omniは何ができるのか」「Veo 3.1とどう違うのか」「無料で使えるのか」「APIはいつ使えるのか」といった疑問を解消したい方に向けた内容です。
Gemini Omni Flashとは——一文で理解する
Gemini Omni Flashは、テキスト・画像・音声・動画を任意に組み合わせた入力から高品質な動画を生成し、そのまま自然言語の会話で繰り返し編集できるGoogleの最新AIモデルです。 Google DeepMindが開発し、Google I/O 2026(2026年5月19日)で発表されました。

「Nano Bananaの動画版」という公式の位置づけ
Googleは公式に、Gemini Omni Flashを「Nano Bananaの動画版」と位置づけています。Nano Bananaは2025年9月に米国App Storeで1位を獲得した画像生成・編集AIモデルで、「会話しながら画像を仕上げていく」操作感が特徴でした。Gemini Omni Flashはその設計哲学をそのまま動画に拡張したモデルです。
Veo 3.1との関係
これまでGoogleの動画生成AIの主力だったVeo 3.1は、GeminiアプリではGemini Omni Flashに置き換わる形で展開されています。ただし、Veo 3.1はGemini API・Vertex AI向けのAPIドキュメントが現在も整備されており、開発者向けには引き続き有効な選択肢です。一方、Gemini Omni FlashのAPIは2026年5月時点で未提供(「今後数週間以内に提供予定」と公式発表済み)のため、すぐに開発に組み込みたい場合はVeo 3.1が現実的です。
モダリティ統合という技術的な特徴
従来のGoogleの生成AIは、Veo(動画)・Imagen(画像)・Lyria(音楽)・Nano Banana(画像編集)とモダリティごとに別モデルが担っていました。Gemini Omni Flashはこれらを単一アーキテクチャに統合し、全モダリティ間で共有コンテキストを持ちながら推論する「any-to-any」モデルとして設計されています。
Gemini Omni Flashでできること(主要機能)

1. テキストから動画を生成(Text-to-Video)
テキストプロンプトのみで動画を生成できます。物理法則・科学的知識・歴史・文化的文脈を踏まえたリアルな映像の生成に対応しています。現時点では最大10秒のクリップを生成できます。これはFlashティア・ローンチ時の展開上の制約であり、モデル自体の技術的な上限ではないとの報告があります(ただし、長尺化の具体的なスケジュールは未発表)。
2. 画像から動画を生成(Image-to-Video)
参考画像を最大5枚まで入力として動画を生成できます。スケッチ・写真・参考動画を「設計図」として使用でき、既存の静止画をアニメーション化する用途にも対応しています。
3. 会話型マルチターン編集(最大の差別化ポイント)
Gemini Omni Flashの核心的な機能が会話型のマルチターン編集です。一度生成した動画を自然言語で指示しながら繰り返し修正できます。
たとえば、「夕暮れの海岸を走る人物」を生成した後、
- 「背景を夕暮れから深夜に変えて」
- 「カメラアングルをドローン視点に」
- 「照明をネオンライト風に調整して」
といった指示を重ねるだけで、前の指示の文脈(キャラクターの一貫性・物理的整合性)を保ったまま映像を調整できます。競合の多くが「生成し直す」ワークフローであるのに対し、Gemini Omni FlashはAPI設計の段階から会話型編集を前提にしている点が根本的に異なります。
編集で変更できる要素の例:
- 背景・シーンの雰囲気
- キャラクターの衣装・スタイル転送
- カメラアングル・焦点距離
- 照明・色調
- アニメーション調・写実調などのスタイル
4. 動画から動画を編集(Video-to-Video)
既存動画を入力として、見た目・動作・エフェクトを自然言語で変更できます。動作再構成・スタイル転送・手ぶれ補正・人物や要素の入れ替えなどに対応しています。
5. ネイティブ音声生成
音声付き動画の生成に対応しており、映像と音声の整合性を保ったコンテンツを一度に出力できます。ただし、既存動画の音声・発話を変更する機能は現在保留中です。
6. マルチリファレンス入力(any-to-any)
テキスト・画像・スケッチ・動画・音声を任意に組み合わせて入力できます。複数素材を参照しながら一貫性のある動画を生成する点が、前世代モデルとの大きな違いです。
7. AIアバター機能
ユーザー本人の顔と声を記録してデジタルアバターを作成し、毎回の画像アップロードなしに自分が登場する動画を生成できます。オンボーディング時に顔の録画と数字を声で読む認証フローがあります。
アバターの利用制限(重要):
- EEA(欧州経済領域)・スイス・英国では利用不可
- 現在は英語のみ対応(日本語での展開時期は未発表)
- 18歳以上のみ利用可能
できないこと・現時点の制約
音声・発話の変更機能は意図的に保留中
Gemini Omni Flashは音声付き動画の生成はできますが、既存動画の音声・発話を変更・編集する機能は現在提供されていません。
公式モデルカードには次のように明記されています:
"we are restricting this capability and working to better understand how to safely and responsibly bring it to our users"
背景には、同意なしの音声編集によるディープフェイク・なりすまし動画への悪用リスクへの懸念があります。Googleは責任ある展開のためのテスト・検証を継続中と述べており、提供開始時期は未発表です。この点は、他の動画生成AIが音声編集を提供している状況と比較して見えてくる制約です。
クリップの最大長が10秒
現時点では1回の生成で最大10秒のクリップが生成できます。長尺の制作を想定している場合は、Google Flowで複数クリップを組み合わせるワークフローが現実的な対応です。
複雑なモーション・テキストの課題
公式モデルカードには以下の課題が明記されています:
- 複雑なモーションを含むシーンでの完全な一貫性維持は困難
- テキストの完全に正確なレンダリングは未達(「複雑な動き・一貫性・テキストレンダリングは課題が残る」と明記)
APIは2026年5月時点で未提供
開発者・企業向けのAPIは2026年5月21日時点で未提供です。具体的な提供日・料金体系も未発表です。
その他の制限一覧
制限項目 | 内容 |
|---|---|
年齢 | 18歳以上のみ(動画生成・アバター機能) |
地域(アバター) | EEA・スイス・英国では利用不可 |
言語(アバター) | 現在は英語のみ |
クリップ長 | 最大10秒(ローンチ時の展開上の制約) |
API | 2026年5月時点で未提供 |
商用利用 | Google利用規約に準拠(詳細要確認) |
Vertex AI対応 | 2026年5月時点で未確認 |
料金・プラン(2026年5月時点・日本円)
Gemini Omni Flashの利用できる範囲は、どのプラットフォームから使うかによって異なります。
個人向けプラン一覧
プラン | 月額(税込) | Gemini Omni利用範囲 | 主な特典 |
|---|---|---|---|
無料 | 0円 | YouTube Shorts・YouTube Create Appのみ | — |
Google AI Plus | 約1,200円 | Geminiアプリ・Google Flowでフル機能 | Daily Brief(米国) |
Google AI Pro(5TB) | 2,900円 | フル機能(利用量多め) | YouTube Premium Lite |
Google AI Pro(10TB) | 7,280円 | フル機能(利用量多め) | YouTube Premium Lite |
Google AI Ultra 5x | 14,500円 | フル機能(AI Proの5倍利用上限) | YouTube Premium・20TBストレージ |
Google AI Ultra 20x | 32,000円 | フル機能(最大量・AI Proの20倍) | Project Genie・YouTube Premium |
※Google AI Ultra 5x(14,500円)はGoogle I/O 2026で新設されたティア。Google AI Ultra 20x(32,000円)は旧Ultraからの値下げ改定。

出典: Google One 公式サイト
無料でどこまで使えるか
無料プランでは、YouTube Shorts・YouTube Create App経由でGemini Omni Flashの基本機能を利用できます。2026年5月19日から順次展開中ですが、無料利用できる機能の具体的な上限(生成本数・クリップ長など)は公式に詳細が記載されていないため、実際に試して確認することを推奨します。
GeminiアプリおよびGoogle Flowでの利用にはGoogle AI Plus(約1,200円/月)以上のサブスクリプションが必要です。
開発者向けAPI料金
2026年5月21日時点では未発表です。 参考として、Gemini 3.5 FlashのAPI料金は入力$1.50/100万トークン・出力$9.00/100万トークン程度ですが、動画生成モデルは異なる体系になる可能性が高く、現時点での比較は困難です。APIリリース後に本記事を更新します。
Google AIサブスクリプション2026年5月改定の背景
Google I/O 2026ではGoogleのAIサブスクリプション全体が見直されました。Gemini Omni FlashはAI Plus以上に含まれる主要機能として位置づけられており、サブスク加入を検討する際の判断材料になります。Google I/O 2026全体の発表内容はGoogle I/O 2026 全発表まとめで確認できます。
使い方——3つの利用経路
経路1: Geminiアプリ(Google AI Plus以上が必要)
- gemini.google.com にアクセスしてGoogleアカウントでログイン
- Google AI Plusまたはそれ以上のプランに加入していることを確認
- 動画生成モードを選択し、テキストプロンプトまたは参考画像をアップロード
- 生成された動画に追加の指示を入力して会話型編集を繰り返す
会話型編集の特性上、最初の生成で完璧を目指すより、「おおまかに生成して会話で詰める」アプローチが効果的です。
経路2: Google Flow(Google AI Plus以上が必要)
Google Flowはプロレベルの映像制作向け統合環境です。複数シーンの管理・Gemini Omniとの深い統合・複雑なワークフローのサポートが特徴で、短いクリップを組み合わせて長尺のコンテンツを制作するワークフローに向いています。利用にはGoogle AI Plus以上のサブスクリプションが必要です。
経路3: YouTube Shorts / YouTube Create App(無料)
無料で試したい場合は、YouTube ShortsまたはYouTube Create App(iOS/Android)を使用します。
- YouTube Shortsの作成画面からAI動画生成機能にアクセス
- YouTube Create Appでも同様の機能が利用可能
- 2026年5月19日から順次展開中(全ユーザーへの展開は時間差がある場合あり)

他の動画生成AIとの比較

主要動画生成AIの比較表(2026年5月時点)
モデル | 開発元 | 会話型編集 | ネイティブ音声 | 無料利用 | API提供 | 主な強み |
|---|---|---|---|---|---|---|
Gemini Omni Flash | ◯(核心機能) | ◯(変更は保留) | YouTube経由 | ✕(近日予定) | 会話型編集の統合設計 | |
Veo 3.1 | ✕ | ◯ | ✕ | ◯ | APIが整備済み・開発者向け | |
Seedance 2.0 | ByteDance | △ | ◯ | — | — | Eloスコア首位・生成精度 |
Kling 3.0 | 快手 | △ | ◯(口パク強) | — | — | 口パク・音声同期の精度 |
Runway Gen-4.5 | Runway | △ | △ | ✕ | ◯ | 画像→動画・カメラコントロール |
Sora 2 | OpenAI | △ | — | ✕ | ✕(2026年9月終了予定) | Webアプリは2026年4月終了済み |
Veo 3.1との使い分け——同じGoogleのモデルでどう選ぶか
比較軸 | Gemini Omni Flash | Veo 3.1 |
|---|---|---|
会話型編集 | ◯(核心機能) | ✕ |
API | ✕(近日提供予定) | ◯(整備済み) |
Vertex AI | 未確認 | ◯ |
対象ユーザー | 個人・クリエイター | 開発者・エンタープライズ |
Geminiアプリ | ◯ | ✕ |
Google Flow | ◯ | ✕ |
現時点での判断基準: 動画生成をアプリや業務ワークフローに組み込みたい場合はVeo 3.1が現実的。個人・クリエイター向けの映像制作や試行錯誤が多い用途にはGemini Omni Flash。Gemini OmniのAPIが提供開始された後(「今後数週間以内」)に改めて比較を推奨します。
競合との最大の差別化——会話型編集の設計哲学
Seedance 2.0やRunway Gen-4.5は生成精度・物理シミュレーションで優れていますが、編集のワークフローは基本的に「生成し直す」設計です。Gemini Omni FlashはAPI設計の段階から会話型編集を前提としており、「生成→会話で直す→また会話で直す」という反復作業がシームレスに行える点が根本的に異なります。
一方で、Artificial Analysis Video Arenaのリーダーボード(2026年5月)では、ByteDanceのSeedance 2.0がテキスト→動画(Elo 1,269)・画像→動画(Elo 1,351)で首位です。純粋な生成品質のベンチマークではGemini Omni Flashのポジションはまだ評価待ちの状況であり、「会話型編集の使いやすさ」を重視するか「生成精度のスコア」を重視するかで選択が変わります。
同じGoogle I/O 2026で発表されたGemini 3.5 Flash・Gemini 4など他のGeminiモデルとの役割分担については、Googleの発表全体を整理したGoogle I/O 2026 全発表まとめが参考になります。
セキュリティ・安全性の仕組み
Gemini Omni Flashで生成したすべての動画には、2つの識別技術が標準で自動適用されます。
SynthID——削除できない電子透かし
SynthIDは、動画の全フレームにピクセルレベルで埋め込まれるデジタル透かしです。クロップ・フィルタ・再エンコードといった一般的な加工処理に耐性を持ち、Geminiアプリ・Chrome・Google検索から生成元の検証が可能です。ユーザーが削除することはできません。
これは二面的な意味を持ちます:
- 権利証明の側面:自分の生成物であることを証明できる
- 追跡可能性:悪意ある利用がされた場合にも生成元が特定されやすい
機密性の高い動画素材を扱う企業は、SynthIDが外せないことをセキュリティポリシーと照合した上で利用判断を行う必要があります。
C2PA——コンテンツクレデンシャルによる二重防護
SynthIDと並行して、C2PA(Coalition for Content Provenance and Authenticity) の署名済み暗号マニフェストがファイルに付与されます。ファイルメタデータが削除されてもピクセルレベルの信号は残存するため、コンテンツの来歴を記録し改ざんを検出する二重防護になっています。
AI Content Detection API(企業向け)
GoogleはAgent Platform上でAI Content Detection APIを同時期に開始しています。Google製および他社主要モデルで生成されたコンテンツを企業が識別・管理するためのAPIで、Gemini Omni Flashを業務利用する企業はこのAPIを活用したコンテンツ管理体制の構築も検討できます。
アバター機能のディープフェイク対策
アバター機能は本人による能動的な登録(セルフオンボーディング)で「なりすまし」を抑制する設計です。また、音声変更機能の保留も同じディープフェイク悪用リスクへの対応措置です。

出典: Google DeepMind SynthID 公式サイト
開発者・企業向けAPIの現状(2026年5月時点)
APIは「今後数週間以内」に提供予定
2026年5月21日時点で、Gemini Omni FlashのAPIは未提供です。Googleは「今後数週間以内に開発者・エンタープライズ向けAPIを提供予定」と公式発表していますが、具体的な提供日・料金体系は未発表です。
今すぐ開発に使いたい場合
現時点で動画生成をアプリやサービスに組み込みたい開発者は、Veo 3.1のGemini APIが現実的な選択肢です。Veo 3.1にはGemini API・Vertex AIのドキュメントが整備されています。Gemini OmniのAPIがリリースされた段階で、機能・料金・品質の面で改めて比較することを推奨します。
Vertex AI・Google Workspace対応
Google Workspace・Vertex AIでの提供は2026年5月時点で未確認です。エンタープライズ展開の可否については、API提供開始後の続報を待つことになります。
こんな人におすすめ / おすすめしない人
Gemini Omni Flashが向いている人
- 動画コンテンツを日常的に作るクリエイター。会話型編集で試行錯誤のコストを大幅に下げられる
- YouTube Shortsで短動画を投稿している個人。無料プランでも基本機能を試せる
- Googleエコシステムを普段使いしている人(Googleドライブ・Gmail・YouTubeユーザー)。既存ツールとの連携がスムーズ
- 映像制作の専門知識がない人。テキスト指示だけで修正を重ねられる設計のため、高い技術スキルなしに使い始めやすい
- Google AI Plusをすでに契約している人。追加費用なしでGeminiアプリからフル機能を利用できる
- 動画生成AIを初めて試す人。YouTube Shorts経由で無料かつリスクなく始められる
Gemini Omni Flashが向いていない人
- アプリやサービスに動画生成を今すぐ組み込みたい開発者。2026年5月時点でAPIが未提供のため、Veo 3.1が現実的
- 10秒以上の長尺動画を単発で生成したい人。現時点の制限では対応していない
- 既存動画の音声・発話を編集・変更したい人。音声変更機能は安全性検証中で使えない
- 純粋な生成品質を最重視する人。ベンチマークではSeedance 2.0が首位であり、Omniの品質評価は現時点では未確定
- EEA・スイス・英国在住でアバター機能を使いたい人。地域制限で利用不可
- 日本語でアバター機能を使いたい人。現時点では英語のみ対応
- 機密性の高い動画素材を扱う企業。SynthIDの透かしは削除できないため、自社のセキュリティポリシーとの整合性を確認する必要がある
Gemini Omni Flashに関するFAQ
Q: Gemini Omni FlashとVeo 3.1はどちらを選べばいいですか?
A: 個人・クリエイター向けには会話型編集が使えるGemini Omni Flash、APIを使って開発に組み込みたい場合は現時点ではVeo 3.1が選択肢です。Gemini OmniのAPIが提供開始された後(「今後数週間以内」)に改めて比較することをお勧めします。
Q: 無料で使えますか?
A: YouTube ShortsまたはYouTube Create Appを経由した場合、基本機能を無料で利用できます。GeminiアプリおよびGoogle Flowでの利用にはGoogle AI Plus(約1,200円/月)以上のサブスクリプションが必要です。
Q: 音声付きの動画を作れますか?
A: 音声付き動画の新規生成には対応しています。ただし、既存動画の音声・発話を変更する機能は「安全性の検証中」として2026年5月時点では保留されています。
Q: 生成した動画を商用利用できますか?
A: Googleの利用規約に準拠する形で商用利用が可能とされていますが、詳細条件は公式のGoogle利用規約を確認してください。なお、すべての生成動画にSynthIDの透かしが自動付与され、削除できない点も留意が必要です。
Q: AIアバター機能を日本語で使えますか?
A: 現時点では英語のみ対応しています。日本語でのアバター機能の展開時期は公式から未発表です。
Q: 10秒以上の動画を生成できますか?
A: 現時点では最大10秒です。これはFlashティア・ローンチ時の展開上の制約とされており、モデル自体の技術的な上限ではないと報告されていますが、長尺化の具体的なスケジュールは未発表です。
Q: SynthIDの透かしは外せますか?
A: ユーザーが削除することはできません。すべてのGemini Omni Flash生成動画に自動で埋め込まれ、クロップ・フィルタ・再エンコードなどの一般的な加工に対しても耐性を持っています。
Q: Google I/O 2026で発表された他のGeminiモデルとの違いは?
A: Gemini Omni Flashは動画生成・編集に特化したモデルです。テキスト・コーディング・推論向けにはGemini 4・Gemini Spark・Gemini 3.5 Flashなど別モデルが担います。Google I/O 2026の全発表を俯瞰したい場合はGoogle I/O 2026 全発表まとめを参照してください。
まとめ
Gemini Omni Flashは、Googleが2026年5月19日のGoogle I/O 2026で発表した最新のAI動画生成モデルです。最大の特徴は「生成と会話型編集の統合」——一度生成した動画を自然言語で逐次修正できる設計で、「生成し直す」ワークフローが主流の他の動画生成AIとの根本的な差別化ポイントとなっています。
2026年5月時点の状況を整理すると:
- 個人向けにはYouTube Shorts経由で無料で試せる(基本機能)
- GeminiアプリとGoogle Flowのフル機能はGoogle AI Plus(約1,200円/月)以上が必要
- 音声変更機能は安全性検証中で保留(ディープフェイク対策のため)
- APIは近日提供予定だが2026年5月21日時点では未提供(開発者はVeo 3.1が現実的)
- すべての生成動画にSynthID+C2PAが自動適用(削除不可)
APIリリースや長尺化などの更新が今後数週間で見込まれるため、本記事は随時更新します。Google I/O 2026での他のGeminiモデルの発表についても、Google I/O 2026 全発表まとめおよびGemini Sparkとは・Deep Research Maxとはで詳しく確認できます。
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

Kiroとは?AWSの仕様駆動AIコーディングIDEの機能・料金・使い方を解説
2026/04/11

Gemma 4 12Bとは?Google製ノートPC対応マルチモーダルAI・16GB VRAM動作・性能比較・使い方を解説【2026年6月】
2026/06/17

Runway Gen-4とは?プロ向けAI動画生成の機能・料金・活用法を徹底解説【2026年6月版】
2026/04/17

MetaのAIチャットボット悪用でInstagramアカウント大量乗っ取り|仕組み・被害規模・Meta対応・AIセキュリティリスク完全解説【2026年6月速報】
2026/06/17

GPT-5.5-Cyberとは?OpenAI Trusted Access for Cyberの仕組み・脆弱性検知・GPT-5.5との違いを徹底解説【2026年6月更新】
2026/05/08

ChatGPT Lockdown Modeとは?プロンプトインジェクション対策・データ流出防止・対象プラン・使い方・制限事項を完全解説【2026年6月速報】
2026/06/16

