GPT-5.4とは?機能・料金・モデル比較・Claude/Geminiとの違いを整理

GPT-5.4は、OpenAIが2026年3月にリリースした最新のフラッグシップAIモデルです。推論・コーディング・PC操作(Computer Use)を1つのモデルに統合した「統合型フロンティアモデル」として、前モデルGPT-5.2から大幅に性能が向上しています。
この記事では、GPT-5.4の主な機能、5つのモデルバリアントの違い、ChatGPTプラン別の料金、API料金、セキュリティ上の注意点、Claude Opus 4.6やGemini 3.1 Proとの比較まで、導入判断に必要な情報を整理します。
この記事でわかること:
- GPT-5.4の主要な新機能と前モデルからの進化ポイント
- 5つのバリアント(Standard / Thinking / Pro / mini / nano)の使い分け
- ChatGPTプラン別・API別の料金体系
- Computer Useのセキュリティリスクと対策
- Claude Opus 4.6・Gemini 3.1 Proとの違い
- どんな人に向いているか・向いていないか
想定読者: ChatGPTの最新モデルの性能を知りたい方、API利用でモデル選定を検討しているエンジニア、GPT-5.4への乗り換えを検討している方
GPT-5.4の概要 ― OpenAI史上最も高性能な統合モデル
GPT-5.4(Generative Pre-trained Transformer 5.4)は、OpenAIが開発した大規模言語モデルです。2026年3月5日にGPT-5.4 ThinkingとGPT-5.4 Proが、同年3月17日にGPT-5.4 miniとGPT-5.4 nanoがリリースされました。
従来のOpenAIモデルでは、推論特化モデル(oシリーズ)とコーディング特化モデル(GPT-5.3-codex)が別々に提供されていましたが、GPT-5.4ではこれらの能力を1つのモデルに統合しています。公式では「推論・コーディング・エージェントワークフローの成果を統合した初のメインラインモデル」と位置づけられています。
項目 | 内容 |
|---|---|
正式名称 | GPT-5.4(Generative Pre-trained Transformer 5.4) |
開発元 | OpenAI |
リリース日 | 2026年3月5日(Thinking / Pro)、3月17日(mini / nano) |
提供形態 | ChatGPT(Web/アプリ)、OpenAI API、Codex |
最大コンテキスト | 最大100万トークン(API版) |
最大出力 | 128Kトークン |
前モデル | GPT-5.2、GPT-5.3-codex |
GPT-5.4でできること ― 主要な新機能
GPT-5.4の最大の特徴は、単なるテキスト生成の改善にとどまらず、PC操作やエージェント的な動作を含む幅広い能力を備えている点です。主要な新機能を整理します。
Computer Use(PC操作)
OpenAIとして初めて一般向けに搭載されたComputer Use機能です。スクリーンショットの認識とキーボード・マウス操作を組み合わせ、Webブラウザやデスクトップアプリケーション上の複雑なワークフローを自動実行できます。
OSWorld-Verifiedベンチマークでは75.0%を記録し、人間の72.4%を超える結果を出しています(GPT-5.2は47.3%)。
100万トークンのコンテキストウィンドウ
API版では最大100万トークンのコンテキストに対応しており、OpenAI史上最大です。長大なコードベースやドキュメントを丸ごと読み込ませた上で作業を指示するような、長期的なタスクの計画・実行に適しています。
推論能力の5段階制御
APIでは推論努力レベルを「なし / 低 / 中 / 高 / 最高」の5段階で指定できます。簡単な分類タスクには「なし」で高速・低コストに処理し、複雑な分析には「最高」で深い思考を行わせるなど、タスクに応じた調整が可能です。
プリアンブル(作業計画の事前提示)
回答の生成前にAIが作業計画を提示する機能です。ユーザーは実際の作業が始まる前に方針を確認し、必要に応じて修正を指示できます。
Mid-Response Steering(生成途中の方向修正)
AIが回答を生成している途中で、ユーザーが指示を修正・追加できる機能です。従来は回答が完成するまで待つ必要がありましたが、GPT-5.4ではリアルタイムに方向を変えられます。
コーディング能力の統合
GPT-5.3-codexのコーディング能力を統合しており、SWE-bench Proで57.7%を記録しています。専用のコーディングモデルに切り替えることなく、通常の会話からシームレスにコード生成・修正が行えます。
事実精度の向上
GPT-5.2と比較して事実誤りが33%削減、全体回答のエラー含有率が18%削減されたと公式が発表しています。
GPT-5.4の5つのバリアント ― どれを選ぶべきか

GPT-5.4には5つのバリアントがあり、用途・予算・必要な性能に応じて使い分ける設計になっています。ここでは各バリアントの特徴と、どんな場面で選ぶべきかを整理します。
バリアント | 提供先 | コンテキスト | 最大出力 | 主な用途 |
|---|---|---|---|---|
GPT-5.4(Standard) | API | 最大100万トークン | 128K | 汎用コーディング・知識作業・Computer Use |
GPT-5.4 Thinking | ChatGPT | 272K | — | 複雑な推論・数学・科学・多段階コーディング |
GPT-5.4 Pro | ChatGPT Pro / API | 272K | 128K | 法務・医療・金融の高難度分析 |
GPT-5.4 mini | ChatGPT Free / API | 400K | 128K | 高頻度・低複雑度タスク、サブエージェント |
GPT-5.4 nano | APIのみ | 400K | 128K | 分類・抽出・ランキング等の軽量タスク |
用途別の選び方
GPT-5.4(Standard) は、API経由で最も汎用的に使えるモデルです。100万トークンのコンテキストを活かした大規模なコードベース分析や、Computer Useを組み込んだエージェントワークフローに向いています。
GPT-5.4 Thinking は、ChatGPTから利用できる推論特化バリアントです。複雑な数学の問題、科学的な分析、多段階のコーディングタスクなど、深い思考が必要な場面で選びます。
GPT-5.4 Pro は、最も高い推論能力を持つバリアントです。ARC-AGI-2ベンチマークで83.3%(Standardは73.3%)を記録しており、法務文書の分析、医療データの解釈、金融モデリングなど、精度が最優先の業務に適しています。ただし、ChatGPT Proプラン(月額$200)またはAPIでの利用となり、コストは高めです。
GPT-5.4 mini は、コストパフォーマンスを重視する場面向けです。400Kトークンのコンテキストを持ちながらAPI料金はStandardの約3分の1。チャットボットのバックエンドや、大量のドキュメント処理、マルチエージェントシステムのサブエージェントなどに適しています。ChatGPTの無料プランでも利用可能です。
GPT-5.4 nano は、最も軽量・低コストなバリアントです。テキスト分類、情報抽出、ランキングなど、単純だが大量に処理するタスクに向いています。APIのみでの提供で、入力$0.20/1Mトークンと非常に安価です。
GPT-5.4の強み
GPT-5.4が競合モデルと比較して優位に立つポイントを整理します。
Computer Use性能が業界トップクラス。 OSWorld-Verifiedで75.0%と、人間の平均(72.4%)を上回る成績を記録しています。現時点では、PC操作の自動化においてGPT-5.4が最も実用的な選択肢の一つです。
統合モデルとしての万能性。 推論・コーディング・エージェント動作を1つのモデルで処理できるため、タスクごとにモデルを切り替える必要がありません。開発ワークフローがシンプルになります。
5バリアントによる柔軟なコスト設計。 nanoの$0.20/1Mトークン(入力)からProの$30.00/1Mトークン(入力)まで幅広い価格帯があり、タスクの重要度に応じてコストを最適化できます。
100万トークンのコンテキスト。 API版で最大100万トークンに対応しており、大規模なコードベースや長大な文書を丸ごと処理できます。
プロフェッショナル分野での高い実績。 米国GDP上位9業種・44職種で、人間の専門家と同等以上の出力を83%で達成したと報告されています。スプレッドシートモデリングでは68.4%→87.3%と大幅に向上しています。
GPT-5.4の弱み・制約
一方で、現時点で把握しておくべき弱みや制約もあります。
ChatGPT Plusでのメッセージ制限。 Plusプラン(月額$20)では3時間あたり80メッセージの上限があり、Computer Useもフル利用できません。ヘビーユーザーにはProプラン(月額$200)が必要です。
mini・nanoの料金が前世代比で高い。 The Decoderの指摘によると、GPT-5.4 miniとnanoはGPT-5同等バリアントと比較して約3〜4倍高額です。軽量モデルのコスト優位性は、前世代ほど明確ではありません。
プロンプト遵守の一貫性に課題。 ZDNETのレビューでは「ハルシネーション(事実誤認)は少ないが、プロンプトに正確に従わない場合がある」と指摘されています。厳密な出力フォーマットが求められるタスクでは注意が必要です。
音声・動画のネイティブ処理は非対応。 GPT-5.4が対応するのはテキストと画像の入力です。音声や動画をネイティブに処理したい場合は、Gemini 3.1 Proなど他モデルの方が適しています。
Long Contextの追加コスト。 100万トークンのコンテキストは魅力的ですが、272Kトークンを超過した分は入力料金が2倍になります。大規模データの処理では想定以上のコストがかかる可能性があります。
Long Context利用時のコスト目安
272Kトークン超過時の料金増加を具体的に示します。
利用シナリオ | 入力トークン数 | GPT-5.4 Standard料金(目安) |
|---|---|---|
通常の会話・要約 | 〜50K | 約$0.13 |
中規模コードベース分析 | 〜272K | 約$0.68 |
大規模コードベース(超過あり) | 500K | 約$1.82(超過分は$5.00/1Mtok) |
最大コンテキスト活用 | 1M | 約$4.32(超過分は$5.00/1Mtok) |
※ GPT-5.4 Standardの通常料金$2.50/1Mtok、272K超過分$5.00/1Mtokで試算
GPT-5.4の料金体系
GPT-5.4の料金は、ChatGPTプラン経由とAPI経由で大きく異なります。
ChatGPTプラン別アクセス
プラン | 月額 | 利用できるGPT-5.4 | 主な制限 |
|---|---|---|---|
Free | $0 | GPT-5.4 mini(Thinking経由) | メッセージ数制限あり、ファイルアップロード24時間3件 |
Plus | $20 | GPT-5.4 Thinking | 3時間あたり80メッセージ、Computer Useはフル利用不可 |
Pro | $200 | GPT-5.4 Pro(無制限) | 専用GPUスライス確保、フルComputer Use |
※ Team / Enterpriseプランの詳細は2026年4月時点で未公開
API料金(1Mトークンあたり)
モデル | 入力 | キャッシュ入力 | 出力 | バッチ入力 | バッチ出力 |
|---|---|---|---|---|---|
gpt-5.4(Standard) | $2.50 | $0.25 | $15.00 | $1.25 | $7.50 |
gpt-5.4-pro | $30.00 | — | $180.00 | $15.00 | $90.00 |
gpt-5.4-mini | $0.75 | $0.075 | $4.50 | $0.375 | $2.25 |
gpt-5.4-nano | $0.20 | $0.02 | $1.25 | $0.10 | $0.625 |
注意点:
- 272Kトークン超過時(Long Context)は入力料金が2倍
- 地域別処理エンドポイント利用時は10%上乗せ
- キャッシュ入力を活用すれば、同じプロンプトの繰り返しで大幅にコスト削減可能
公式料金ページ: OpenAI API Pricing
GPT-5.4の使い方
GPT-5.4を利用する方法は主に2つあります。
ChatGPT経由で使う場合
- ChatGPTにアクセスし、アカウントを作成またはログイン
- 無料プランではGPT-5.4 miniが自動で利用可能
- Plusプラン以上にアップグレードすると、モデル選択でGPT-5.4 Thinkingが選択可能
- Proプランでは GPT-5.4 Proが利用可能になり、Computer Useも制限なく使える
API経由で使う場合
- OpenAI Platformでアカウントを作成
- APIキーを発行
- モデル名として
gpt-5.4、gpt-5.4-pro、gpt-5.4-mini、gpt-5.4-nanoを指定 - 推論努力レベル(なし / 低 / 中 / 高 / 最高)をパラメータで調整可能
# API呼び出し例(Python)
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[{"role": "user", "content": "質問内容"}],
reasoning_effort="high" # 推論努力レベルの指定
)GPT-5.4のベンチマーク比較

GPT-5.4の性能を、前モデルや競合と比較します。
GPT-5.2との比較(世代間)
ベンチマーク | GPT-5.4 | GPT-5.2 | 変化 |
|---|---|---|---|
OSWorld-Verified(PC操作) | 75.0% | 47.3% | +27.7pt |
ARC-AGI-2(抽象推論) | 73.3% | 52.9% | +20.4pt |
事実精度(エラー率) | — | — | 33%削減 |
スプレッドシートモデリング | 87.3% | 68.4% | +18.9pt |
前モデルからの進化幅は大きく、特にComputer Use(PC操作)とARC-AGI-2(抽象推論)で顕著な改善が見られます。
競合モデルとの比較(2026年3月時点)
比較項目 | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
Computer Use(OSWorld) | 75.0% | — | — |
エージェント実行(Terminal-Bench 2.0) | 75.1% | — | — |
抽象推論(ARC-AGI-2) | 73.3% | — | 77.1% |
マルチモーダル対応 | テキスト・画像 | テキスト・画像 | テキスト・画像・音声・動画 |
API入力料金(1Mtok) | $2.50 | — | $2.00 |
最大コンテキスト | 100万トークン | 100万トークン | — |
ポイント:
- GPT-5.4はComputer Useとエージェント実行で高い性能を発揮。PC操作の自動化に強い
- Claude Opus 4.6はコーディング(SWE-bench Verified 80.8%)と安全性設計に強み。長文の精度や指示遵守でも評価が高い
- Gemini 3.1 Proは音声・動画を含むマルチモーダル対応と抽象推論で優位。API料金も最安水準
現時点では、3社のモデルがそれぞれ異なる強みを持っており、「どの用途で使うか」によって最適な選択が変わります。
Computer Useのセキュリティリスクと対策

GPT-5.4の目玉機能であるComputer Useには、利便性と引き換えに把握すべきセキュリティリスクがあります。
主なリスク
画面情報の外部送信。 Computer Useは画面のスクリーンショットを撮影してAIに送信する仕組みです。パスワード、個人情報、機密データが画面に表示されていた場合、それらがOpenAIサーバーに送信される可能性があります。
UIの誤認識とジェイルブレイク。 2026年3月時点で3件のジェイルブレイク事例が報告されています。確認ダイアログを「システムメンテナンスタスク」に偽装してバイパスするケースなどが確認されています。
高サイバー能力の分類。 OpenAIのPreparedness Frameworkでは、GPT-5.4は「High cyber capability」に分類されています。悪意あるプロンプトインジェクションによる物理的・経済的被害の可能性が指摘されています。
安全に利用するためのポイント
- Computer Use実行時は、機密情報を画面に表示しない運用ルールを設ける
- 業務利用の場合は、専用のサンドボックス環境で実行する
- AIが実行するアクション(特にファイル操作・送信系)には人間の確認ステップを挟む
- API利用時はデータ処理契約(DPA)の確認を行う
- 入力データのオプトアウト設定(API利用時に可能)を確認する
企業でComputer Useを導入する場合は、IT部門と連携した上で利用ポリシーの策定が必要です。
こんな方におすすめ
GPT-5.4は万能型モデルですが、特に以下のような方に適しています。
GPT-5.4が向いている方
- PC操作の自動化に取り組みたい方 — Computer Use性能が業界トップクラスで、ブラウザ操作やアプリ操作の自動化に最も実用的
- OpenAIエコシステムを既に利用している方 — ChatGPT Plus/Proからシームレスにアクセスでき、既存のAPI連携もそのまま活用可能
- コスト効率を重視するAPI利用者 — nanoからProまで5段階のバリアントがあり、タスクの重要度に応じたコスト最適化ができる
- 推論とコーディングの両方を1モデルで行いたい方 — 従来のように推論モデルとコーディングモデルを使い分ける必要がない
- 大規模データの一括処理が必要な方 — 100万トークンのコンテキストで、大量のドキュメントやコードベースを丸ごと処理できる
GPT-5.4をおすすめしない方
- 音声や動画を直接処理したい方 → Gemini 3.1 Proの方がマルチモーダル対応が広い
- コーディング精度を最優先する方 → Claude Opus 4.6がSWE-bench Verifiedで80.8%と高い実績
- 月額$20以下でフル機能を使いたい方 → PlusプランではComputer Useがフル利用不可。Proプラン($200)が必要
- 厳密なプロンプト遵守が求められる業務 → 現時点でプロンプト遵守の一貫性に課題が報告されている
- 軽量モデルのコストを極限まで下げたい方 → mini/nanoは前世代比で割高
よくある質問(FAQ)
Q1. GPT-5.4は無料で使えますか?
ChatGPTの無料プランでGPT-5.4 mini(Thinking経由)が利用できます。ただし、メッセージ数に制限があり、ファイルアップロードも24時間で3件までです。Standard・Thinking・Proバリアントを利用するにはPlusプラン($20/月)またはProプラン($200/月)が必要です。
Q2. GPT-5.4とGPT-5.2の最大の違いは何ですか?
最大の違いはComputer Use(PC操作)の搭載です。OSWorldベンチマークでGPT-5.2の47.3%からGPT-5.4の75.0%へと大幅に向上しています。加えて、推論・コーディング・エージェント能力を1つのモデルに統合した点も大きな変化です。
Q3. API利用でどのバリアントを選ぶべきですか?
タスクの複雑さとコストのバランスで選びます。分類や抽出など単純なタスクにはnano($0.20/1Mtok入力)、チャットボットや中程度の処理にはmini($0.75/1Mtok入力)、本格的な推論やコーディングにはStandard($2.50/1Mtok入力)、精度最優先の高難度分析にはPro($30.00/1Mtok入力)が適しています。
Q4. Computer Useは企業で安全に使えますか?
現時点ではリスクを把握した上での慎重な導入が必要です。画面情報がOpenAIサーバーに送信される仕組みのため、機密データの取り扱いに注意が必要です。サンドボックス環境での実行、人間の確認ステップの挟み込み、社内利用ポリシーの策定を推奨します。
Q5. 日本語での性能はどうですか?
公式ベンチマークに日本語固有のテストは含まれていません。GPT-5.2時点で日本語対応は実用レベルでしたが、GPT-5.4での日本語性能の詳細な検証データは2026年4月時点で限定的です。日本語での利用を検討する場合は、実際のタスクで試した上で判断することをおすすめします。
Q6. Claude Opus 4.6とどちらが優れていますか?
用途によって異なります。Computer Useやエージェント的なPC操作にはGPT-5.4が強く、コーディング精度や長文の指示遵守にはClaude Opus 4.6が高い評価を得ています。「どちらが一方的に優れている」というよりも、用途に応じた使い分けが現実的です。
関連記事:
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。




