Qwen3.7 Maxとは?Alibaba最新推論モデルの機能・料金・Qwen3.6との性能比較【2026年5月速報】

この記事のポイント
Alibaba が2026年5月に発表したQwen3.7 Maxは、1Mトークンのコンテキストと35時間連続エージェント実行に対応する最上位推論モデルです。機能・料金・Qwen3.6 Maxとのベンチマーク比較・セキュリティ注意点まで網羅的に解説します。
Qwen3.7 Maxは、Alibaba(アリババ)が2026年5月21日に発表した最上位の推論モデルです。コンテキストウィンドウが従来の4倍となる100万トークン(1M)に拡大され、35時間の継続自律実行・1,000回以上のツール呼び出しに対応するエージェント特化設計が特徴です。
本記事では、Qwen3.7 Maxの機能・料金・前世代モデルや主要競合との性能比較・セキュリティ上の注意点まで、導入判断に必要な情報を2026年5月22日時点の最新情報でまとめます。Qwen3.7 Maxを業務やエージェント開発に活用しようと検討している方、前世代との違いを確認したい方に向けた内容です。

出典: Qwen 公式サイト
Qwen3.7 Maxとは
Qwen3.7 Maxは、Alibaba の AI 研究部門「Qwen チーム」が開発したエージェント時代向けフラッグシップ言語モデルです。公式には「エージェントタスクと長時間の自律実行に最適化された最上位モデル」として位置づけられており、2026年5月20〜21日に中国・杭州で開催されたAlibabacloud Summit にて、50以上の新製品とともに正式発表されました。
Qwen シリーズにおける位置づけは以下の通りです。
モデル種別 | 特徴 | オープンソース |
|---|---|---|
Qwen3.7 Max(本記事) | 最上位・エージェント特化 | ❌ クローズドウェイト |
Qwen3.7 Plus | バランス型・ビジョン対応 | 一部公開予定 |
Qwen3.7 Flash | 高速・低コスト向け | 公開あり |
現時点(2026年5月22日)ではプレビュー段階であり、正式名称は「Qwen3.7-Max-Preview」。DashScope API(Alibaba Cloud Model Studio)経由のロールアウト中で、chat.qwen.ai から無料プレビューが利用可能です。Hugging Face などでのオープンウェイト公開は未定です。
Qwen3.7 Maxでできること
1. 1Mトークンのコンテキストウィンドウ
現時点での最大の特徴は100万トークン(1M)のコンテキストウィンドウです。前世代 Qwen3.6 Max の256K から4倍に拡大されており、A4用紙換算で約1,500ページ分のテキストを一度の会話で処理できます。
- 長編コードベース全体を一括レビュー
- 数百ページの法務文書・技術仕様書を丸ごと読み込んで質問応答
- 長期プロジェクトのログや会話履歴を保持したままタスク継続
2. 拡張思考(Extended Thinking)
チェーン・オブ・ソート(CoT)推論に対応しており、最終回答の前に「考えるプロセス」を生成します。複雑な数学問題・科学的推論・多段階プログラミングタスクで特に効果を発揮します。BenchLM.ai のスコアでは「推論能力」が 96.4/100 と最高クラスの評価を得ています。
3. エージェント機能(Alibaba 公称値)
Alibaba が公式に主張するエージェント性能は以下の通りです。
エージェント機能 | 詳細 |
|---|---|
継続自律実行 | 最長 35時間の中断なし実行 |
ツール呼び出し | 単一セッションで 1,000回以上対応 |
エラー修正 | 自律的なエラー検出・修正ループ |
メモリ保持 | マルチステップ長期タスクのコンテキスト維持 |
⚠️ 注意: 35時間・1,000回の数値はAlibaba社内テスト値です。2026年5月22日時点では独立した第三者による再現報告は確認されていません。
4. 対応エージェントフレームワーク
OpenClaw / Claude Code / Hermes Agent / Qwen Paw / Qoder / Kilo Code / Cline / OpenCode / Codex App など主要なAIエージェントフレームワークに対応しています。
5. API互換性
- OpenAI 互換 API に対応
- Anthropic 互換 API にも対応
- DashScope SDK 経由でのアクセスも可能
既存の OpenAI / Anthropic ベースのコードベースからの移行コストが低い点は実務上のメリットです。
6. 多言語対応
100以上の言語をサポートしており、日本語も含まれます。ただし、日本語出力品質の定量評価は公式・第三者ともに未確認の状態です。日本語ユーザーの実測報告では「自然な日本語で返答する」とされていますが、日本語特化モデルとの比較評価はまだ行われていません。
Qwen3.7 Max の性能:ベンチマーク比較
Qwen3.7 Max vs Qwen3.6 Max
前世代からの主要スペック・スコアの変化をまとめます。
比較項目 | Qwen3.6 Max | Qwen3.7 Max | 変化 |
|---|---|---|---|
AA Intelligence Index | 51.8 | 56.6 | +4.8pt |
CritPt(批判的推論) | 3.7% | 13.4% | +9.7pt |
Humanity's Last Exam | 28.9% | 38.1% | +9.2pt |
Terminal-Bench Hard | 43.9% | 50.8% | +6.9pt |
GDPval-AA(Elo) | 1,504 | 1,546 | +42pt |
コンテキストウィンドウ | 256K tokens | 1M tokens | ×4倍 |
入力料金(参考) | $1.30/1M tok | $2.50/1M tok | 約+92% |

出典: Artificial Analysis - Qwen3.7 Max
主要モデルとの比較(Artificial Analysis Intelligence Index)
モデル | AA Index スコア | 評価 |
|---|---|---|
GPT-5.5 | 60.2 | 最上位 |
Claude Opus 4.7 | 57.3 | 上位 |
Gemini 3.1 Pro Preview | 57.2 | 上位 |
Qwen3.7 Max | 56.6 | 上位(中国モデル最高) |
Gemini 3.5 Flash | 55.3 | — |
Qwen3.6 Max | 51.8 | — |
現時点では GPT-5.5・Claude Opus 4.7・Gemini 3.1 Pro などの最上位モデルに次ぐ世界上位(中国モデルの中では最高スコア)を記録しています。リリース直後のため順位は変動中です(Artificial Analysis Intelligence Index、2026年5月22日時点)。
LM Arena テキストランキング(2026年5月14日時点・プレビュー出現時点)
カテゴリ | 順位(Elo スコア) |
|---|---|
テキスト総合 | 13位(Elo 1,475) |
コーディング | 10位(Elo 1,525) |
数学 | 7位(Elo 1,499) |
Expert Prompts | 9位 |
Software & IT | 9位 |
Qwen3.7 Maxの強み
強み1:コンテキスト長のコストパフォーマンス
1Mトークンのコンテキストウィンドウを持ちながら、入力料金は参考値で $2.50/1M トークン(OpenRouter 掲載値)です。同等以上の性能を持つ Claude Opus 4.7(入力 $15/1M トークン)と比較すると、入力コストは約1/6程度に抑えられる可能性があります。
強み2:エージェントタスクへの特化
単一セッションで最大1,000回のツール呼び出しに対応する設計は、自律型AIエージェントの実装において実践的なメリットをもたらします。OpenClaw や Cline などの主要フレームワークとの互換性が公式に確認されている点も、エージェント開発者には重要な判断材料です。
強み3:OpenAI / Anthropic API 互換
既存のChatGPT APIやAnthropic APIを使ったアプリケーションから、コードベースを大幅に変更せずにQwen3.7 Maxへ切り替えられます。移行検証のコストが低い点は、コスト削減目的での代替検討時に有利です。
強み4:BenchLM.ai 総合2位(検証済みモデル中)
BenchLM.ai では検証済み25モデル中2位(総合92/100)を記録。特に「推論能力」96.4/100 および「指示遵守」93.6/100 が高く、複雑な指示に忠実に従う能力が高いモデルとして評価されています。
Qwen3.7 Maxの弱み・制約
制約事項 | 詳細 |
|---|---|
画像入力・生成 非対応 | テキストのみ。ビジョン機能はQwen3.7 Plusを使用 |
セルフホスト不可 | クローズドウェイト(オープンウェイト版未公開)。オンプレミス運用は不可 |
プレビュー段階の不安定性 | 正式リリース前のため挙動変更・障害のリスクあり |
レスポンス速度 | 無料プレビュー(chat.qwen.ai)では約3トークン/秒と遅い報告あり |
使用上限 | chat.qwen.aiの無料プレビューは使用量上限あり(非公表) |
日本語特化評価なし | 多言語対応とは記載があるが日本語品質の定量評価は未実施 |
第三者検証が少ない | 発表直後のため、エージェント系ベンチマークの独立再現報告が限定的 |
料金・アクセス方法
現行の利用方法(2026年5月22日時点)
方法 | 料金 | 状況 |
|---|---|---|
chat.qwen.ai(Webブラウザ) | 無料(使用量上限あり) | 利用可能 |
DashScope API(公式) | 未確認(「近日公開」) | ロールアウト中 |
OpenRouter 経由 | 下表参照 | 掲載済み |
OpenRouter 掲載料金(参考値・2026年5月21日時点)
項目 | 料金 |
|---|---|
入力(Input) | $2.50 / 1M トークン |
出力(Output) | $7.50 / 1M トークン |
キャッシュ入力 | $0.25 / 1M トークン |
ブレンド率(7:2:1) | $1.43 / 1M トークン |
⚠️ 注意事項:
- 上記はOpenRouter掲載の参考値です。公式DashScope での Qwen3.7-Max 確定料金は未確認です
- プロバイダーによって料金が異なる場合があります
- プレビュー段階のため料金体系が変更される可能性があります
- 1ドル≒155円換算の場合、入力は約387円/100万トークン、出力は約1,162円/100万トークンの目安
前世代(Qwen3.6 Max)との料金比較
項目 | Qwen3.6 Max | Qwen3.7 Max | 変化 |
|---|---|---|---|
入力 | $1.30/1M | $2.50/1M | +92% |
出力 | $7.80/1M | $7.50/1M | -4% |
キャッシュ入力 | $0.13/1M | $0.25/1M | +92% |
入力料金は約2倍に上昇していますが、性能向上(AA Index +4.8pt、コンテキスト×4)を考慮すると、コストパフォーマンスは向上しているとも言えます。
使い方:今すぐ試す方法
方法1:chat.qwen.ai(無料・ブラウザのみ)
- chat.qwen.ai にアクセス
- Alibaba アカウントまたはメールアドレスでログイン
- モデル選択欄から「Qwen3.7-Max-Preview」を選択
- 日本語でプロンプトを入力して送信
注意: 無料プレビューは使用量上限があり、レスポンス速度は約3トークン/秒と遅い状態です。日本ユーザーからも「テスト用には使えるが、本格利用はAPI公開を待つべき」との実感が報告されています。

出典: Qwen Chat 公式サイト
方法2:OpenRouter 経由 API(開発者向け)
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3.7-max",
"messages": [{"role": "user", "content": "こんにちは"}]
}'OpenAI 互換 API のため、既存の OpenAI SDK ベースのコードから model パラメータを変更するだけで利用可能です。
方法3:DashScope API(公式・ロールアウト中)
現時点では一般公開待ちです。Alibaba Cloud のアカウントがある場合は Model Studio でロールアウト状況を確認してください。
生成AIのAPI活用全般については 生成AIとは?仕組みと活用方法の解説 もあわせて参考にしてください。
セキュリティ・データ主権の注意点(日本企業向け)

Qwen3.7 Max を業務利用する際に見落とせないのがデータ主権のリスクです。
中国のデータ主権法の適用リスク
DashScope API 経由での利用はAlibaba のインフラを経由します。中国の「データセキュリティ法」「個人情報保護法」の規制対象となる可能性があり、以下の点を事前に確認する必要があります。
リスク領域 | 詳細 |
|---|---|
個人情報 | プロンプトに顧客・従業員の個人情報を含めると中国法の対象になる可能性 |
機密情報 | 社内の営業秘密・技術情報の入力に慎重な判断が必要 |
GDPR | EU規制対象の個人データは中国経由処理に法的リスクがある |
日本の個人情報保護法 | クラウドAPI経由利用に社内審査が必要な場合あり |
クローズドウェイトの問題
Qwen3.7 Max はオープンウェイトが未公開のクローズドモデルです。モデル内部の監査が不可能なため、セルフホスト(オンプレミス)でのデータ主権確保が現時点では不可能です。
安全に使うための判断基準
- 個人利用・非機密タスク: chat.qwen.ai での無料プレビューは問題なし
- 社内テスト・PoC: OpenRouter経由のAPI利用で機能検証は可能。ただし機密情報は入力しない
- 本番業務利用(機密あり): 公式DashScope のデータ処理規約を確認後、法務・情報セキュリティ部門の審査を経て判断
- セルフホスト必須の用途: Qwen3.7 Maxは不適。オープンウェイト版が公開されるQwen3.7 Plus / Flash系を待つか、別モデルを検討
Qwen3.7 Max vs Qwen3.7 Plus:どちらを選ぶか
Qwen3.7 シリーズには Max 以外に Plus バリアントも存在します。
比較項目 | Qwen3.7 Max | Qwen3.7 Plus Preview |
|---|---|---|
最上位モデル | ✅ | — |
ビジョン(画像入力) | ❌ | ✅ |
コンテキスト | 1M tokens | 未確認 |
入力料金(参考) | $2.50/1M | 未確認 |
オープンウェイト | ❌ | 公開予定(未確認) |
主な用途 | テキスト推論・エージェント | マルチモーダル・視覚タスク |
選択の目安:
- テキストのみ・長文処理・エージェント開発 → Max
- 画像・スクリーンショット処理・マルチモーダル → Plus
- ローカル実行・オンプレミス必須 → Qwen3.7シリーズ以外(Qwen3.6 Plus OSSなど)

こんな用途・人におすすめ
Qwen3.7 Maxが適している用途
用途 | 理由 |
|---|---|
長文コードのリファクタリング・デバッグ | 1Mコンテキストで大規模コードベースを一括処理できる |
複数ステップのエージェント自動化 | 1,000回ツール呼び出し対応のアーキテクチャが強み |
科学的推論・数学的計算 | 推論能力スコア96.4/100、数学でArena7位 |
多言語ビジネス文書の処理 | 100以上の言語対応 |
GPT-5.5 / Claude Opus のコスト削減代替検討 | 同等性能で大幅コスト削減の可能性 |
AI API開発(OpenAI互換系) | 既存コードから低コストで移行可能 |
こんな人におすすめ
- AIエージェント・AI自動化の開発者: 長時間・大規模ツール呼び出しに対応したモデルを試したい人
- 大規模コードベースを扱うエンジニア: 1Mトークンで全体を把握しながらリファクタリングしたい人
- コスト最適化を検討している企業: GPT-5.5 や Claude Opus の代替として性能・コスト比較したい人
- 最新モデルをいち早く試したいリサーチャー: chat.qwen.ai で無料プレビューから試したい人
おすすめしない人
- 画像・スクリーンショットの処理が必要な人: テキストのみ対応。Qwen3.7 Plus または Claude / GPT-5.5 を検討
- オンプレミス・セルフホストが必須の企業: クローズドウェイトのため不可。Qwen3.6 Plus(OSS版)を検討
- 中国系インフラへのデータ送信が社内ポリシーで禁止されている企業: DashScope / OpenRouter 経由では中国経由処理が発生
- 本番環境に即投入したい人: プレビュー段階のため安定性が保証されていない。正式リリースを待つのが望ましい
- リアルタイム高速レスポンスが必要な用途: 現時点の無料プレビューでは約3トークン/秒と遅い報告あり
生成AIツール おすすめ比較 も参考にしてください。
よくある質問(FAQ)
Q. Qwen3.7 MaxはChatGPTや Claude と比べてどうですか?
A. Artificial Analysis Intelligence Index では GPT-5.5(60.2)・Claude Opus 4.7(57.3)に続く世界上位(56.6)に位置しています。性能的には最上位クラスに迫っており、コスト面では GPT-5.5 / Claude Opus の入力料金($3〜15/1M トークン)に対して $2.50/1M と競争力があります。ただしビジョン機能・安定性・日本語特化評価においては OpenAI / Anthropic に劣る面もあります。
Q. 日本語で使えますか?
A. 100以上の言語に対応しており、chat.qwen.ai から日本語で利用可能です。ただし、日本語出力品質の定量評価は公式・第三者ともに未公表です。日本語ユーザーによる実測では「自然な日本語で返答する」との報告がある一方、レスポンス速度の遅さ(約3トークン/秒)が課題として挙げられています。
Q. 料金はどのくらいかかりますか?
A. 2026年5月22日時点では、公式 DashScope での確定料金は未発表です。OpenRouter 掲載の参考値では入力 $2.50/1M トークン・出力 $7.50/1M トークンです。chat.qwen.ai での無料プレビューが利用可能ですが、使用量上限があります。
Q. オープンソースではないですか?
A. Qwen3.7 Max はクローズドウェイト(閉源)モデルです。Qwen シリーズには開源モデルも存在しますが、最上位の Max グレードは公開されていません。セルフホストが必要な場合は Qwen3.6 Plus などのオープンウェイト版を検討してください。
Q. 今すぐ業務に導入すべきですか?
A. 現時点ではプレビュー段階のため、本番業務への即時導入は推奨しません。機能検証・技術調査目的で試すなら chat.qwen.ai の無料プレビューや OpenRouter 経由での API テストが現実的です。正式リリース・DashScope での料金確定・安定性の確認を待った上での本番採用が無難です。
まとめ
Qwen3.7 Max は、Alibaba が2026年5月に発表した世界最高水準の推論モデルのひとつです。
ポイント | 内容 |
|---|---|
性能 | AA Intelligence Index 世界上位(56.6点)、前世代比 +4.8pt |
コンテキスト | 1M tokens(前世代の4倍) |
エージェント | 最長35時間・1,000回ツール呼び出し(Alibaba公称値) |
料金 | $2.50/$7.50(入力/出力、1Mトークン・OpenRouter参考値) |
注意点 | プレビュー段階・クローズドウェイト・中国系インフラ経由 |
性能・コンテキスト長・エージェント機能の観点では世界トップクラスですが、プレビュー段階の不安定性・セルフホスト不可・データ主権リスクは業務利用前に必ず確認すべき点です。
まずは chat.qwen.ai の無料プレビューで機能を確認し、正式リリースとDashScope 公式料金の発表を待ってから本番導入を検討する、というアプローチが現実的です。
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

アンドレイ・カルパシー Anthropic入社とは|経歴・役割・業界への影響を徹底解説【2026年5月速報】
2026/05/21

Claude Code コスト最適化完全ガイド|プロンプトキャッシュ・Max vs API・トークン節約術
2026/04/22

Gemini Omni Flashとは?機能・料金・使い方・他ツールとの違いを解説【2026年5月速報】
2026/05/21

Claude Code Skills 活用ガイド|SKILL.md・npx skills・Agent Skills徹底解説【2026年最新】
2026/04/22

Gemini 3.5 Flashとは?Google I/O 2026発表・性能・料金・Managed Agents・3.2 Flashとの違いを徹底解説【2026年5月】
2026/05/20

Claude Code MCP連携ガイド|GitHub・Slack・Notion・freee統合の設定と実践ワークフロー【2026年最新】
2026/04/22

