Qwen3.7 Maxとは？Alibaba最新推論モデルの機能・料金・Qwen3.6との性能比較【2026年5月速報】

Qwen3.7 Maxは、Alibaba（アリババ）が2026年5月21日に発表した最上位の推論モデルです。コンテキストウィンドウが従来の4倍となる100万トークン（1M）に拡大され、35時間の継続自律実行・1,000回以上のツール呼び出しに対応するエージェント特化設計が特徴です。

本記事では、Qwen3.7 Maxの機能・料金・前世代モデルや主要競合との性能比較・セキュリティ上の注意点まで、導入判断に必要な情報を2026年5月22日時点の最新情報でまとめます。Qwen3.7 Maxを業務やエージェント開発に活用しようと検討している方、前世代との違いを確認したい方に向けた内容です。

出典: Qwen 公式サイト

Qwen3.7 Maxとは

Qwen3.7 Maxは、Alibaba の AI 研究部門「Qwen チーム」が開発したエージェント時代向けフラッグシップ言語モデルです。公式には「エージェントタスクと長時間の自律実行に最適化された最上位モデル」として位置づけられており、2026年5月20〜21日に中国・杭州で開催されたAlibabacloud Summit にて、50以上の新製品とともに正式発表されました。

Qwen シリーズにおける位置づけは以下の通りです。

モデル種別	特徴	オープンソース
Qwen3.7 Max（本記事）	最上位・エージェント特化	❌ クローズドウェイト
Qwen3.7 Plus	バランス型・ビジョン対応	一部公開予定
Qwen3.7 Flash	高速・低コスト向け	公開あり

現時点（2026年5月22日）ではプレビュー段階であり、正式名称は「Qwen3.7-Max-Preview」。DashScope API（Alibaba Cloud Model Studio）経由のロールアウト中で、chat.qwen.ai から無料プレビューが利用可能です。Hugging Face などでのオープンウェイト公開は未定です。

Qwen3.7 Maxでできること

1. 1Mトークンのコンテキストウィンドウ

現時点での最大の特徴は100万トークン（1M）のコンテキストウィンドウです。前世代 Qwen3.6 Max の256K から4倍に拡大されており、A4用紙換算で約1,500ページ分のテキストを一度の会話で処理できます。

長編コードベース全体を一括レビュー
数百ページの法務文書・技術仕様書を丸ごと読み込んで質問応答
長期プロジェクトのログや会話履歴を保持したままタスク継続

2. 拡張思考（Extended Thinking）

チェーン・オブ・ソート（CoT）推論に対応しており、最終回答の前に「考えるプロセス」を生成します。複雑な数学問題・科学的推論・多段階プログラミングタスクで特に効果を発揮します。BenchLM.ai のスコアでは「推論能力」が 96.4/100 と最高クラスの評価を得ています。

3. エージェント機能（Alibaba 公称値）

Alibaba が公式に主張するエージェント性能は以下の通りです。

エージェント機能	詳細
継続自律実行	最長 35時間の中断なし実行
ツール呼び出し	単一セッションで 1,000回以上対応
エラー修正	自律的なエラー検出・修正ループ
メモリ保持	マルチステップ長期タスクのコンテキスト維持

⚠️ 注意: 35時間・1,000回の数値はAlibaba社内テスト値です。2026年5月22日時点では独立した第三者による再現報告は確認されていません。

4. 対応エージェントフレームワーク

OpenClaw / Claude Code / Hermes Agent / Qwen Paw / Qoder / Kilo Code / Cline / OpenCode / Codex App など主要なAIエージェントフレームワークに対応しています。

AIエージェントの仕組みや主要フレームワークの詳細はこちら

5. API互換性

OpenAI 互換 API に対応
Anthropic 互換 API にも対応
DashScope SDK 経由でのアクセスも可能

既存の OpenAI / Anthropic ベースのコードベースからの移行コストが低い点は実務上のメリットです。

6. 多言語対応

100以上の言語をサポートしており、日本語も含まれます。ただし、日本語出力品質の定量評価は公式・第三者ともに未確認の状態です。日本語ユーザーの実測報告では「自然な日本語で返答する」とされていますが、日本語特化モデルとの比較評価はまだ行われていません。

Qwen3.7 Max の性能：ベンチマーク比較

Qwen3.7 Max vs Qwen3.6 Max

前世代からの主要スペック・スコアの変化をまとめます。

比較項目	Qwen3.6 Max	Qwen3.7 Max	変化
AA Intelligence Index	51.8	56.6	+4.8pt
CritPt（批判的推論）	3.7%	13.4%	+9.7pt
Humanity's Last Exam	28.9%	38.1%	+9.2pt
Terminal-Bench Hard	43.9%	50.8%	+6.9pt
GDPval-AA（Elo）	1,504	1,546	+42pt
コンテキストウィンドウ	256K tokens	1M tokens	×4倍
入力料金（参考）	$1.30/1M tok	$2.50/1M tok	約+92%

Qwen3.7 MaxのArtificial Analysis Intelligence Indexスコア比較

出典: Artificial Analysis - Qwen3.7 Max

主要モデルとの比較（Artificial Analysis Intelligence Index）

モデル	AA Index スコア	評価
GPT-5.5	60.2	最上位
Claude Opus 4.7	57.3	上位
Gemini 3.1 Pro Preview	57.2	上位
Qwen3.7 Max	56.6	上位（中国モデル最高）
Gemini 3.5 Flash	55.3	—
Qwen3.6 Max	51.8	—

現時点では GPT-5.5・Claude Opus 4.7・Gemini 3.1 Pro などの最上位モデルに次ぐ世界上位（中国モデルの中では最高スコア）を記録しています。リリース直後のため順位は変動中です（Artificial Analysis Intelligence Index、2026年5月22日時点）。

LM Arena テキストランキング（2026年5月14日時点・プレビュー出現時点）

カテゴリ	順位（Elo スコア）
テキスト総合	13位（Elo 1,475）
コーディング	10位（Elo 1,525）
数学	7位（Elo 1,499）
Expert Prompts	9位
Software & IT	9位

Claude Opus 4.7 との詳細比較はこちら

Qwen3.7 Maxの強み

強み1：コンテキスト長のコストパフォーマンス

1Mトークンのコンテキストウィンドウを持ちながら、入力料金は参考値で $2.50/1M トークン（OpenRouter 掲載値）です。同等以上の性能を持つ Claude Opus 4.7（入力 $15/1M トークン）と比較すると、入力コストは約1/6程度に抑えられる可能性があります。

強み2：エージェントタスクへの特化

単一セッションで最大1,000回のツール呼び出しに対応する設計は、自律型AIエージェントの実装において実践的なメリットをもたらします。OpenClaw や Cline などの主要フレームワークとの互換性が公式に確認されている点も、エージェント開発者には重要な判断材料です。

OpenClawとの連携について詳しく見る

強み3：OpenAI / Anthropic API 互換

既存のChatGPT APIやAnthropic APIを使ったアプリケーションから、コードベースを大幅に変更せずにQwen3.7 Maxへ切り替えられます。移行検証のコストが低い点は、コスト削減目的での代替検討時に有利です。

強み4：BenchLM.ai 総合2位（検証済みモデル中）

BenchLM.ai では検証済み25モデル中2位（総合92/100）を記録。特に「推論能力」96.4/100 および「指示遵守」93.6/100 が高く、複雑な指示に忠実に従う能力が高いモデルとして評価されています。

Qwen3.7 Maxの弱み・制約

制約事項	詳細
画像入力・生成非対応	テキストのみ。ビジョン機能はQwen3.7 Plusを使用
セルフホスト不可	クローズドウェイト（オープンウェイト版未公開）。オンプレミス運用は不可
プレビュー段階の不安定性	正式リリース前のため挙動変更・障害のリスクあり
レスポンス速度	無料プレビュー（chat.qwen.ai）では約3トークン/秒と遅い報告あり
使用上限	chat.qwen.aiの無料プレビューは使用量上限あり（非公表）
日本語特化評価なし	多言語対応とは記載があるが日本語品質の定量評価は未実施
第三者検証が少ない	発表直後のため、エージェント系ベンチマークの独立再現報告が限定的

料金・アクセス方法

現行の利用方法（2026年5月22日時点）

方法	料金	状況
chat.qwen.ai（Webブラウザ）	無料（使用量上限あり）	利用可能
DashScope API（公式）	未確認（「近日公開」）	ロールアウト中
OpenRouter 経由	下表参照	掲載済み

OpenRouter 掲載料金（参考値・2026年5月21日時点）

項目	料金
入力（Input）	$2.50 / 1M トークン
出力（Output）	$7.50 / 1M トークン
キャッシュ入力	$0.25 / 1M トークン
ブレンド率（7:2:1）	$1.43 / 1M トークン

⚠️ 注意事項:

上記はOpenRouter掲載の参考値です。公式DashScope での Qwen3.7-Max 確定料金は未確認です
プロバイダーによって料金が異なる場合があります
プレビュー段階のため料金体系が変更される可能性があります
1ドル≒155円換算の場合、入力は約387円/100万トークン、出力は約1,162円/100万トークンの目安

前世代（Qwen3.6 Max）との料金比較

項目	Qwen3.6 Max	Qwen3.7 Max	変化
入力	$1.30/1M	$2.50/1M	+92%
出力	$7.80/1M	$7.50/1M	-4%
キャッシュ入力	$0.13/1M	$0.25/1M	+92%

入力料金は約2倍に上昇していますが、性能向上（AA Index +4.8pt、コンテキスト×4）を考慮すると、コストパフォーマンスは向上しているとも言えます。

使い方：今すぐ試す方法

方法1：chat.qwen.ai（無料・ブラウザのみ）

chat.qwen.ai にアクセス
Alibaba アカウントまたはメールアドレスでログイン
モデル選択欄から「Qwen3.7-Max-Preview」を選択
日本語でプロンプトを入力して送信

注意: 無料プレビューは使用量上限があり、レスポンス速度は約3トークン/秒と遅い状態です。日本ユーザーからも「テスト用には使えるが、本格利用はAPI公開を待つべき」との実感が報告されています。

出典: Qwen Chat 公式サイト

方法2：OpenRouter 経由 API（開発者向け）

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3.7-max",
    "messages": [{"role": "user", "content": "こんにちは"}]
  }'

OpenAI 互換 API のため、既存の OpenAI SDK ベースのコードから model パラメータを変更するだけで利用可能です。

方法3：DashScope API（公式・ロールアウト中）

現時点では一般公開待ちです。Alibaba Cloud のアカウントがある場合は Model Studio でロールアウト状況を確認してください。

生成AIのAPI活用全般については生成AIとは？仕組みと活用方法の解説もあわせて参考にしてください。

セキュリティ・データ主権の注意点（日本企業向け）

Qwen3.7 Max を業務利用する際に見落とせないのがデータ主権のリスクです。

中国のデータ主権法の適用リスク

DashScope API 経由での利用はAlibaba のインフラを経由します。中国の「データセキュリティ法」「個人情報保護法」の規制対象となる可能性があり、以下の点を事前に確認する必要があります。

リスク領域	詳細
個人情報	プロンプトに顧客・従業員の個人情報を含めると中国法の対象になる可能性
機密情報	社内の営業秘密・技術情報の入力に慎重な判断が必要
GDPR	EU規制対象の個人データは中国経由処理に法的リスクがある
日本の個人情報保護法	クラウドAPI経由利用に社内審査が必要な場合あり

クローズドウェイトの問題

Qwen3.7 Max はオープンウェイトが未公開のクローズドモデルです。モデル内部の監査が不可能なため、セルフホスト（オンプレミス）でのデータ主権確保が現時点では不可能です。

安全に使うための判断基準

個人利用・非機密タスク: chat.qwen.ai での無料プレビューは問題なし
社内テスト・PoC: OpenRouter経由のAPI利用で機能検証は可能。ただし機密情報は入力しない
本番業務利用（機密あり）: 公式DashScope のデータ処理規約を確認後、法務・情報セキュリティ部門の審査を経て判断
セルフホスト必須の用途: Qwen3.7 Maxは不適。オープンウェイト版が公開されるQwen3.7 Plus / Flash系を待つか、別モデルを検討

Qwen3.7 Max vs Qwen3.7 Plus：どちらを選ぶか

Qwen3.7 シリーズには Max 以外に Plus バリアントも存在します。

比較項目	Qwen3.7 Max	Qwen3.7 Plus Preview
最上位モデル	✅	—
ビジョン（画像入力）	❌	✅
コンテキスト	1M tokens	未確認
入力料金（参考）	$2.50/1M	未確認
オープンウェイト	❌	公開予定（未確認）
主な用途	テキスト推論・エージェント	マルチモーダル・視覚タスク

選択の目安:

テキストのみ・長文処理・エージェント開発 → Max
画像・スクリーンショット処理・マルチモーダル → Plus
ローカル実行・オンプレミス必須 → Qwen3.7シリーズ以外（Qwen3.6 Plus OSSなど）

こんな用途・人におすすめ

Qwen3.7 Maxが適している用途

用途	理由
長文コードのリファクタリング・デバッグ	1Mコンテキストで大規模コードベースを一括処理できる
複数ステップのエージェント自動化	1,000回ツール呼び出し対応のアーキテクチャが強み
科学的推論・数学的計算	推論能力スコア96.4/100、数学でArena7位
多言語ビジネス文書の処理	100以上の言語対応
GPT-5.5 / Claude Opus のコスト削減代替検討	同等性能で大幅コスト削減の可能性
AI API開発（OpenAI互換系）	既存コードから低コストで移行可能

こんな人におすすめ

AIエージェント・AI自動化の開発者: 長時間・大規模ツール呼び出しに対応したモデルを試したい人
大規模コードベースを扱うエンジニア: 1Mトークンで全体を把握しながらリファクタリングしたい人
コスト最適化を検討している企業: GPT-5.5 や Claude Opus の代替として性能・コスト比較したい人
最新モデルをいち早く試したいリサーチャー: chat.qwen.ai で無料プレビューから試したい人

よくある質問（FAQ）

Q. Qwen3.7 MaxはChatGPTや Claude と比べてどうですか？

A. Artificial Analysis Intelligence Index では GPT-5.5（60.2）・Claude Opus 4.7（57.3）に続く世界上位（56.6）に位置しています。性能的には最上位クラスに迫っており、コスト面では GPT-5.5 / Claude Opus の入力料金（$3〜15/1M トークン）に対して $2.50/1M と競争力があります。ただしビジョン機能・安定性・日本語特化評価においては OpenAI / Anthropic に劣る面もあります。

Q. 日本語で使えますか？

A. 100以上の言語に対応しており、chat.qwen.ai から日本語で利用可能です。ただし、日本語出力品質の定量評価は公式・第三者ともに未公表です。日本語ユーザーによる実測では「自然な日本語で返答する」との報告がある一方、レスポンス速度の遅さ（約3トークン/秒）が課題として挙げられています。

Q. 料金はどのくらいかかりますか？

A. 2026年5月22日時点では、公式 DashScope での確定料金は未発表です。OpenRouter 掲載の参考値では入力 $2.50/1M トークン・出力 $7.50/1M トークンです。chat.qwen.ai での無料プレビューが利用可能ですが、使用量上限があります。

Q. オープンソースではないですか？

A. Qwen3.7 Max はクローズドウェイト（閉源）モデルです。Qwen シリーズには開源モデルも存在しますが、最上位の Max グレードは公開されていません。セルフホストが必要な場合は Qwen3.6 Plus などのオープンウェイト版を検討してください。

Q. 今すぐ業務に導入すべきですか？

A. 現時点ではプレビュー段階のため、本番業務への即時導入は推奨しません。機能検証・技術調査目的で試すなら chat.qwen.ai の無料プレビューや OpenRouter 経由での API テストが現実的です。正式リリース・DashScope での料金確定・安定性の確認を待った上での本番採用が無難です。

まとめ

Qwen3.7 Max は、Alibaba が2026年5月に発表した世界最高水準の推論モデルのひとつです。

ポイント	内容
性能	AA Intelligence Index 世界上位（56.6点）、前世代比 +4.8pt
コンテキスト	1M tokens（前世代の4倍）
エージェント	最長35時間・1,000回ツール呼び出し（Alibaba公称値）
料金	$2.50/$7.50（入力/出力、1Mトークン・OpenRouter参考値）
注意点	プレビュー段階・クローズドウェイト・中国系インフラ経由