AIツール2026年5月更新

Tencent Hy3 Preview(Hunyuan 3.0)とは?元OpenAI Yao Shunyu主導・295B MoE・256Kコンテキストを徹底解説

公開日: 2026/05/02
Tencent Hy3 Preview(Hunyuan 3.0)とは?元OpenAI Yao Shunyu主導・295B MoE・256Kコンテキストを徹底解説

この記事のポイント

Tencent Hy3 Preview(旧Hunyuan)は、元OpenAI研究者Yao Shunyu主導でゼロから再構築した295B MoE・21Bアクティブパラメータのオープンソース推論AIです。料金・ベンチマーク・競合比較・セキュリティ注意点まで、日本語で初めて体系的に解説します。

Hy3 previewは、テンセント(Tencent)が2026年4月23日に公開したオープンソースの推論特化型AIモデルで、元OpenAI研究者のYao Shunyu(姚顺雨)が主導してわずか90日でゼロから再構築した、295B総パラメータ・21Bアクティブパラメータ・256Kトークンコンテキストを持つMixture-of-Expertsアーキテクチャのモデルです。

本記事では、Hy3 previewの基本仕様・できること・料金・他モデルとの比較・セキュリティ注意点まで、導入判断に必要な情報を整理します。対象読者は「中国発のオープンソースLLMに興味があるエンジニア・研究者・企業のAI担当者」です。

Tencent Hy3 Preview Hugging Face公式モデルページ

出典: Hugging Face – tencent/Hy3-preview


Hy3 Previewとは?――テンセントが90日で再構築したオープンソース推論AI

Hy3 previewは、テンセントの社内チーム「Hy Team(旧Hunyuan Team)」が開発したオープンウェイトの大規模言語モデルです。公式にはこのモデルが「Hunyuan 3.0」「混元3.0」とも呼ばれることがありますが、英語の正式名称は「Hy3 preview」です。なお "preview" という名称が示すとおり、現時点は正式版ではなく改善中のプレビュー版です(正式版のリリース時期は未発表)。

基本情報まとめ

項目

内容

正式名称

Hy3 preview(旧称:Hunyuan 3.0)

開発元

Tencent Hy Team(騰訊)

公開日

2026年4月23日

アーキテクチャ

Mixture-of-Experts(MoE)

総パラメータ数

295B

アクティブパラメータ数

21B(推論時)

コンテキスト長

256K トークン(262,144 tokens)

ライセンス

Tencent Hy Community License(商用可)

オープンソース

✅(Hugging Face / ModelScope / GitCode)

API提供

✅(Tencent Cloud TokenHub / OpenRouter)

なぜ「90日再構築」が話題なのか

2025年12月、OpenAIでReAct・Tree of Thoughts・SWE-benchを生み出した研究者・Yao Shunyuがテンセントに「CEO直属チーフAIサイエンティスト」として入社し、既存のHunyuanインフラをゼロから再構築するプロジェクトを始動。トレーニング開始からわずか約90日後の2026年4月23日にHy3 previewとして一般公開されました。この開発スピードは、中国系LLMの急速な進化を象徴する出来事として世界的に注目を集めています。


Hy3 Previewでできること

Hy3 previewは特に以下の6領域で強みを発揮します。

1. STEM推論・数学

数学・科学系の高度な推論に特化した設計が施されており、清華大学・丘成桐数学院が実施した数学博士資格試験(2026年春)で国内最高スコアを記録。MATH(76.28)・GSM8K(95.37)とも高水準です。

2. コーディング・ソフトウェアエンジニアリング

コーディングエージェント評価の業界標準であるSWE-bench Verifiedで74.4%を達成(DeepSeek-V3を超え、オープンソースモデルの最上位クラス)。実際のGitHubイシューを自律的に解決する能力を持ちます。

3. エージェント・Web操作

最大495ステップにわたる複雑なエージェントワークフローに対応。BrowseComp(67.1%)・WideSearch(70.2%)で高評価。ツール呼び出し(Function Calling)もサポートしており、自律的なWeb検索や情報収集タスクに活用できます。

4. 長文コンテキスト理解

256K(約26万)トークンのコンテキストウィンドウにより、100ページ超の技術文書や長大なコードベースを一括で処理可能。CL-bench・CL-bench-Lifeで優秀な評価を獲得しています。

5. 多言語対応(特に英語・中国語)

MMMLU(多言語)で80.15、C-Eval(中国語)89.80、CMMLU 89.61を達成。英語・中国語での性能は最上位クラスです。日本語単体の評価データは現時点(2026年5月)では公開されていません。

6. 速い推論モード切り替え

reasoning_effort パラメータ1つで「高速直接回答」から「深いChain-of-Thought推論」まで制御できます。

モード

用途

no_think(デフォルト)

定型的な質問・高速回答が必要な場面

low

バランス型(中程度の複雑さのタスク)

high

数学・コーディング・複雑な推論タスク


アーキテクチャ詳細:295B MoE・21Bアクティブ・256Kコンテキストの仕組み

MoE(Mixture-of-Experts)とは

MoEは「複数の専門家(エキスパート)モデルを用意し、入力内容に応じて最適なエキスパートだけを活性化させる」アーキテクチャです。全パラメータを常に使わないため、同規模のdenseモデルと比べて推論コストを大幅に削減できます。

Hy3 previewの場合、295Bの総パラメータを持ちながら、推論時は21B(約7%)しかアクティブにしない設計です。これは「GPT-4クラスの性能を、GPT-3.5クラスの計算コストで実現する」ことに近いアプローチです。

技術的仕様

仕様

総パラメータ

295B

アクティブパラメータ

21B(推論時)

MTPレイヤーパラメータ

3.8B

Transformer層数

80層 + 1 MTPレイヤー

アテンションヘッド数

64(GQA、8 KVヘッド)

エキスパート数

192(top-8 アクティブ)

コンテキスト長

256K トークン

語彙サイズ

120,832

サポート精度

BF16

Hy3独自の技術革新:差別化エキスパートサイズ設計とP-Penalty Loss

通常のMoEでは全エキスパートのサイズが同一ですが、Hy3 previewは難易度が異なるトークンを容量の異なるエキスパートにルーティングする「差別化エキスパートサイズ設計」を採用。これにより同じ計算予算で従来MoEを大幅に上回る精度を実現しています。

また、P-Penalty Lossという独自の損失関数を導入し、大規模エキスパートへの過依存を抑制。多数の小規模エキスパートを活性化させることで計算効率を維持しながら性能を向上させています。この「ルーティング精度の高さ」こそが、21Bアクティブパラメータで37〜40Bクラスの競合モデルに匹敵する性能を達成できる核心的な技術的優位点です。

Hy3 Preview STEM推論ベンチマーク比較

出典: Hugging Face – tencent/Hy3-preview(公式ベンチマーク)


ベンチマーク:SWE-bench 74.4%・BrowseComp 67.1%の実力

⚠️ 注意: 以下のベンチマーク数値はすべてTencent公式の自社発表値(self-reported)です。独立第三者機関による検証は限定的です(Artificial Analysisの独立評価ではIntelligence Index 42点 / 83モデル中16位)。比較対象のClaude Opus 4.6は2026年4月16日にOpus 4.7へ更新済み、GPT-5.4は同年4月23日にGPT-5.5へ更新済みです。最新モデルとの比較スコアは各社公式サイトでご確認ください。

主要ベンチマーク比較表

ベンチマーク

Hy3 Preview

DeepSeek-V3

Claude Opus 4.6 ※1

GPT-5.4 ※2

SWE-bench Verified(コーディング)

74.4%

<74.4%

80.8%

78.6%

BrowseComp(Web閲覧エージェント)

67.1%

77.2%

WideSearch(広域検索)

70.2%

Terminal-Bench 2.0

54.4%

GPQA Diamond(科学推論)

87.2

MATH

76.28

C-Eval(中国語)

89.80

MMMLU(多言語)

80.15

※1 Claude Opus 4.6は2026年4月16日にOpus 4.7へ更新済み(公式発表当時の比較値)
※2 GPT-5.4は2026年4月23日にGPT-5.5へ更新済み(公式発表当時の比較値)

ポジション整理:

  • オープンソースモデルの中ではコーディング(SWE-bench)で最上位クラス
  • 閉鎖モデル(Claude Opus 4.6・GPT-5.4)にはSWE-bench・BrowseCompでやや劣る
  • Artificial Analysisの独立評価では83モデル中16位(インテリジェンス指数42点)
Hy3 Preview エージェントベンチマーク比較

出典: Hugging Face – tencent/Hy3-preview(公式ベンチマーク)


料金・利用形態:無料試用から商用APIまで

Hy3 previewは複数の形態で利用でき、用途に応じて選択できます。

料金比較表

利用形態

入力料金

出力料金

備考

OpenRouter 無料枠hy3-preview:free

$0

$0

ローンチ時2週間の無料期間(現状要確認)

OpenRouter 有料hy3-preview

$0.18 / 100万トークン

$0.59 / 100万トークン

確認時点の価格

Tencent Cloud TokenHub(通常)

RMB 1.2(≒$0.17)/ 100万トークン

RMB 4.0(≒$0.55)/ 100万トークン

Tencent Cloud(キャッシュ済み入力)

RMB 0.4(≒$0.06)/ 100万トークン

キャッシュヒット時

セルフホスト

0(モデルウェイト無料)

0

GPUインフラ費用が別途必要

⚠️ 料金は2026年4月23日公式発表時点のものです。変更の可能性があるため、必ず公式Tencent CloudページおよびOpenRouterで最新料金を確認してください。

Tencent公式は「OpenAI GPT-4クラスのAPI料金の約1/10」と主張しています。 Artificial Analysisの評価でも、コスト効率は83モデル中1位(無料枠利用時)と評価されています。

セルフホスト要件

  • 推奨GPU構成: H20-3e×8(またはそれ以上の大容量GPU構成)
  • 対応推論フレームワーク: vLLM・SGLang
  • 精度: BF16

使い方:OpenRouterで今すぐ試す手順

最もかんたんな試用方法はOpenRouter経由でのAPI利用です。

Step 1: OpenRouterアカウントの作成

  1. openrouter.ai にアクセス
  2. アカウント登録(メールアドレスまたはGoogleアカウント)
  3. APIキーを発行

Step 2: モデルを選択

  • 無料枠: tencent/hy3-preview:free
  • 有料: tencent/hy3-preview

Step 3: APIリクエストの送信

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="<OpenRouter APIキー>",
)

response = client.chat.completions.create(
    model="tencent/hy3-preview:free",
    messages=[
        {
            "role": "user",
            "content": "SWE-benchとはどのようなベンチマークですか?"
        }
    ],
    extra_body={
        "reasoning_effort": "high"  # no_think / low / high
    }
)
print(response.choices[0].message.content)

思考モードの使い分け

reasoning_effort

向いている用途

no_think

チャット、定型FAQ、高速レスポンスが必要な場合

low

一般的なコード生成、文章要約、中程度の分析

high

数学的証明、複雑なデバッグ、長い推論チェーンが必要な場合


他モデルとの比較:DeepSeek-V3・Claude Opus 4.6・GPT-5.4

オープンソースモデル内での位置づけ(vs DeepSeek-V3)

比較項目

Hy3 Preview

DeepSeek-V3

アクティブパラメータ

21B

37B

コンテキスト長

256K

128K

SWE-bench Verified

74.4%(超える)

<74.4%

オープンソース

API料金(OpenRouter)

$0.18 / $0.59

$0.14 / $0.28

日本語性能

未評価

良好

DeepSeek-V3はコスト面でやや優位ですが、Hy3 previewはSWE-benchとコンテキスト長で上回ります。

フロンティア閉鎖モデルとの比較

⚠️ 以下の比較はTencent公式発表(2026年4月23日)時点のデータです。Claude Opus 4.6はOpus 4.7(2026年4月16日公開)へ、GPT-5.4はGPT-5.5(2026年4月23日公開)へ更新されています。

比較項目

Hy3 Preview

Claude Opus 4.6

GPT-5.4

オープンソース

SWE-bench Verified

74.4%

80.8%

78.6%

BrowseComp

67.1%

77.2%

API料金

$0.18 / $0.59

高価

高価

セルフホスト可否

コンテキスト長

256K

200K

128K

まとめ: コーディング・エージェント性能では Claude Opus 4.6・GPT-5.4 にやや届かないものの、オープンソースで自社ホスト可能・コスト1/10以下という点が最大の差別化要因です。

Hy3 Preview コンテキスト学習・指示追従ベンチマーク比較

出典: Hugging Face – tencent/Hy3-preview(公式ベンチマーク)


Yao Shunyu(姚顺雨)とは?AIエージェント基礎理論の生みの親

Yao Shunyuは2026年時点28歳の中国人AI研究者で、清華大学「姚班(姚期智計算機科学実験班)」卒業後、プリンストン大学でPhDを取得。国際情報オリンピック(NOI)銀メダル、アジア太平洋情報オリンピック(APIO)金メダルの実績を持ちます。

主要研究業績(OpenAI・Princeton在籍時)

研究

発表

意義

ReAct

ICLR 2023 Oral

LLMが「推論」と「行動」を統合して外部環境とやり取りするフレームワーク。現在のAIエージェントの基礎理論

Tree of Thoughts

NeurIPS 2023 Oral

複雑タスクをステップごとに分解・評価・探索する推論フレームワーク

SWE-bench

ICLR 2024 Oral

コーディングエージェント評価の業界標準ベンチマーク(自ら設計した指標で自モデルを評価)

SWE-agent

NeurIPS 2024

ソフトウェアエンジニアリングタスク向けエージェント・コンピュータインターフェース

Deep Research

OpenAI製品

インターネットを自律的に探索する調査エージェント

重要な点: Yao Shunyuは「SWE-benchの設計者」でもあり、Hy3 previewはそのベンチマークで74.4%を達成しています。設計者が自ら作ったモデルで高スコアを出すことには公平性の観点から注意が必要ですが、一方でベンチマーク設計の意図を最もよく理解した開発体制とも言えます。

テンセントへの参加: 2025年12月17日入社。役職はCEO直属「チーフAIサイエンティスト」、テンセント社長 Martin Lau(劉熾平)直下でAI基盤構造・大規模言語モデル部門を統括。「100億元オファー」の報道はテンセントが公式に否定しており、実際の報酬は非公開です。

SWE-benchが評価するソフトウェアエンジニアリングタスク:GitHubイシューを自律解決するコーディングエージェント

Hy3 Previewの弱みと制約

良い面だけでなく、現時点での制約も正確に把握しておくことが重要です。

技術的な制約

制約

内容

マルチモーダル非対応

テキストのみ。画像・音声・動画の入出力は不可

ツール呼び出し時のエラー回復が弱い

公式が認める既知の問題。複雑なエージェントループでの信頼性に課題

出力の冗長性

Artificial Analysis計測で平均の約3倍(120M vs. 42Mトークン)の出力を生成。APIコスト計算時に注意

初回応答レイテンシ(TTFT)が高め

3.39秒(同クラス中央値2.29秒超え)

推論ハイパーパラメータ感度

temperaturetop_p の微調整が必要なケースあり

セルフホストに大規模GPU必要

H20×8構成が推奨。個人や小規模チームには導入ハードルが高い

性能的な制約

  • フロンティア閉鎖モデル(Claude Opus 4.6・GPT-5.4)に汎用性・エージェント性能で劣る場面がある
  • 日本語単体の評価データが未公開(多言語評価の一部として含まれる可能性はあるが確認できない)
  • ベンチマーク数値はほぼすべて自社発表。独立評価では Intelligence Index 42点(83モデル中16位)

"preview" という名称について

現在公開されているのはあくまで「プレビュー版」です。正式版(Hy3)のリリース時期は未発表であり、本番環境での長期利用前には正式版の状況を確認することを推奨します。


データプライバシーとセキュリティ注意点

中国企業が開発したモデルを利用する際、特にクラウドAPI経由での利用ではプライバシー上のリスクを正確に理解しておく必要があります。

利用形態別のリスク比較

利用形態

データのプライバシーリスク

推奨度(企業利用)

セルフホスト(自社インフラ)

低い(データはTencentに送信されない)

★★★★★

OpenRouter経由

中程度(OpenRouterのプライバシーポリシー適用)

★★★☆☆

Tencent Cloud TokenHub

高め(詳細後述)

機密データは★☆☆☆☆

Tencent Cloud API使用時の注意点

Tencent Cloud APIを利用する場合、送信したデータはTencentのサーバーに転送されます。中国の「国家安全法」「サイバーセキュリティ法」の下、中国当局は企業に対してデータ開示を求める法的権限を持ちます。このリスクは以下のような用途では特に重要です。

  • 個人情報(氏名・住所・医療情報等)を含むデータ
  • 企業の機密情報・営業秘密
  • 医療・法務・金融等の規制業種のデータ
  • 公共機関・政府関連のデータ

企業での安全な利用に向けたリスク軽減策

  1. セルフホスト運用:モデルウェイトを自社インフラ(オンプレミス・プライベートクラウド)で実行し、外部通信を遮断
  2. ネットワーク分離:推論環境をインターネットから切り離した環境で実行
  3. ライセンス条項の法務確認:「Tencent Hy Community License Agreement」の日本語訳・法務レビューを実施(商用利用前に必須)
  4. データ匿名化:クラウドAPIを使う場合は個人情報を匿名化・仮名化してから送信

ライセンス詳細は GitHub の LICENSE ファイルを参照。商用利用の問い合わせは hunyuan_opensource@tencent.com


こんな人・用途におすすめ

以下に当てはまる場合、Hy3 previewは有力な選択肢になります。

Hy3 Previewが向いているケース

  • コーディングエージェント・自動化パイプラインを構築したい開発者:SWE-bench 74.4%の実力は実務に直結する
  • オープンソースで自社ホストしたいチーム:データをTencentに送らずに済む
  • 長い技術文書・コードベースを丸ごと処理したい:256Kコンテキストは業務上の強力な武器
  • APIコストを最小化したいスタートアップ・個人開発者:OpenRouter無料枠またはGPT-4クラスの1/10価格で試せる
  • 中国語・英語が主要言語のプロジェクト:多言語性能の中でも特に強い
  • AIエージェント研究・実験環境:ReAct設計者が主導したモデルをエージェント基盤として検証したい研究者

Hy3 Previewが向いていないケース

  • 画像・音声・動画を扱うマルチモーダルAIが必要:現時点でテキストのみ対応
  • Tencent Cloudに機密データを送ることに懸念がある(セルフホスト環境がない):クラウドAPI経由のデータプライバシーリスクが払拭できない
  • 日本語専用タスクで最高性能が必要:日本語単体の評価データが未公開であり、日本語性能の正確な把握が困難
  • 本番環境で高い安定性が必要:現在は "preview" 版であり、本番用途には正式版を待つほうが安全
  • ツール呼び出し時のエラー回復が重要なエージェント:公式が既知の問題として認めている
  • セルフホストのGPUインフラがない(低コスト重視):H20×8構成はコストが高く、GPUリソースのないチームには負担が大きい

よくある質問(FAQ)

Q1. Hy3 previewとHunyuan 3.0(混元3.0)は同じモデルですか?

はい、同一のモデルです。公式の英語名称は「Hy3 preview」で、「Hunyuan 3.0」「混元3.0」は主に中国国内で使われる通称です。

Q2. 無料で使えますか?

OpenRouterの無料枠(tencent/hy3-preview:free)はローンチ時2週間の無料期間が設定されていましたが、現在の状況は変動している可能性があります。モデルウェイト自体はHugging Face等から無料でダウンロード可能ですが、セルフホストにはGPUが必要です。

Q3. 日本語には対応していますか?

多言語モデルですが、MMMLU(多言語ベンチマーク)での評価が主で、日本語単体の性能データは2026年5月時点で公開されていません。日本語タスクでの正確な性能把握には独自テストが必要です。

Q4. DeepSeek-V3とどちらを選べばいいですか?

コーディングエージェント・SWE-benchなどのソフトウェアエンジニアリングタスクにはHy3 previewが優位、APIコストの安さ・日本語性能の実績ではDeepSeek-V3が安定しています。詳しくは本記事の比較表を参照してください。

Q5. セルフホストは個人でもできますか?

技術的には可能ですが、推奨構成がH20×8(大容量GPU)のため、個人での実運用はコスト面でハードルが高いです。試用目的であればOpenRouter経由の利用が現実的です。

Q6. ライセンスは商用利用に対応していますか?

「Tencent Hy Community License Agreement」の下、商用利用は許可されています(属性表示・利用ポリシー遵守条件付き)。製品組み込み前にGitHubのLICENSEファイル全文の確認と法務レビューを推奨します。

Q7. "preview" とはどういう意味ですか?正式版はいつ出ますか?

現在公開されているのはプレビュー版です。正式版(Hy3)のリリース時期はTencentから未発表です(2026年5月時点)。


まとめと関連記事

Hy3 previewは、オープンソース・低コスト・コーディング/エージェント特化・256K長文コンテキストという組み合わせで、2026年春時点のオープンウェイトモデルの中でも際立った存在感を持ちます。特にセルフホストでデータをローカル管理できる開発チームや、SWE-bench水準のコーディングエージェント能力をコスト効率よく利用したい企業にとって有力な選択肢です。

一方で、閉鎖モデル(Claude Opus 4.6・GPT-5.4)には総合性能でやや劣る点、クラウドAPI使用時のデータプライバシーリスク、日本語単体評価データの不足、"preview" という開発途上ステータスは慎重に評価すべき点です。

まずはOpenRouter経由で無料試用し、自社ユースケースへの適合性を確認してから本番導入を検討するのが現実的なアプローチです。


関連記事


参考・出典:

AIツールの導入でお困りですか?

お客様のビジネスに最適なAIツールをご提案します。まずは無料相談から。

この記事の著者

AI革命

AI革命

編集部

AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。

AI活用ならAI革命にお任せ。サービスを見てみる
AI Revolution Growth Arrow

AIでビジネスを革新しませんか?

あなたのビジネスにAIがどのような価値をもたらすかをご提案いたします。