AI基礎知識2026年5月更新

Tencent Hy3 Preview(Hunyuan 3.0)とは?元OpenAI姚順雨新体制で295B MoE・21B active・256Kを実現した中国産フラッグシップを徹底解説

公開日: 2026/04/18
更新日: 2026/05/10
Tencent Hy3 Preview(Hunyuan 3.0)とは?元OpenAI姚順雨新体制で295B MoE・21B active・256Kを実現した中国産フラッグシップを徹底解説

この記事のポイント

Tencent Hy3 Preview(Hunyuan 3.0)は、元OpenAIの姚順雨(Yao Shunyu)が率いるTencent Hy Teamが2026年4月に公開した295Bパラメータ・21Bアクティブ・256Kコンテキストの大規模MoE言語モデルです。この記事では、定義・モデル仕様・料金・ベンチマーク・使い方・Claude Opus 4.6やGPT-5.5 previewとの違いまで、導入判断に必要な情報を整理します。

Tencent Hy3 Preview(Hunyuan 3.0 のプレビュー版)は、Tencentが2026年4月23日に公開した総パラメータ295B・アクティブ21B・コンテキスト256KのMoE型大規模言語モデルです。 元OpenAIで「Deep Research」「Computer-Using Agent」を率いた姚順雨(Yao Shunyu)がChief AI Scientistとして再編した「Hy Team」の最初の主要成果物で、推論・コーディング・エージェントワークフローに最適化されています。

この記事でわかること:

  • Hy3 Preview の定義、開発元、位置づけ
  • モデル仕様(295B / 21B active / 256K context / 192エキスパート)
  • ベンチマーク結果(SWE-bench Verified 74.4%、BrowseComp 67.1% など)
  • 料金(Tencent Cloud TokenHub・OpenRouter 無料枠)
  • 使い方の3経路(OpenRouter / Tencent Cloud / Hugging Face 自前ホスト)
  • Claude Opus 4.6・GPT-5.5 preview・DeepSeek V4 など競合との違い
  • 中国産モデル特有のセキュリティ・規制留意点
  • どんな組織・用途に向いているか

こんな方に向いています: 中国市場対応のAIエージェント基盤を検討しているエンジニア/コスト効率の高い大規模MoEを自前運用したいインフラ責任者/OSSフラッグシップの最新動向を追っているCTO・研究者。

本記事は公式情報・公式ドキュメント・主要メディア報道をもとに整理しています。Hy3 Preview は名前のとおり「正式版前のプレビュー」であり、仕様・料金・無料枠は短期間で変動する可能性があります。最新情報は必ず公式(GitHub / Hugging Face / Tencent Cloud TokenHub)でご確認ください。

Tencent Hy3 Preview(Hunyuan 3.0)とは

Tencent Hunyuan / Hy3 Preview の公式ロゴ

出典: Tencent-Hunyuan/Hy3-preview 公式GitHubリポジトリ

Hy3 Preview は、Tencent の AI 部門「Hy Team」(旧 Hunyuan チームを再編した組織)が公開した、fast-and-slow thinking 融合型の MoE(Mixture-of-Experts)言語モデルです。総パラメータ295Bのうち、推論時にアクティブ化されるのは21Bのみで、巨大モデル並みの精度と中規模モデル並みの推論コストを両立する設計を採用しています。

「Preview」と付いているとおり、正式リリースである Hunyuan 3.0 の前段階としてコミュニティ・ユーザーから広くフィードバックを集める目的で公開されました。OSSウェイトと商用APIの両方が同時提供されており、研究用途と本番運用の両方を想定しています。

5W1H の早見表

項目

内容

Who(誰が)

Tencent Hy Team(Chief AI Scientist: 姚順雨/Yao Shunyu)

What(何を)

295B MoE / 21B active / 256K context の言語モデル

When(いつ)

2026年4月22日 OpenRouter 公開、4月23日 GitHub / Hugging Face 公開、4月24日 公式英語プレス

Where(どこで)

GitHub・Hugging Face・ModelScope・GitCode(OSS)/Tencent Cloud TokenHub(API)/OpenRouter(無料枠)

Why(なぜ)

2026年初頭に再構築した事前学習・RLインフラの最初のフラッグシップ。正式版に向けた検証

How(どうやって)

MoE(192エキスパート top-8)+ MTP + GQA。BF16ウェイト、vLLM / SGLang 対応

開発元と組織背景:姚順雨(Yao Shunyu)が率いる Hy Team

Hy3 Preview を語るうえで欠かせないのが、開発を主導する姚順雨(Yao Shunyu, Shunyu Yao)の経歴と、Tencent内部での組織再編です。

  • 元 OpenAI 研究員。Deep ResearchComputer-Using Agent (CUA) のキーパーソン。
  • 学歴: 清華大学姚班 → プリンストン大学 計算機科学 PhD。
  • 主要研究: ReAct(推論と行動の融合)、Tree of Thoughts (ToT)CoALA(モジュール型認知アーキテクチャ)。
  • 2024年に MIT Technology Review「35 Innovators Under 35」中国版に選出。
  • Tencent では Chief AI Scientist として CEO 直下(Tencent President Martin Lau に直接報告)に着任。
  • TEG(Technology Engineering Group)に「AI Infra Department」「Data Computing Platform Team」を新設し、既存データ基盤を「AI Data」に改称。Hunyuan を「Hy Team」として再起動。

姚氏の方針は、ベンチマーク順位そのものよりも「製品に組み込んでフィードバックループを回すこと」を重視する、というものです。実際に Hy3 Preview は、Yuanbao(元宝)/CodeBuddy/WorkBuddy/ima/Tencent Docs/Peacekeeper Elite(和平精英)/QQブラウザなど、Tencent の既存プロダクトに即座に統合されています。

Hunyuan 3 シリーズの中での位置づけ

「Hunyuan 3.0」と耳にして混乱しやすいのですが、Hunyuan は1つのモデルではなくシリーズ名です。Hy3 Preview はその中の言語モデルにあたります。

シリーズ

モデル

モダリティ

規模・特徴

Hy3 Preview(本記事)

Hy3-preview / Hy3-preview-Base

テキスト言語モデル

295B MoE / 21B active / 256K context

Hunyuan Image 3.0

Hunyuan Image 3.0

画像生成

80B(別モデル)

HunyuanVideo

HunyuanVideo

動画生成

別系列

Hunyuan 3D

Hunyuan 3D

3Dアセット生成

別系列

検索結果やSNS上で「Hunyuan 3.0 = 画像モデル」と紹介している記事もありますが、Hy3 Preview は言語モデルである点に注意してください。

Hy3 Preview のモデル仕様(公式README より)

Hy3 Preview の長文コンテキストおよびInstruction Followingベンチマーク(公式公開資料)

出典: Tencent-Hunyuan/Hy3-preview 公式GitHubリポジトリ

スペックは以下のとおりです。一般的な「Dense + 大規模コンテキスト」型と異なり、MoE + MTP(Multi-Token Prediction)を組み合わせて推論効率を引き上げているのが特徴です。

項目

アーキテクチャ

Mixture-of-Experts(MoE)+ Dense + MTP

総パラメータ

295B(295,000,000,000)

アクティブパラメータ

21B

MTP(Multi-Token Prediction)レイヤー

3.8B(追加1層)

Transformer 層数

80層(MTP 除く)

エキスパート数

192(top-8 ルーティング)+ 共有エキスパート 1

Attention

Grouped Query Attention(64ヘッド/KV 8ヘッド/128次元)

Hidden size

4,096

Intermediate size

13,312

語彙サイズ

120,832

コンテキスト長

256K(262,144 トークン)

精度

BF16

推論モード

no_think(既定)/lowhighreasoning_effort で切替)

MoE と「fast-and-slow thinking」の意味

Hy3 Preview は、推論時に192のエキスパートのうち上位8だけを動的に呼び出すため、ウェイト全体は295Bでも計算負荷は21B相当です。さらに reasoning_effort パラメータで「fast(no_think)」と「slow(high)」を切り替えられ、軽い質問は即応、複雑な推論は深く思考する、という挙動を1モデルで実現します。

これは OpenAI の o1 / GPT-5 系列が採用している reasoning モードや、Claude の Extended Thinking と同じ思想です。Tencent 自身もアナウンスで「OpenAI の reasoning model 思想と同等の挙動を、295B MoE 上で再現した」と説明しています。

補足: 一部のコミュニティポータル(hy3ai.com など)では「12B active」と表記されている例がありますが、公式 README・Hugging Face・GitHub・主要英語メディアはすべて 21B active で一致しています。本記事では公式値の 21B を採用します。

できること(主な能力とベンチマーク)

Hy3 Preview のSTEM・推論ベンチマーク結果(公式公開資料)

出典: Tencent-Hunyuan/Hy3-preview 公式GitHubリポジトリ

Hy3 Preview の強みは、実利用に直結する4領域 — 推論/コーディング/検索エージェント/長文コンテキスト — に投資が集中していることです。それぞれの公開ベンチマーク値を整理します。

1. 複雑な推論・STEM

  • 清華大学 Qiuzhen College Math PhD qualifying exam(2026春) — 中国モデル中トップ級スコア
  • 中国高校生物オリンピック(CHSBO 2025) — 同上
  • GSM8K: 95.37/MATH: 76.28/CMath: 91.17
  • MMLU-Pro: 65.76/SuperGPQA: 51.60
  • Instruct: GPQA Diamond 87.2/HLE 30

2. コーディング・コーディングエージェント

  • SWE-bench Verified: 74.4%(前世代 Hy2 から +約40pt の大幅改善)
  • Terminal-Bench 2.0: 54.4%
  • LiveCodeBench-v6: 34.86(Base)/CRUXEval-I: 71.19/MBPP-plus: 78.71

SWE-bench Verified の +40pt 上昇は、過去1年間で公開された中国産モデルの中でも最大級の改善幅です。

3. 検索エージェント・ブラウジング

  • BrowseComp: 67.1%
  • WideSearch: 70.2%

これらは姚氏が OpenAI 時代に手がけた Deep Research 的な「検索→読解→統合」を高速で回す能力を示すベンチマークで、後述する Yuanbao や ima への搭載に直結しています。

4. 多言語・長文

  • MMMLU(80+言語平均): 80.15
  • 自社ベンチ CL-bench / CL-bench-Life で長文学習を評価
  • 256K のコンテキスト全域でベンチマークを公開(先頭・末尾だけ強い「見せかけ256K」ではない、と公式は主張)

5. 長期エージェントワークフロー

社内環境で最大495ステップの連続ツール呼び出しを成功させたと公表。ドキュメント処理/データ分析/知識検索/ツールオーケストレーションの実運用を想定しています。vLLM・SGLang ともに hy_v3 / hunyuan 専用パーサと auto tool choice をサポートしており、エージェント基盤として組み込みやすい設計です。

内部効率データ(Tencent 公表値)

指標

改善幅

推論効率(前世代比)

+40%

CodeBuddy / WorkBuddy の TTFT

−54%

CodeBuddy / WorkBuddy の E2E所要時間

−47%

CodeBuddy / WorkBuddy の成功率

>99.99%

Tencent Docs PowerPoint生成成功率

+20pt

これらは Tencent 内部測定値であり、第三者再現は今後の検証待ちである点に留意してください。

Hy3 Preview の強み

公式情報と他モデルとの比較から、Hy3 Preview の強みは次の5点に整理できます。

1. アクティブ21Bという強烈なコスト効率

総パラメータ295Bでありながら、推論時の計算量は21B相当。同じくらいの精度を狙う Dense モデル(Llama 3 405B など)と比較してGPUコストを大幅に下げられます。Tencent Cloud TokenHub の入力料金 RMB 1.2 / 100万トークン(約 $0.18)は、フロンティアモデル相場(GPT-5.5 級は $3〜10 / 100万トークン台)の20分の1以下です。

2. オープンソース+商用APIの「二本立て」

OSSとしてフルウェイトを公開しつつ、Tencent Cloud TokenHub で OpenAI 互換 API を即座に提供しています。「自前ホスト or マネージド」を選べるため、規制や社内ポリシーに応じて柔軟に運用できます。

3. 256K コンテキストを実用品質で

長文コンテキストは「公称値だけ長い」モデルが多い中、Hy3 Preview は CL-bench / CL-bench-Life など独自ベンチで256K全域での精度を公開しています。長大なコードベースや法務文書、リサーチ資料の一括処理を実用範囲で扱えます。

4. エージェント志向のアーキテクチャ

reasoning_effort の3段階切替、最大495ステップ実行、専用ツール呼び出しパーサ、MTP による speculative decoding 推奨など、「推論ループを長く回す」設計になっています。Computer Use 系・Deep Research 系のエージェント基盤に向いた仕様です。

5. Tencent 自社プロダクトへの即時統合

公開と同時に、以下の Tencent 既存サービスへ組み込まれています:

  • Yuanbao(元宝) — 一般向けAIアシスタント
  • CodeBuddy — コーディング支援
  • WorkBuddy — 業務SaaS統合
  • ima — ノート・知識管理
  • Tencent Docs — ドキュメント/PowerPoint生成
  • Peacekeeper Elite(和平精英)/QQ/QQブラウザ/Tencent LearnShare — 一般・娯楽サービス

製品で実運用しながら改善する、というオープンエンドな実証実験になっています。

Hy3 Preview の弱み・制約

公式が自ら公表している弱点と、競合モデルとの位置関係から見えてくる制約を整理します。

公式が公表している既知の弱点

  • ツール呼び出し時のエラーリカバリーが弱い場合がある — 失敗したツール呼び出しからの自動復旧がまだ不安定。
  • 推論ハイパーパラメータに敏感 — temperature やシード次第で出力ブレが大きくなるケースがある。

フロンティアモデルとの差

Tencent 自身が「OpenAI / Google DeepMind の最上位モデル群とはまだ差がある」と表明しています。具体的には:

ベンチマーク

Hy3 Preview

Claude Opus 4.6

GPT-5.5 preview

SWE-bench Verified

74.4%

80.8%

非公表

BrowseComp

67.1%

76.2%

73.8%

WideSearch

70.2%

77.2%

非公表

「最高精度のフロンティアモデル」を求める用途では、Claude Opus 4.6 / GPT-5.5 preview の方が依然として有力です。

自前ホストの GPU 要件が重い

総パラメータ295BをBF16で保持するため、自前運用には8×H20-3e(141GB)/8×H200 級のハイエンドGPUが必要です。8×H100 80GB / 8×A100 80GB ではBF16ウェイト + KVキャッシュが収まらず、マルチノード Tensor Parallel が必須となります。個人レベル・小規模スタートアップが手元で動かすのは難しいモデルです。

商用利用範囲の確認が必要

ライセンスは Tencent Hunyuan Community License Agreement。OSSではあるものの「コミュニティライセンス」系のため、利用規模・対象によって追加条件がかかる可能性があります。商用本番で使う前に必ずLICENSE原文を確認してください。

中国本土ベンダー由来モデルの一般的留意点

  • 中国国内規制への準拠のため、政治・規制トピックで応答が制限される傾向がある。
  • Tencent Cloud アカウント発行・KYCに地域差があり、日本企業がスムーズに発行できないケースもある。
  • データ越境保管・政府要請への対応については、自社のリスク評価が必要。

料金・プラン

公式情報に基づき、現時点で確認できる提供チャネルと料金を整理します。

提供チャネル

入力(100万トークン)

出力(100万トークン)

備考

Tencent Cloud TokenHub

RMB 1.2(約28円・約 $0.18)

RMB 4(約94円・約 $0.59)

キャッシュ入力は RMB 0.4

OpenRouter(無料プレビュー)

$0

$0

tencent/hy3-preview:free。launch から約2週間限定

OpenRouter(有料経路)

公開時点では未確認

同上

無料枠終了後に正式価格となる見込み

Tencent Cloud 個人プラン

約 $4.10/月〜

個人向けサブスクリプション

OSS自前ホスト

サーバーコストのみ

同左

8GPU 級ハードウェア必要

円換算は概算(1 RMB ≒ 23円)。実額は為替・キャンペーンで変動します。日本円建ての公式表記、日本リージョン対応の有無は現時点で公式記載が見当たらず未確認です。

コスト感の比較(参考)

モデル

入力 / 100万トークン

Hy3 Preview(TokenHub)

約 $0.18

DeepSeek V4(参考相場)

$0.27〜$0.55

GPT-5.5 preview(参考相場)

$1.25〜

Claude Opus 4.6(参考相場)

$15.00

注: Hy3 Preview 以外の数値は各社公式・主要メディアの参考値であり、本記事の対象外モデルです。詳細は各記事(後述の関連記事)を参照してください。

Hy3 Preview の 「フロンティア級ベンチマーク × 中規模モデル並みの単価」は、現時点で他のフロンティア級と比べて圧倒的に安い水準です。コスト最優先のエージェント基盤を組む場合の有力候補となります。

使い方の3経路

Hy3 Preview のエージェントベンチマーク総覧(公式公開資料)

出典: Tencent-Hunyuan/Hy3-preview 公式GitHubリポジトリ

Hy3 Preview を試す経路は大きく3つあります。最初の検証は OpenRouter 無料枠、本番は TokenHub、規制要件が厳しい場合は自前ホスト、というのが基本線です。

経路A: OpenRouter で無料お試し(最速・推奨)

  1. OpenRouter にアカウント登録
  2. モデルID tencent/hy3-preview:free を選択
  3. OpenAI互換のSDKからそのまま呼び出し可能
  4. レート制限あり、launch から約2週間の限定無料枠

用途: プロンプト検証・ベンチマーク再現・既存コードベースとの簡易接続テスト。

経路B: Tencent Cloud TokenHub(本番運用向け)

  1. Tencent Cloud アカウントを発行(地域によっては KYC に時間がかかる)
  2. TokenHub にて Hy3 Preview を有効化
  3. OpenAI互換APIエンドポイントで呼び出し
  4. キャッシュ入力(RMB 0.4 / 100万トークン)を活用するとさらにコスト圧縮可能

用途: プロダクション運用・大量バッチ処理・社内エージェント基盤。

経路C: Hugging Face / GitHub から OSS 自前ホスト

  1. Hugging Face: tencent/Hy3-preview または GitHub: Tencent-Hunyuan/Hy3-preview からウェイトを取得
  2. 推論フレームワークを選択(vLLM は MTP speculative decoding 推奨/SGLang は EAGLE speculative sampling 推奨)
  3. 8GPU 環境(H20-3e 141GB / H200 級推奨)で BF16 ロード
  4. OpenAI互換APIサーバーとして起動
  5. ファインチューニング可(DeepSpeed ZeRO + LLaMA-Factory のレシピ同梱)

用途: データ越境を許容できない/ファインチューニングしたい/自社インフラに組み込みたいケース。

公式公開されているスループット参考値: 8×H20-3e(入力8,192/出力1,024/32並列)で 約584 tokens/sec、TTFT 約4.5秒、ITL 約50ms

他ツールとの違い(競合比較)

主要モデルとの比較を整理します。「フロンティア精度なら Claude / GPT-5.5、コスト効率と OSS 自由度なら Hy3 / DeepSeek」という構図です。

ベンチマーク比較表

ベンチマーク

Hy3 Preview

Claude Opus 4.6

GPT-5.5 preview

DeepSeek V4

Kimi K2.5

GLM-5

SWE-bench Verified

74.4%

80.8%

非公表

非公表

76.8%

77.8%

BrowseComp

67.1%

76.2%

73.8%

62.8%

非公表

非公表

Terminal-Bench 2.0

54.4%

非公表

非公表

非公表

非公表

非公表

WideSearch

70.2%

77.2%

非公表

非公表

非公表

非公表

数値は公式README + 各メディア(Implicator.ai、Decrypt、businessanalytics.substack 等)の集計を併記。第三者検証はまだ少ないため、Artificial Analysis 等の独立検証ボードへの掲載状況は今後確認が必要です。

設計思想・運用形態の比較

観点

Hy3 Preview

Claude Opus 4.6

GPT-5.5 preview

DeepSeek V4

アーキテクチャ

295B MoE / 21B active

非公表(Dense系統と推測)

非公表

大規模MoE

コンテキスト

256K

200K(標準)

非公表

128K前後

OSSウェイト

あり(コミュニティライセンス)

なし

なし

あり

主要API提供

Tencent Cloud / OpenRouter

Anthropic / AWS Bedrock / GCP

OpenAI / Azure

DeepSeek / OpenRouter

入力単価(参考)

約 $0.18

約 $15

約 $1.25

約 $0.27

規制リスク

中国産(国境越境を要評価)

米国

米国

中国産

選び分けのポイント

  • OSSで自前運用したい・コスト最優先 → Hy3 Preview か DeepSeek V4
  • 最高精度のコーディングエージェント → Claude Opus 4.6(次点で Hy3)
  • エンタープライズ・規制リスクを抑えたい → Claude / GPT-5.5
  • 日本語+大規模コンテキスト+コスト → Hy3 Preview の検討価値が高い
  • エージェント長期実行(数百ステップ) → Hy3 Preview / Claude Opus 4.6

中国産モデル特有のセキュリティ・規制留意点

Hy3 Preview を実プロジェクトに組み込む前に、中国本土ベンダー由来モデル特有の留意点を必ず評価してください。

1. データ越境

Tencent Cloud TokenHub 経由で利用する場合、リクエストデータは Tencent のインフラを経由します。日本国内法(個人情報保護法)・社内データガバナンスポリシー・GDPR 等への適合は、ユーザー側で確認・契約・運用設計が必要です。

機微なデータ(顧客情報、医療情報、未公開財務、コードの知的財産など)を扱う場合は、自前ホスト(経路C)の検討が現実解です。

2. コンテンツ・応答制限

中国本土向け規制への準拠のため、政治・地政学・規制トピックでの応答が制限される傾向があります。エンタープライズ向けの汎用アシスタントとして導入する場合、ユーザーから「特定トピックに答えない」と苦情が出る可能性を考慮してください。

3. ライセンス確認

Tencent Hunyuan Community License Agreement は OSS 系ですが、コミュニティライセンスのため利用規模・対象によって追加条件がかかります。商用本番に使う前に LICENSE 原文を法務確認してください。hunyuan_opensource@tencent.com が公式問い合わせ先です。

4. アクセス管理・サービス継続性

中国本土ベンダーのサービスは、政府要請等によりアクセス管理・仕様変更が発生する可能性があります。ミッションクリティカルな用途では、フォールバックとして Claude / GPT-5.5 / DeepSeek 等の別ベンダーモデルを併用できる構成を推奨します。

こんな方におすすめ

以下に当てはまる方は Hy3 Preview の検証価値が高いです。

  • 中国市場向けのプロダクトを開発している — Yuanbao や Tencent エコシステムとの相性が良い
  • コスト効率を最優先するエージェント基盤を作りたい — 入力 $0.18 / 100万トークンはフロンティア級として破格
  • 256K の長文コンテキストを実用品質で使いたい — 大規模コードベース・法務文書・研究資料処理
  • MoE モデルを自前運用したいインフラチーム — vLLM / SGLang のレシピが整備されている
  • OSSフラッグシップの最新動向を追いたい研究者・CTO — 元 OpenAI 姚氏の方向性を知る最初の機会
  • エージェント長期実行(数百ステップ規模)の実証実験をしたい — 公式が495ステップ実行を公表

おすすめしない方

逆に、以下に当てはまる場合は Claude Opus 4.6 / GPT-5.5 preview / DeepSeek V4 など別モデルの方が無難です。

  • 個人開発で手元のPCで動かしたい — 8GPU 級ハードが必要なため自前ホストは現実的でない(API経由なら可)
  • 最高精度のフロンティアモデルが必須 — SWE-bench / BrowseComp で Claude Opus 4.6 に届いていない
  • 規制・データ越境リスクをゼロにしたい — 中国本土ベンダー由来であるため、エンタープライズ規制要件によっては不採用候補
  • 日本リージョン・JPY建て請求が必須 — 現時点で公式記載が見当たらない
  • サポートに日本語レスポンスを求める — 公式問い合わせは英語ベース

よくある質問(FAQ)

Q1. Hy3 Preview と Hunyuan 3.0 は同じものですか?

Hy3 Preview は「Hunyuan 3.0 の正式版前のプレビュー版」です。コミュニティ・ユーザーから広くフィードバックを集めて改良し、後日 Hunyuan 3.0 正式版としてリリースされる予定です。具体的なリリース日程は公式未公表です。

Q2. 「Hunyuan 3.0」は画像生成モデルではないのですか?

混乱しやすい点です。Hy3 Preview は言語モデルで、画像生成は別系列の Hunyuan Image 3.0(80B) です。動画は HunyuanVideo、3Dは Hunyuan 3D。すべて別モデルなので混同しないでください。

Q3. 個人で無料で試せますか?

はい。OpenRoutertencent/hy3-preview:free を選択すれば、launch から約2週間の限定無料枠が利用できます。OpenAI互換SDKでそのまま呼び出せるため、最速の検証経路です。

Q4. 自前ホストにはどのくらいのGPUが必要ですか?

公式推奨は 8×H20-3e(141GB) または 8×H200級。8×H100 80GB / 8×A100 80GB では BF16ウェイトとKVキャッシュが収まらず、マルチノード Tensor Parallel が必要になります。個人・小規模スタートアップが手元で動かすのは現実的でなく、API利用が基本線です。

Q5. 日本語性能はどうですか?

公式の MMMLU(80+言語平均)で 80.15 をマークしており、多言語対応は強めです。ただし日本語特化のベンチマーク(JCommonsenseQA、JGLUE等)の公式数値は現時点で公開されておらず、実用検証は OpenRouter 無料枠で各自試すことを推奨します。

Q6. Claude Opus 4.6 や GPT-5.5 preview と比べてどうですか?

ベンチマーク絶対値では Claude Opus 4.6 や GPT-5.5 preview に届かないものの、入力単価が約20分の1〜100分の1という強烈なコスト優位があります。「フロンティアの95%精度を5%のコストで」というポジションを狙ったモデルだと考えるのが妥当です。

Q7. 商用利用できますか?

ライセンスは Tencent Hunyuan Community License Agreement。OSS系ではあるものの、コミュニティライセンスは利用規模・用途によって追加条件がかかる場合があります。商用本番で使う前に LICENSE 原文を必ず法務確認してください。

Q8. データはTencentに送られますか?

API経由(Tencent Cloud TokenHub・OpenRouter)の場合、リクエスト・応答データは各事業者のインフラを経由します。Tencent Cloud のデータポリシーが適用されます。自前ホスト(経路C)であればデータ送信は発生しません。機微データを扱う場合は自前ホストを検討してください。

まとめ:Hy3 Preview は「コスト効率と OSS 自由度を両立した中国産フラッグシップ」

Tencent Hy3 Preview(Hunyuan 3.0)は、元 OpenAI の姚順雨氏が再編した Hy Team が、Tencent インフラを再構築して最初に投下したフラッグシップ言語モデルです。295B MoE / 21B active / 256K contextという贅沢な仕様を、入力 $0.18 / 100万トークンという破格の単価で提供しているのが最大の特徴です。

導入判断の要点を再掲します:

  • 強み: コスト効率/OSS自由度/長文コンテキスト/エージェント志向設計/Tencent エコシステム統合
  • 弱み: フロンティア最上位(Claude Opus 4.6 / GPT-5.5 preview)には精度で届かず/自前ホストはハイエンドGPU必須/中国産モデル特有のリスク
  • 試し方: OpenRouter 無料枠 → Tencent Cloud TokenHub → 必要に応じて自前ホスト
  • 正式版に向けて: 仕様・料金・無料枠は preview 期間中に変動する可能性が高いため、本番採用前に最新の公式情報を必ず再確認

「OSSフラッグシップで何ができるか」を体感しておくこと自体が、AI基盤戦略の解像度を上げます。OpenRouter 無料枠で1度叩いてみる、という最初の一歩から始めてみてください。

関連記事

Hy3 Preview の周辺領域や比較対象を、当サイトの関連記事でさらに詳しく解説しています。

参考ソース

この記事の著者

AI革命

AI革命

編集部

AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。

AI活用ならAI革命にお任せ。サービスを見てみる
AI Revolution Growth Arrow

AIでビジネスを革新しませんか?

あなたのビジネスにAIがどのような価値をもたらすかをご提案いたします。