NTT tsuzumi 2とは?政府Gennai基盤採用の日本語最高性能LLMを徹底解説

この記事のポイント
NTTの純国産LLM「tsuzumi 2」を、性能・料金・導入方法・政府Gennai採用の意味まで一次情報ベースで整理。30Bパラメータ・1GPU動作の軽量設計と、デジタル庁源内に選定された7モデルとの違いを比較表で解説します。
tsuzumi 2は、NTTがフルスクラッチ開発した純国産・エンタープライズ向け軽量LLMで、30Bパラメータながら1GPU(NVIDIA A100 40GB)で動作し、同サイズ帯モデルでは日本語性能トップクラスを謳うモデルです。 2025年10月20日に一般提供が開始され、2026年3月にはデジタル庁の政府AI基盤「源内(Gennai)」の試用LLM7モデルにも選定されました。
この記事でわかること
- tsuzumi 2の定義・特徴・前世代との違い(公式情報ベース)
- 日本語性能ベンチマークと「日本語最高性能」と言われる理由
- 政府Gennai採用の意味と、同時選定された他6モデルとの位置づけ
- 料金・導入方法・必要なハードウェアの目安
- ChatGPT・Claude・Gemini等とどう使い分けるべきか
- 向いている企業/向いていない企業の判断軸
誰向けの記事か
- 行政・金融・医療・電力など、機密性の高い業務でLLM導入を検討している情シス・DX担当者
- 海外SaaS型LLM(ChatGPT・Claude等)からのオンプレミス/国産モデル移行を比較検討している企業
- デジタル庁源内の動向を踏まえて、自治体・公共系の生成AI調達準備を進めたい関係者
- NTTグループからの提案を受けてtsuzumi 2を評価中の購買・技術部門
NTT tsuzumi 2とは

出典: NTT公式リリース
NTT tsuzumi 2は、日本電信電話株式会社(NTT)の研究開発部門が開発し、NTTデータやNTTドコモビジネスをはじめとするNTTグループ各社が法人・公共機関向けに提供する大規模言語モデルです。前世代「tsuzumi」(2024年3月商用化、7Bパラメータ)の後継として、2025年10月20日に一般提供が開始されました。
基本スペック
項目 | 内容 |
|---|---|
正式名称 | tsuzumi 2(つづみ ツー) |
開発元 | NTT(日本電信電話株式会社) |
提供元 | NTTデータ/NTTドコモビジネス/NTTグループ各社 |
提供開始日 | 2025年10月20日 |
パラメータ数 | 約300億(30B) |
動作要件 | NVIDIA A100 40GB 1基で推論可能 |
量子化 | 16bit/8bit/4bit 対応 |
言語 | 日本語特化+英語対応 |
開発手法 | フルスクラッチ(他社ベースモデル不使用) |
提供形態 | オンプレミス/プライベートクラウド/Azure経由(順次拡充) |
個人向けプラン | なし(B2B・公共向け専用) |
「軽量だが日本語性能はトップクラス」が基本コンセプト
tsuzumi 2の最大の設計思想は、「1GPUで動く軽量さ」と「同サイズ帯トップの日本語性能」を両立することです。GPT-5やClaude Opus 4.x、Gemini 3 Proのような数千億〜兆パラメータ級の汎用大規模モデルではなく、エンタープライズが自社環境内に置いて使える現実的なサイズに絞り込み、その上で日本語タスクに集中投資した点が他社モデルと異なります。
NTT公式および業界メディアによれば、tsuzumi 2は知識・解析・指示遂行・安全性の4ベンチマークで、Gemma-3 27BやQwen-2.5 32Bなど同サイズ帯の競合を上回り、MT-bench日本語版の多くのタスクではGPT-5に匹敵する数値を出していると報告されています(一部数値はNTT提示・業界メディア試算ベース。最新の公式ベンチマーク結果は要確認)。
tsuzumi 2の主な特徴・強み

出典: NTT公式リリース
公式発表と業界メディア報道を整理すると、tsuzumi 2の強みは大きく6つに分類できます。
1. 1GPU動作で運用コストが大幅に下がる
tsuzumi 2はNVIDIA A100 40GBを1基用意すれば推論可能です。一般に70B級の大規模モデルを自社運用する場合はGPU複数基〜クラスタ構成が必要で、ハードウェア初期投資が5,000万〜1億円規模に達することも珍しくありません。業界メディア試算では、tsuzumi 2はA100 1基構成で約500万円程度から始められるとされており、自社オンプレミスで生成AIを動かす際のハードルを大きく下げています(NTT公式数値ではなく業界メディア試算である点に注意)。
2. 日本語性能を同サイズ帯トップに引き上げ
前世代の7Bから30Bへとパラメータを大幅拡張し、日本語学習データを集中投入しています。日本語の文書要約、行政文書・契約書の解釈、金融商品説明のリライトなど、日本語特有の言い回しや敬語表現を扱う業務で精度を発揮します。
3. RAG性能を大幅強化
tsuzumi顧客の利用シーンの約80%を占めるドキュメントQA・情報抽出・要約タスクに集中投資し、RAG(検索拡張生成)性能を大幅に向上させたとNTTは説明しています。NTT社内の財務システム問い合わせ対応シナリオで、同サイズ帯のみならず大規模モデルも上回るRAG性能を達成したと公式発表されています。
4. アダプターチューニング技術で少量データ特化が可能
ベースモデルを書き換えず、小さな「アダプター」と呼ばれる学習ユニットだけを追加学習する仕組みです。NTTの実証では、ファイナンシャル・プランニング技能士2級(FP2級)の合格水準到達に、他モデルでは1,900問必要だったところ、tsuzumi 2では約200問で到達したと報告されており、追加学習データ量を約1/10に圧縮できるとされています。
業務マニュアルや専門資格の知識など、手元の限られた教材で特化モデルを作りたいケースにフィットする技術です。
5. 構造化出力(JSON等)への対応強化
フォーム自動入力、データ抽出、業務ワークフローへの組み込みを想定し、JSONスキーマに沿った出力品質が強化されています。RPA・既存基幹システムと組み合わせる業務自動化の文脈で扱いやすくなりました。
6. 業界特化知識の事前学習
金融・医療・自治体(公共)の3分野について、業界用語・規制・実務文書を踏まえた知識が事前学習段階から強化されています。これは前世代のtsuzumiにはなかった大きな差別化点です。
前世代tsuzumiとの違い
項目 | tsuzumi(初代・7B) | tsuzumi 2(30B) |
|---|---|---|
提供開始 | 2024年3月 | 2025年10月20日 |
パラメータ数 | 7B(70億) | 30B(300億) |
GPU要件 | 1基(軽量) | 1基(A100 40GB) |
日本語性能 | 同サイズ帯競争力あり | 同サイズ帯トップクラスを主張 |
RAG性能 | 標準 | 集中強化 |
業界特化知識 | 限定的 | 金融・医療・自治体を強化 |
アダプターチューニング | あり | あり(学習効率を更に改善) |
構造化出力 | 標準 | JSON対応など強化 |
提供形態 | オンプレ/Azure等 | オンプレ/プライベートクラウド/Azure |
出典: NTT R&D公式 / NTTデータ tsuzumi製品ページ
ポイントは、「軽量さは維持したまま、性能と業界特化を一段引き上げた」点です。7Bと30Bでは表現力・知識量が大きく異なるため、初代tsuzumiでは精度不足だったタスクがtsuzumi 2では実用域に入る可能性があります。
政府Gennai(源内)採用の意味
2026年3月6日、デジタル庁は政府職員向け生成AI利用環境「源内(Gennai)」の試用LLMとして、応募15モデルから国産7モデルを選定しました。tsuzumi 2はその1つです。
「源内」とは
「源内」はデジタル庁が運営する政府職員向け生成AI利用環境で、全府省庁39機関・約18万人規模での利用が想定されています。海外クラウドLLMをそのまま使うのではなく、国内法令・データ主権・セキュリティ要件を満たす国産LLMを比較評価し、本格調達につなげる枠組みです。
選定された7モデル
モデル | 提供元 | 主な位置づけ |
|---|---|---|
tsuzumi 2 | NTTデータ/NTT | 軽量・日本語特化・業界知識強化 |
Llama-3.1-ELYZA-JP-70B | KDDI/ELYZA | Llama 3.1ベースの日本語強化 |
Sarashina2 mini | ソフトバンク | 軽量・日本語特化 |
cotomi v3 | NEC | エンタープライズ向け日本語LLM |
Takane 32B | 富士通 | 32Bクラスの日本語強化モデル |
PLaMo 2.0 Prime | Preferred Networks | フルスクラッチ純国産 |
CC Gov-LLM | カスタマークラウド | 行政特化LLM |
出典: デジタル庁ガバメントAI源内 国産LLM選定結果(2026/03/06 PDF) / ITmedia AI+ 2026/03/06報道
tsuzumi 2が選ばれた評価ポイント
デジタル庁の選定基準では、日本語性能・データ主権・学習データに関する法令遵守状況・運用形態の柔軟性などが評価軸となりました。tsuzumi 2は、フルスクラッチ純国産・1GPU運用の軽量さ・日本語性能・業界特化知識の組み合わせが評価されたと報じられています。
今後のスケジュール
時期 | 内容 |
|---|---|
2026年3月〜 | 源内向け契約・技術調整 |
2026年5月頃 | 実証開始 |
2026年8月頃 | 試用開始(全府省庁規模で順次) |
2027年1月 | 評価結果公表 |
2027年4月 | 政府本格調達開始予定 |
「政府正式採用」と断定するのは早計で、現時点では「試用LLMとして選定されている段階」です。ただし2027年4月の本格調達に向けて、自治体・公共系の調達でも今後tsuzumi 2を含む国産LLMの存在感が増すことは確実視されています。
tsuzumi 2の活用事例

出典: NTT公式リリース
公開されている主な導入・検証事例は以下の通りです。
東京通信大学(学内LLM基盤)
tsuzumi 2を学内LLM基盤として導入。学生個人情報をオンプレミスで管理しながら、QA自動化・レポート評価支援等に活用しています。教育機関で個人情報を外部クラウドに出さずにLLMを運用する代表例です。
中国電力×NTTドコモビジネス(電力業務特化LLM)
2026年1月26日、中国電力がNTTドコモビジネスと組み、tsuzumi 2をベースに電力業務特化型LLMの構築・検証を開始しました。電力業務マニュアル・行政申請書類などを学習させ、2026年度以降の実用化を目指しています。規制業種でアダプターチューニングを使った特化モデル開発の代表的事例です。
NTTドコモビジネス×富士フイルムビジネスイノベーション
tsuzumi 2を活用した新しい生成AIソリューション開発に向けた協業検討を開始しています(2025年内発表)。
NTTデータ先端技術「INTELLILINK Private AI スタートパック」
2026年4月20日、INTELLILINK Private AI スタートパックでtsuzumi 2の対応検証を開始。中堅・中小企業がオンプレミスでプライベートAI環境を立ち上げる際のスタートキットとして提供される見込みです。
引き合い状況
NTT島田社長は2026年2月の決算会見で、2025年度Q3(4-12月)時点で国内引き合いが約2,000件に達し、地方自治体・金融機関・医療機関を中心にクローズドAI需要が顕在化していると説明しています。
料金・導入方法

公式の料金表は公開されていない
tsuzumi 2は法人・公共機関専用のB2Bモデルで、公開価格表はありません。導入はNTTデータ、NTTドコモビジネス、NTT東日本ビジネスイノベーションなど、NTTグループ各社経由の個別商談ベースとなります。
提供形態(3パターン)
提供形態 | 主な特徴 | 想定される選び方 |
|---|---|---|
オンプレミス | 自社データセンターで完結。最高レベルの機密性 | 行政・医療・防衛・電力など、データを外に出せない用途 |
プライベートクラウド | 専用環境のクラウドで運用 | 自社にDC設備を持たない企業 |
Microsoft Azure(順次拡充) | Azure AI Foundry経由のMaaS(Models as a Service) | 既にAzureを使っているエンタープライズ |
※前世代tsuzumi 7BはAzure AI Foundryで提供中。tsuzumi 2のAzure提供詳細は順次拡充中とされており、最新の対応状況は公式に要確認です。
コスト構造の目安
業界メディア試算と一般的なオンプレLLM運用の構造を踏まえると、コスト要素は概ね以下に分かれます。
費用項目 | 目安 | 備考 |
|---|---|---|
ハードウェア(GPU等) | 約500万円〜(A100 40GB 1基構成) | 業界メディア試算。冗長化や複数拠点では追加 |
ライセンス/月額利用料 | 個別商談 | 利用規模・チューニング内容で変動 |
導入カスタマイズ | 個別見積 | アダプターチューニング、社内データ統合等 |
運用保守 | 個別見積 | NTTグループのサポート契約等 |
70B級海外モデルを自社運用する場合と比べてハードウェア初期費用で1/10〜1/20になり得るとされており、これがtsuzumi 2の経済合理性の根拠の一つになっています。
個人利用は不可
ChatGPTやClaudeのようにブラウザから個人で使うサービスは提供されていません。個人利用を想定する場合はtsuzumi 2は対象外で、ChatGPT・Claude・Geminiなど他のサービスを検討してください。
ChatGPT・Claude・Geminiとの使い分け
tsuzumi 2は「汎用大規模モデル」ではなく「日本企業のクローズド業務に最適化された軽量LLM」です。性能の高さで一律比較するものではなく、用途で使い分ける前提が必要です。
観点 | tsuzumi 2 | ChatGPT(GPT-5系) | Claude Opus 4.x | Gemini 3 Pro |
|---|---|---|---|---|
提供形態 | オンプレ/プライベート可 | クラウド(API/SaaS) | クラウド(API/SaaS) | クラウド(API/SaaS) |
個人利用 | 不可 | 可 | 可 | 可 |
日本語性能 | 同サイズ帯トップ主張 | 高水準 | 高水準 | 高水準 |
汎用性能 | 限定的(業務特化) | 非常に高い | 非常に高い | 非常に高い |
コーディング | 限定的 | 高性能 | 業界トップ級 | 高性能 |
長コンテキスト | 標準(公式未明記) | 長い | 非常に長い | 非常に長い |
データ主権 | ◎(純国産・国内法令準拠) | △(米国系クラウド) | △(米国系クラウド) | △(米国系クラウド) |
機密データ運用 | ◎(オンプレ可能) | ○(API契約次第) | ○(API契約次第) | ○(API契約次第) |
ベース料金 | 個別商談 | 月額20ドル〜/API従量 | 月額20ドル〜/API従量 | 月額20ドル〜/API従量 |
主な向き不向き | 規制業種・公共・社内RAG | 個人〜全社の汎用利用 | 高度なコーディング・長文 | Google基盤との統合 |
汎用的な業務(資料作成補助、コード生成、海外情報リサーチ等)には海外大規模モデルが優位なケースが多く、日本語の機密文書・行政文書・規制業種の業務システム連携ではtsuzumi 2の優位性が出やすいという棲み分けです。
関連記事:
tsuzumi 2が向いている企業/向いていない企業
こんな企業・組織におすすめ
- 金融機関(銀行・証券・保険):顧客情報や取引情報を外に出せない業務でのRAG・要約・問い合わせ対応
- 医療機関・製薬:診療情報・治験データなど、プライバシー・規制要件が厳しい領域
- 官公庁・自治体:行政文書作成支援、職員向け対話AI、住民問い合わせ補助。源内の本格調達も視野
- 電力・ガス・水道などインフラ:業務マニュアル・規制申請書類の活用(中国電力の事例参考)
- 大手製造業の社内ナレッジ活用:技術文書・特許・社内規定をオンプレで扱いたい企業
- 教育機関:学生個人情報を外部クラウドに出さない学内LLM運用(東京通信大学事例)
- データ主権を経営要件に据えている組織:海外クラウドLLMを原則として使えない案件
おすすめしない企業・利用シーン
- 個人ユーザー:個人向け公開サービスがないため、ChatGPT・Claude・Geminiを検討
- 海外展開を主軸とする企業:多言語対応・グローバル汎用性ではGPT-5、Claude、Geminiが強い
- コーディング・複雑な数学・超長文処理が中心の業務:海外大規模モデルが優位
- GPU等のインフラ投資が難しい中小企業(オンプレ前提の場合):MaaS型での提供が成熟するまで待つ判断もある
- 試しにすぐ触ってみたいだけのフェーズ:B2B商談ベースのため、PoCまでに時間がかかる
導入時の注意点
1. 「政府採用」の表現は正確に
tsuzumi 2はデジタル庁源内の試用LLMとして選定された段階で、本格調達は2027年4月以降の予定です。社外向け資料や提案書で「政府正式採用」と表現すると誤解を招くため、「源内の試用LLM7モデルに選定」など正確な表現を使うことが重要です。
2. 公式未公開項目はベンダーに直接確認
以下は公式に明記されていない/業界メディア由来の項目で、導入検討では必ずNTTグループに直接確認してください。
- 正式な料金表・年間利用料の構造
- コンテキストウィンドウ長
- ライセンス条項の詳細(商用利用範囲・派生モデルの扱い)
- 学習データセットの詳細
- AWS/Google Cloud等への対応有無
- マルチモーダル機能の正式提供範囲(視覚読解はアダプター技術として研究進行中)
3. 「同サイズ帯トップ」と「全モデルでトップ」は別の話
tsuzumi 2のベンチマーク優位性はGemma-3 27B、Qwen-2.5 32Bなど同程度のサイズの競合に対して主張されているものです。GPT-5やClaude Opus 4.x、Gemini 3 Proなどの超大規模モデルとの比較ではタスク次第で優劣が分かれるため、PoCで自社業務シナリオで実測することを推奨します。
4. オンプレ運用は導入後の運用負荷も考慮
オンプレミスはデータ主権・機密性で強みがありますが、GPU・OS・ライブラリ・モデル更新などのライフサイクル管理は自社負担になります。NTTグループの保守契約、INTELLILINK Private AI スタートパックのようなマネージド支援メニューを併用するのが現実的です。
5. アダプターチューニングを生かすには「教材整備」が鍵
学習データを1/10に圧縮できるとはいえ、良質な業務データ・教材を整備する内製能力が成果を左右します。導入前に「どの業務をどのデータで特化させるか」のスコープを社内で決め切ることが重要です。
よくある質問(FAQ)
Q1. tsuzumi 2は無料で使えますか?
いいえ。tsuzumi 2は法人・公共機関向けのB2Bモデルで、無料の個人向け公開サービスは提供されていません。導入はNTTグループ経由の個別商談となります。
Q2. ChatGPTより性能が高いのですか?
汎用的な性能ではGPT-5などの大規模モデルが優位な領域が多くあります。tsuzumi 2の優位性は「1GPUで動く軽量さ」「同サイズ帯(30B前後)モデルでの日本語性能」「オンプレで機密データを扱える運用形態」の組み合わせにあります。「全方位でChatGPTより上」という性質のモデルではない点に注意してください。
Q3. クラウドではなくオンプレミスで使うべき理由は?
行政文書、患者情報、金融取引、技術機密など、外部クラウドに出すことが規制・契約・社内ポリシー上難しいデータを扱うためです。海外クラウドLLMを使えない要件の業務こそ、tsuzumi 2の本領が出ます。
Q4. 政府の正式採用が決まったのですか?
現時点(2026年4月)では、デジタル庁源内の試用LLM7モデルとして選定された段階です。2026年5月頃の実証開始、8月頃の試用開始を経て、2027年1月に評価結果が公表され、2027年4月から政府本格調達が予定されています。「政府正式採用」と表現するのは早計で、「源内試用LLMに選定」と正確に表現するのが妥当です。
Q5. 必要なハードウェアは何ですか?
NVIDIA A100 40GBが1基あれば推論可能とされています。業界メディア試算では、ハードウェア構成で約500万円程度からスタート可能。冗長化、複数拠点展開、複数チューニング基盤の同時運用などを行う場合は追加投資が必要です。
Q6. 前世代のtsuzumi(7B)から乗り換えるべき?
ユースケースによります。日本語性能・RAG精度・業界特化知識・JSON出力など多くの面でtsuzumi 2は強化されているため、精度に課題を感じていた既存ユーザーは検証する価値があります。一方で、現行7Bで十分に成果が出ている用途であれば、コスト最適化の観点から両世代併用も選択肢になります。
Q7. tsuzumi 2はマルチモーダル(画像認識)に対応していますか?
NTTはアダプター技術を応用し、画像・表・グラフ・フローチャート・写真などを認識する視覚読解機能の研究を進めていると発表していますが、tsuzumi 2正式版に標準搭載されているか・どのような提供形態かは公式に詳細が示されていません。最新の対応状況はNTTグループに直接確認してください。
Q8. 海外でも使えますか?
tsuzumi 2は日本企業・日本の公共機関を主要顧客と位置付けたモデルです。海外展開・多言語対応はGPT-5、Claude、Gemini等の汎用大規模モデルに強みがあります。
まとめ:tsuzumi 2は「日本企業の機密業務に最適化された30B純国産LLM」
tsuzumi 2は、「軽量さ・日本語性能・データ主権の3つを同時に満たす数少ないエンタープライズLLM」として、2025年10月の提供開始以降、地方自治体・金融機関・医療機関・電力会社・大学などから2,000件規模の引き合いを集めています。2026年3月にはデジタル庁源内の試用LLM7モデルにも選定され、2027年4月の政府本格調達に向けた評価フェーズに入りました。
「ChatGPTやClaudeの代替」というより、それらが構造的に使えない・使いにくい業務領域でこそ価値を発揮するモデルです。検討の出発点は次の3問です。
- データを外部クラウドに出せない業務か?
- 日本語特化+業界特化知識が必要か?
- 1GPU運用で経済合理性を確保できる規模感か?
3問すべてに「Yes」と答えられる業務であれば、tsuzumi 2は最有力候補の一つになります。料金・ライセンス・対応プラットフォームなどの公式未公開項目は必ずNTTグループに直接確認のうえ、PoCで自社シナリオで実測する進め方を推奨します。
あわせて読みたい
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

Anthropic × Gates Foundation 2億ドルパートナーシップとは|医療・教育・農業AIへのClaude活用と助成金詳細【2026年5月発表】
2026/05/14

freee MCP 使い方 完全ガイド|クレジットカード仕訳・消込の実務フローを解説
2026/04/06

Claude Opus 4.7がMicrosoft 365 Copilotのデフォルトに|Excel/PowerPoint先行・Wordは夏・2つの統合の違いを徹底解説【2026年5月】
2026/05/14

Gemini 3.2 Flashとは|$0.25/M入力リーク・3.1 Pro超え・iOS先行漏洩を整理【2026年5月最新】
2026/05/07

Claude Platform on AWSとは|Anthropic GA・AWS IAM/CloudTrail・東京リージョン対応・Bedrockとの違い完全ガイド【2026年5月】
2026/05/14

Grokとは?Agent Mode・Grok Imagine使い方・料金【xAI最新】
2026/04/18

