楽天 Rakuten AI 3.0 = DeepSeek V3 リブランド炎上まとめ|GENIAC補助金・国産LLMの定義を揺るがした大事件徹底解説

この記事のポイント
楽天がGENIAC補助金を受けて開発した「Rakuten AI 3.0」がDeepSeek V3ベースと判明した炎上事件を完全解説。技術的証拠・ライセンス問題・国産LLMの定義問題・企業と個人の利用判断まで一冊にまとめました。
楽天グループが2026年3月17日に「国産AI」として発表した Rakuten AI 3.0 は、公開直後に設定ファイルから中国AI企業 DeepSeek のオープンモデル DeepSeek V3 をベースとして利用していることが技術者に発覚し、X(旧Twitter)で約3万件の投稿を集める炎上事態に発展しました。
この記事では、何が起きたのか・何が問題で何が問題でないのか・GENIAC補助金との関係・国産LLMの定義問題を事実ベースで整理し、企業・個人がRakuten AI 3.0をどう評価・活用すべきかの判断材料を提供します。
この記事でわかること:
- 炎上の全貌と経緯(完全タイムライン)
- config.jsonに何が書いてあり、何が発覚したか
- ライセンス問題の実態(違反なのか、違反でないのか)
- GENIAC補助金と国産AI開発の課題
- 「国産LLM」の定義問題
- DeepSeekベースモデルのセキュリティリスクの正しい理解
- Rakuten AI 3.0を今使うべきかの判断基準
何が起きたのか — 3分でわかる事件の全貌
結論から言います。
Rakuten AI 3.0 は、楽天が独自開発した「国産AI」として発表されましたが、公開直後に 中国AI企業 DeepSeek のオープンモデル(DeepSeek V3)をベースに追加学習させたモデルであることが技術者によって発覚しました。楽天は当初ベースモデルを「非開示」とし、発覚から10日後の2026年3月27日に初めて DeepSeek 採用を公式認定しました。
問題はDeepSeekを使ったこと自体ではなく、3つの点に集約されます。
問題の軸 | 内容 |
|---|---|
① 透明性の欠如 | 発表時にDeepSeekへの言及がなく、発覚後も10日間「ベースモデルは非開示」と説明した |
② ライセンス問題 | 初回公開時にDeepSeekの著作権表示・ライセンスファイルが欠落(MIT条件違反の可能性) |
③ 公的資金の適正利用 | 経産省・NEDO の「GENIAC」補助金(計算資源支援)を受けていたにもかかわらず、成果物の開発手法が不透明だった |
技術選択の問題(DeepSeekをベースにすること)は業界標準として広く行われており、それ自体は問題ではありません。争点はあくまで「透明性」「ライセンス遵守」「公的資金の使途説明」の3点です。
出典: 楽天グループ 公式プレスリリース(2026年3月17日)
炎上の経緯と完全タイムライン
時系列で整理することで、楽天がいつ何を知っており、いつ何を開示したかが明確になります。
日付 | 出来事 |
|---|---|
2025年7月15日 | 楽天グループがGENIAC第3期公募に採択(経済産業省・NEDO発表)。テーマは「長期記憶メカニズムと対話型学習を融合した最先端の生成AI基盤モデルの研究開発」 |
2025年8月 | GENIAC補助金(計算資源支援)を受けて開発開始 |
2025年12月18日 | 楽天がRakuten AI 3.0の開発を初発表(プレスリリース)。この時点でDeepSeekへの言及なし |
2026年3月17日 | Rakuten AI 3.0をHuggingFaceで正式公開。プレスリリースにDeepSeekへの記述なし。同日、技術者がconfig.jsonを確認し「model_type: deepseek_v3」「DeepseekV3ForCausalLM」の記述を発見。X上で急速拡散 |
2026年3月17日(当日中) | 初回公開時にDeepSeekのMITライセンスファイルが欠落していることが判明。炎上受けてNOTICEファイルを追加(「Copyright (c) 2023 DeepSeek」を記載) |
2026年3月19日 | ITmediaが楽天に取材。楽天は「ベースモデルは非開示」と回答。ITmediaがその旨を報道 |
2026年3月27日 | 楽天広報が「Rakuten AI 3.0においてはDeepSeekのオープンモデルを採用した」と正式認定。発覚から10日後のことだった |
このタイムラインで注目すべきは、楽天が3月19日の取材時点では「非開示」と回答しながら、3月27日に一転して公式認定したことです。発表から10日間、楽天は技術的事実を確認しながら回答を変えていたことになります。
config.jsonで何が発覚したか — 技術的証拠を読む
発覚のきっかけは、技術者がHuggingFaceに公開されたモデルのリポジトリ内 config.json を開いたことでした。
公開されていた設定ファイルには、以下の記述が含まれていました(一部抜粋・要約):
{
"model_type": "deepseek_v3",
"architectures": ["DeepseekV3ForCausalLM"],
...
}これは「このモデルがDeepSeek V3のアーキテクチャを使用している」ことを示す機械可読な情報です。大規模言語モデルの設定ファイルは、モデルの構造を定義するもので、この記述が存在する場合、DeepSeek V3の設計をそのまま採用していることを意味します。
「リブランド」は厳密には正確ではない
炎上の中で「リブランド」という言葉が広まりましたが、技術的に正確な表現ではありません。
表現 | 技術的意味 |
|---|---|
リブランド | 名前だけ変えて中身はまったく同じ |
ファインチューニング | 既存モデルを特定タスク・言語に向けて小規模調整 |
継続事前学習(CPT) | 既存モデルに大量のドメインデータを追加学習 |
楽天は「DeepSeekのオープンモデルを採用し、日本語最適化のための学習を行った」と説明しており、技術的には継続事前学習(Continued Pre-Training)またはファインチューニングにあたると考えられます。ただし、どの程度の独自学習が行われたかは現時点(2026年4月29日)で公式に詳細説明されていません。
批判的な文脈で「リブランド」という表現が使われたのは、「名前だけ変えて国産AIと称した」という印象論的な批判であり、厳密な意味での技術評価ではありません。本記事では正確性を優先し、「DeepSeek V3をベースとして採用・追加学習」と表記します。
ライセンス問題の実態 — 何が違反で、何が違反でないか
最も混乱が多かった論点がライセンス問題です。整理します。
DeepSeek V3のライセンスとは
DeepSeek V3は DeepSeekライセンス(MIT類似)のもとで公開されています。このライセンスは:
- 商用利用: 許可
- 派生モデルの作成・配布: 許可
- 著作権表示・ライセンス文の保持: 義務
つまり、DeepSeek V3をベースにした派生モデルを作って商用配布すること自体は、ライセンス上問題ありません。
問題が生じたポイント
問題は 「著作権表示・ライセンス文の保持義務」 でした。
段階 | 状況 |
|---|---|
初回公開(3月17日) | DeepSeekの著作権表示・ライセンスファイルが欠落していた |
発覚・炎上後(3月17日中) | NOTICEファイルを追加。「MITライセンス条文 + Copyright (c) 2023 DeepSeek」を記載 |
現状(Apache 2.0配布) | Rakuten AI 3.0はApache 2.0で配布。NOTICEファイルでDeepSeekのMITライセンスを帰属表示 |
初回公開時の著作権表示欠落は、MITライセンスの条件違反に相当する可能性がありました。楽天は炎上後の当日中にNOTICEファイルを追加し、現在は適切な帰属表示が行われている状態です。
重要な結論: 現在のRakuten AI 3.0のライセンス状況は、ライセンス的に問題のない状態に是正されています。初回公開時の著作権表示欠落は、意図的なものか単純なミスかは不明ですが、速やかに修正されました。
出典: deepseek-ai/DeepSeek-V3 — Hugging Face
GENIACとは何か — 国家補助金と「国産AI」開発の関係
この炎上が単なる「企業の透明性問題」を超えて社会的議論を呼んだ最大の理由は、国家補助金「GENIAC」との絡みです。
GENIACの概要
GENIAC(Generative AI Accelerator Challenge) は、経済産業省とNEDO(新エネルギー・産業技術総合開発機構)が2024年2月に開始した、日本の生成AI開発力を国際水準に引き上げることを目的とした支援プロジェクトです。
- 支援内容: GPU等の計算資源の利用料補助(Microsoft Azureを通じて提供)
- 採択条件: 日本の企業・団体による生成AIの基盤モデル開発
- 第3期: 2025年7月15日に楽天グループを含む新規13件を採択
楽天のGENIAC採択テーマは「長期記憶メカニズムと対話型学習を融合した最先端の生成AI基盤モデルの研究開発」でした。
補助金額について(重要:未確認情報に注意)
補助金の具体的な金額については、以下の状況です:
- 公式発表: 楽天プレスリリースに「本モデルの学習費用の一部は、GENIACの補助を受けています」と明記。ただし金額は非公開
- 一部メディア報道: 「約30億円相当の計算資源助成」「最大5億円の補助」との記述あり。いずれも根拠未確認の情報
- NEDOの公式採択発表: 金額の記載なし
本記事では金額の断定を避け、「GENIAC補助金(計算資源支援)を受けて開発された」という確認済みの事実のみ記載します。
炎上で浮上した制度的課題
このGENIAC絡みの問題こそが、研究者・有識者の間で最も深刻に受け止められた点でした。
GENIAC制度の課題(2026年3月時点):
- ベースモデルの開示義務が明文化されていない — フルスクラッチ開発か既存モデルベースかを問わない
- 補助率の差分がない — 数百億円かけて一から開発した場合も、既存モデルをファインチューニングした場合も同じ扱い
- 成果物の情報開示基準が曖昧 — 「何を独自開発として開示するか」の基準がない
「公的資金を使って既存の海外オープンソースモデルを調整しただけなら、何が日本の技術力の強化につながったのか」という疑問が多くの有識者から提起されました。
現時点(2026年4月29日)では、経産省・NEDOからこの問題への公式コメントや制度改訂の発表は確認されていません。
「国産LLM」とは何か — 定義不在が招いた混乱
今回の炎上が業界全体に与えた最大の影響は、「国産LLM」の定義問題を突きつけたことです。
現時点(2026年4月29日)において、「国産LLM」「国産AI」を定義する法的・制度的な規定は存在しません。
国産度の段階的な分類(整理例)
有識者・技術者の議論から見えてきた「国産度」の段階的分類を整理すると、以下のようになります。
レベル | 内容 | 主な例 |
|---|---|---|
Level 1: フルスクラッチ | アーキテクチャ設計・事前学習データ・学習インフラをすべて独自構築 | NTT tsuzumi 2、PLaMo 3.0 Prime(Preferred Networks) |
Level 2: アーキテクチャ独自 + 独自学習データ | オリジナルのモデル構造に大量の独自データで学習 | (現在の日本では極めて少数) |
Level 3: 既存アーキテクチャ + 独自学習データ | Transformerなど既存の設計を採用し、日本語データ等で独自学習 | LLM-jp等 |
Level 4: 既存モデルベース + 継続学習・ファインチューニング | オープンソースの海外モデルをベースに日本語・独自データで調整 | Rakuten AI 3.0(今回のケース)、業界の多数派 |
Level 5: ラッパー | 他社モデルのAPIを組み合わせたシステム・アプリケーション | 多数 |
現実には、完全な Level 1 を実現できる日本企業は非常に限られています。フルスクラッチで大規模LLMを開発するには数十億〜数百億円規模の投資とGPUリソース、そして高度な人材が必要です。
日経新聞の調査(情報未確認:要注意) として「日本企業の主要モデル10本のうち6本がDeepSeekまたはQwenをベースとした二次開発」との報道もあるとされますが、これは未確認情報です。ただし、Level 4が現在の日本LLM産業の「標準的な実態」であることは業界関係者の間では広く認識されています。
純国産フルスクラッチの代表例
モデル | 開発元 | 特徴 |
|---|---|---|
NTT tsuzumi 2 | NTT | 30Bパラメータ、フルスクラッチ、政府「ガバメントAI(源内)」試験選定モデル |
PLaMo 3.0 Prime | Preferred Networks | フルスクラッチ国産LLM、2026年3月19日公開 |
こうした Level 1 開発には莫大なコストがかかり、多くの企業にとって現実的ではないのも事実です。
本質的な問いかけ: 「何をもって国産AIと呼ぶか」の基準がないまま、国家補助金が「国産AI開発」の名目で配分されている現状は制度設計の課題です。楽天のケースは技術選択の問題というより、「国産AIとは何か」を社会・制度が問い直す契機になったと言えます。
詳しくは、NTT tsuzumi 2とは|政府ガバメントAIに選定された純国産LLMの全貌もご参照ください。
楽天の公式コメントと対応 — 事実のみを整理
楽天から発出された公式見解を事実ベースで整理します。
2026年3月27日の公式認定コメント(全文要旨):
「AIのオープンソースの重要性の認識に加え、AIコミュニティおよび日本の全企業が最新AI技術を習得し、独自のインテリジェンスを構築できる環境づくりへの貢献を目指す総合的な判断」
「データ漏洩のリスクがないこと、バックドアやその他の悪意のある操作がないことを分析・確認」
「一からモデルを構築するのは開発コストがかさみ、高コストとなる。オープンモデルをベースにするほうが、低コストで高性能かつ費用対効果の高いモデルを提供するという目的に沿ったもの」
この説明の論旨は理解できるものですが、発表当初のプレスリリースに同様の説明が含まれていなかった理由については言及がありません。オープンソースを活用することの正当性を説明する前に、なぜ最初から開示しなかったのかを説明することが、信頼回復には不可欠と多くの専門家が指摘しています。
DeepSeekベースモデルの安全性 — 「中国製=危険」は誤解
今回の炎上で多く見られた誤解の一つが、「DeepSeek製だから危険」という安易な結論です。セキュリティの専門家・山口健太氏(Yahoo!ニュース エキスパート)も指摘しているように、この問題は正確に分けて考える必要があります。
リスクが実際に高い条件
DeepSeek社のAPIサービスを直接使う場合:
- リクエスト・レスポンスデータが中国のサーバーを経由する可能性がある
- DeepSeek社のデータ取扱いポリシーが中国の法規に従う可能性がある
リスクが大幅に下がる条件
HuggingFace等で公開されたオープンモデルをダウンロードしてローカル・閉域環境で動かす場合:
- 中国サーバーへのデータ送信は原理的に発生しない
- Rakuten AI 3.0はHuggingFaceで重みファイルが公開されており、ダウンロードしてオンプレミス・クローズド環境で運用することが可能
注意すべき残存リスク(セキュリティ)
一方で、DeepSeek V3そのものには、第三者機関(Palo Alto Networks Unit 42等)が以下を確認しています:
- 脱獄手法への脆弱性:特定のプロンプトパターンで安全性ガイドラインを回避できる可能性
- 有害コンテンツ出力のリスク:ガードレールの強度が他の主要モデルに比べて弱い可能性
これはDeepSeek V3の特性であり、その上に構築されたRakuten AI 3.0も同様のリスクを一定程度継承している可能性があります。楽天は「バックドアや悪意ある操作がないことを確認」とコメントしていますが、脱獄脆弱性については独自評価が必要です。
企業導入時の推奨対策:
- クローズド環境(オンプレミスまたはVPC内)での運用
- 出力内容の人間によるレビューフロー
- レッドチーム評価の実施
- 個人情報・機密情報の入力禁止ルールの整備
生成AIのセキュリティリスクについては、生成AIセキュリティリスク|企業導入時に知っておくべき10のポイントもご参照ください。
Rakuten AI 3.0の技術性能 — DeepSeekベースでも日本語性能は本物
炎上の影響で見落とされがちですが、Rakuten AI 3.0の日本語性能は確かに高いという点は事実として評価する必要があります。
技術スペック
項目 | 値 |
|---|---|
総パラメータ数 | 約671億(671B) |
アクティブパラメータ数 | 約37億(37B)※MoE構造による |
アーキテクチャ | MoE(Mixture of Experts)型、128エキスパート |
コンテキスト長 | 128,000トークン(128K) |
量子化対応 | FP8 |
対応言語 | 日本語・英語(バイリンガル) |
ライセンス | Apache 2.0(NOTICEファイルにDeepSeekのMIT帰属表示) |
公開場所 | HuggingFace(Rakuten/RakutenAI-3.0) |
日本語ベンチマーク結果(楽天公式発表)
楽天の公式発表によると、複数の日本語ベンチマークでGPT-4oを上回る結果を出しています。
ベンチマーク | Rakuten AI 3.0 | GPT-4o |
|---|---|---|
JamC-QA(日本文化・歴史知識) | 76.9 | 74.7 |
MMLU-ProX(大学院レベル推論) | 71.7 | 64.9 |
MATH-100(競技数学) | 86.9 | 75.8 |
M-IFEval(指示遵守能力) | 72.1 | 67.3 |
日本語MT-Bench | 8.88 | 8.67 |
ただし、これらはすべて楽天の自社発表によるもので、第三者による独立した評価は現時点で限られています。ベンチマーク結果の解釈は慎重に行う必要があります。
利用形態
利用形態 | 内容 | 費用 |
|---|---|---|
HuggingFaceモデル | 重みファイルのダウンロード・ローカル運用 | 無料(Apache 2.0) |
Webアプリ(ai.rakuten.co.jp) | ブラウザから利用可能。楽天IDが必要 | 無料(ベータ版) |
Rakuten AI for Business | 法人向けソリューション | 個別問い合わせ |
利用上の注意点: HuggingFaceのモデルは673GBの重みファイルをダウンロードする必要があり、高性能GPU環境が必須です。Webアプリ版はベータ段階のため、機能・利用条件が変更される可能性があります。
Rakuten AI 3.0を今使うべきか — 個人・企業別の判断基準
こんな方・組織に向いています
個人利用:
- 無料で日本語性能の高い大規模LLMを試したい方
- オープンソースモデルをローカル環境でカスタマイズして使いたい開発者
- 楽天サービスと連携したAI機能を試したい方
企業利用:
- オンプレミス・クローズド環境で日本語LLMを運用したい企業
- 海外APIサービスへのデータ送信を避けたいセキュリティ要件の強い組織
- 楽天グループのサービス(楽天市場・楽天トラベル等)との連携を検討している事業者
- Apache 2.0ライセンスの範囲で商用利用したい企業
こんな方・組織にはおすすめしません
個人利用:
- 深く考えずに「国産AIだから安全」という理由だけで選ぼうとしている方
- ベンチマーク主張を独立した第三者評価なしに信用することに不安がある方
企業利用:
- ベースモデルの透明性・説明責任を重視する調達基準を持つ組織
- 673GBモデルを運用できる十分なGPUインフラがない企業
- デモや楽天サービスとの連携以外の具体的な用途が定まっていない場合
- 医療・金融など高度なコンプライアンス要件が課される分野(別途詳細評価が必要)
代替を検討する場合
純国産フルスクラッチのLLMを優先したい場合は、NTT tsuzumi 2が政府「ガバメントAI」にも選定されており、日本語性能と透明性の両立という観点で有力な選択肢です。
グローバルな主要モデルとの比較が必要な場合は、生成AIツールおすすめ比較をご参照ください。
今回の炎上が残したもの — 業界と社会への示唆
問題を3層に整理する
今回の事件で問題とすべき点と、問題とすべきでない点を明確に分けます。
問題とすべき点:
- 発表時の透明性の欠如 — DeepSeekベースであることを最初から開示しなかった
- 初回公開時のライセンス遵守漏れ — 著作権表示ファイルが欠落していた
- 発覚後10日間の「非開示」対応 — 問題が発覚してから公式認定までの間の回答が不誠実
問題とすべきでない点:
- DeepSeekを採用したこと自体 — オープンソースモデルを活用することは業界標準の手法であり、技術的合理性がある
- 完全フルスクラッチ開発でないこと — 大規模LLMのフルスクラッチ開発は現実的にごく少数の組織にしかできない
- 日本語性能の高さ — ベンチマーク結果は事実として評価すべき
業界全体への波及
この炎上の余波として、「他の日本企業LLMも実はDeepSeek/Qwenベースでは?」という疑義が広がり、国産LLMを名乗る複数のモデルの開示水準が問い直されるきっかけとなりました。
求められる制度的対応
有識者から提起されている改善点をまとめます:
課題 | 求められる対応 |
|---|---|
「国産LLM」の定義 | フルスクラッチ/継続学習/ファインチューニングのレベルを開示する業界標準の策定 |
GENIAC制度 | ベースモデルの開示義務化・補助率の差分設計 |
公的資金の説明責任 | 成果物の技術的独自性の開示を義務付けるガイドライン |
透明性の文化 | 開示するほど評価される業界規範の形成 |
よくある質問(FAQ)
Q1. Rakuten AI 3.0を使うのは法的に問題ないですか?
現時点では問題ありません。Rakuten AI 3.0はApache 2.0ライセンスで公開されており、NOTICEファイルにDeepSeekの著作権帰属表示も記載されています。商用利用・派生物作成も許可されています。ただし、ライセンス条文を自身で確認し、弁護士等に相談することを推奨します。
Q2. DeepSeekベースのモデルを使うと中国政府にデータが送られますか?
HuggingFaceからモデルをダウンロードして自社環境(オンプレミス・閉域クラウド)で運用する場合、原理的にデータが中国政府に送られる経路はありません。問題になるのはDeepSeek社のAPIサービスを使う場合です。Rakuten AI 3.0はオープンソースモデルなので、ローカル運用であれば中国へのデータ送信リスクはありません。
Q3. 楽天は最初からDeepSeekベースと知っていたのでしょうか?
開発元である楽天が自社モデルのベースを知らないとは考えられません。3月19日の取材時に「ベースモデルは非開示」と回答したことから、意図的に公開しなかった可能性が高いと見られています。ただし意図・経緯については楽天の公式説明がなく、確定的な事実は不明です。
Q4. GENIAC補助金の返還を求める声は出ていますか?
2026年4月29日時点で、経産省・NEDOから補助金返還要求に関する公式発表はありません。また、GENIACの補助は計算資源の利用料支援であり、「フルスクラッチ開発であること」の義務付けがないため、制度上の返還根拠があるかどうかも不明確です。
Q5. 今後Rakuten AI 4.0でも同じ問題が起きる可能性はありますか?
今回の炎上を受けて、楽天がより詳細な技術開示を行う方向に動く可能性はあります。ただし具体的な方針変更の発表は現時点(2026年4月29日)でありません。今後の動向は公式サイト・プレスリリースで確認することを推奨します。
Q6. 他の「国産AI」も同様のケースがあるのではないでしょうか?
可能性はあります。業界関係者の間では、Level 4(既存モデルベースのファインチューニング)が現在の日本LLM産業の実態の多数派とする見方があります。「国産LLM」を名乗るすべてのモデルに対して、開発手法の透明な開示を求めることが業界全体の信頼性向上につながります。
まとめ
楽天 Rakuten AI 3.0 の炎上事件を整理すると、本質的な問題はDeepSeekを使ったことではなく、透明性の欠如と初期のライセンス遵守漏れにありました。
この事件から得られる3つの教訓:
- 技術選択の正当性と、開示の誠実さは別の問題 — オープンソース活用は合理的だが、それを最初から説明する誠実さが信頼を生む
- 「国産AI」の定義を社会・制度が早急に整備する必要がある — 定義なき「国産」を名乗ることが誤解を生む構造を変えなければならない
- GENIAC等の公的資金支援制度には、成果物の技術的独自性の開示義務が必要 — 制度の透明性が産業全体の健全な発展を支える
Rakuten AI 3.0 の日本語性能は実際に高く、Apache 2.0でオープン公開されている点は評価できます。今後の楽天の対応と透明性向上に期待しつつ、技術的実力と信頼性の両面で評価していくことが重要です。
関連記事:
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

OpenAI × Microsoft 新パートナーシップ完全解説|マルチクラウド解禁・収益分配の真相・非独占ライセンスをわかりやすく整理
2026/04/28

Google × Anthropic 400億ドル投資パートナーシップ徹底解説|100億ドル即時+300億ドル条件達成・5GW TPU・3,500億ドル評価額の意味
2026/04/28

Claudeコネクタの使い方|Spotify・Uber Eats・TurboTax・Booking.com連携の完全ガイド
2026/04/28

ChatGPT for Cliniciansとは?米国医師・NP・PA・薬剤師向け無料医療AIとHealthBench Professionalを徹底解説
2026/04/28

ガバメントAI「源内」とは?デジタル庁OSS公開・18万人政府職員向け生成AI環境の使い方を徹底解説
2026/04/28

Ineffable Intelligenceとは?David Silver創業・$1.1Bシード・$5.1B評価額・欧州史上最大ラウンドを徹底解説
2026/04/27

