Sarashina3とは?SB Intuitions開発の国産LLMの5モデル・性能・料金・tsuzumi比較を整理【2026年最新】

この記事のポイント
国産LLM「Sarashina3」を一次情報ベースで解説。SB Intuitionsが開発したmini/nano/guard/embedding/rerankの5モデル構成、30兆トークン学習の日本語性能、Cloud PF Type Aの料金体系、Sarashina2・tsuzumi 2との違いまでまとめて整理します。
Sarashina3(さらしな3)は、ソフトバンク傘下のSB Intuitionsがフルスクラッチで開発した最新の国産LLM(大規模言語モデル)シリーズです。mini/nano/guard/embedding/rerankという用途別の5モデルで構成され、約30兆トークンの学習データによる日本語性能と、国内データセンターで運用する「ソブリン性(データ主権)」を強みに、企業・自治体の業務実装を狙って2026年6月30日に提供が始まりました。
この記事では、以下を一次情報(SB Intuitions公式ブログ・ソフトバンク公式発表)ベースで整理します。
- Sarashina3が「何者」で、従来の生成AIと何が違うのか
- 5モデル(mini/nano/guard/embedding/rerank)の役割と使い分け
- 30兆トークン学習・日本語ベンチマークで示された性能
- 提供基盤「Cloud PF Type A」と料金体系(分かっている範囲/非開示の範囲)
- 前世代Sarashina2・NTT「tsuzumi 2」・PFN「PLaMo 3.0 Prime」との違い
- どんな企業・自治体に向いているか、向いていないか
想定読者は、社内でのLLM導入・RAG構築・データ主権対応を検討している情報システム担当者やDX推進担当、そして国産LLMの最新動向を押さえたいビジネスパーソンです。生成AIそのものの基礎から知りたい場合は、あわせて生成AIとは何かの解説記事も参照してください。
Sarashina3とは:一文でわかる基本定義

出典:SB Intuitions株式会社公式サイト(sbintuitions.co.jp)
Sarashina3は、SB Intuitions株式会社が独自開発した「業務実装向け」の国産LLMシリーズです。単体のチャットモデルではなく、文章生成・データ処理・安全性判定・文書検索(RAG)までを1つの製品群でカバーする点が最大の特徴です。
基本情報を整理すると次のとおりです。
項目 | 内容 |
|---|---|
名称 | Sarashina3(さらしな3)シリーズ |
開発元 | SB Intuitions株式会社(ソフトバンク傘下) |
種別 | フルスクラッチ開発の国産LLM(第3世代) |
モデル構成 | mini / nano / guard / embedding / rerank の5モデル |
学習データ規模 | 日本語・英語中心に約30兆(30T)トークン |
提供開始 | 2026年6月30日(東日本リージョン)/西日本は2026年10月提供予定 |
提供基盤 | ソブリンクラウド「Cloud PF Type A」(Oracle Alloy採用・国内DC運用) |
主な対象 | 機密情報を扱う企業・自治体、RAGや業務システムへの組み込み用途 |
「フルスクラッチ開発」とは、海外の既存モデルを流用・微調整するのではなく、事前学習の段階から自社データと独自技術で作り上げていることを指します。日本語に最適化された設計と、国内でデータを完結させられる運用体制が、海外製の汎用LLMとの根本的な違いです。
なお、Sarashina3は一般消費者向けの無料チャットアプリとして公開されているわけではなく、Cloud PF Type A経由のAPI/クラウド利用が前提である点は最初に押さえておくべきポイントです。
Sarashina3の5モデル構成:mini/nano/guard/embedding/rerankの役割
Sarashina3を理解する近道は、5つのモデルを「役割の違うチームメンバー」として捉えることです。生成・軽量処理・安全判定・ベクトル化・並べ替えという工程ごとに専用モデルが用意されており、これらを組み合わせることで、生成から検索・安全運用までを一気通貫で構築できます。
5モデル早見表
モデル | 分類 | 主な役割 | 得意な用途 | 課金対応 |
|---|---|---|---|---|
Sarashina3 mini | 標準モデル | 文章生成・エージェント動作・数理的理解 | 対話、複数ツールの自律呼び出し、マルチステップ業務 | 共有型/専有型 |
Sarashina3 nano | 軽量モデル | 定型タスクの大量・低コスト処理 | データ分類、情報抽出、タグ付け | 共有型/専有型 |
Sarashina3 guard | 安全性特化 | テキストの有害性を高速判定 | 入力プロンプト・AI出力の検証、情報漏えい/過激表現の検知 | 共有型 |
Sarashina3 embedding | 埋め込み | テキストをベクトル化 | RAGの文書検索、類似度計算 | 共有型 |
Sarashina3 rerank | リランク | 検索結果の順位を最適化 | RAGの精度向上、指示付きリランキング | 共有型 |
mini:バランス型の主力モデル
miniは、性能と処理速度のバランスを取った標準モデルです。外部APIを自律的に呼び出すエージェント機能と、数学・コーディング・指示追従にかかわる数理的理解力を備えており、カスタマーサポートや複数ツールを横断する業務自動化の中心を担います。エージェント機能そのものの考え方はAIエージェントとは何かの解説でも整理しています。
nano:定型処理を安く大量にこなす軽量モデル
nanoは、データ分類や情報抽出といった判断がシンプルな定型タスクを、低コストで大量に処理する用途に向いた軽量モデルです。「高度な文章を書かせる」よりも、「大量のレコードを高速にさばく」場面で真価を発揮します。
guard:安全運用の門番
guardは、テキストの有害性(過激表現・情報漏えいにつながる内容など)を高速に判定する安全性特化モデルです。入力プロンプトとAIの出力の双方を検証できるため、生成AIを業務に組み込む際のガードレールとして機能します。企業導入で懸念されがちなコンプライアンス面を、モデルレベルで下支えする位置づけです。
embedding:RAGの土台となるベクトル化モデル
embeddingは、文章を数値ベクトルに変換する埋め込みモデルで、RAG(検索拡張生成)における文書検索の土台になります。次元数を大きく削減しても高い検索精度を保てる設計が特徴で、ベクトルデータベースの保存コストを抑えたい現場に向いています。
rerank:検索結果を賢く並べ替える
rerankは、embeddingで絞り込んだ検索結果を、質問の意図に沿ってより適切な順番へ並べ替えるモデルです。日本語リランカーとして「指示付きリランキング」に対応しており、embeddingとセットで使うことでRAGの回答精度を底上げできます。
RAGを本格運用する場合、embeddingで候補を集め、rerankで精度を高め、miniで回答を生成し、guardで安全性を確認する——という4モデル連携が、Sarashina3が想定する典型的な構成です。
Sarashina3でできること:3つの技術的な強み
Sarashina3の実力は、「学習データの質と量」「独自の学習手法」「日本語への作り込み」の3点に集約されます。ここでは一次情報をもとに、専門用語をかみ砕いて整理します。
1. 約30兆トークンの高品質データで事前学習
Sarashina3は、日本語・英語を中心に約30兆(30T)トークンという大規模データで事前学習されています。単に量を積んだのではなく、独自の品質フィルタリングとデータ合成技術、そして易しい内容から段階的に学ぶカリキュラム学習を採用し、データの「質」を重視しているのが特徴です。トークンとは、AIが文章を扱う際の最小単位で、日本語ではおおむね1文字〜数文字に相当します。
2. OPSD+多段階強化学習で「自力で伸びる」設計
事前学習後のポストトレーニングでは、OPSD(on-policy self-distillation=自己蒸留)という手法が使われています。これは、外部の高性能モデルの出力を教師にする代わりに、自らの生成結果から学び直すアプローチです。海外の巨大モデルに依存せず性能を高められるため、国産LLMとしての独立性を保ちやすくなります。これに加え、カスケード学習や非同期強化学習など多段階の強化学習を組み合わせ、ビジネス用途に必要な能力を鍛えています。
3. 日本語の「自然さ・丁寧さ・簡潔さ・実用性」を専任チームが評価
SB Intuitionsは大規模なアノテーション(人手による評価付け)体制を持ち、モデルの出力を「自然さ・丁寧さ・簡潔さ・実用性」の4観点で専任チームが評価し、その結果を強化学習に反映しています。ベンチマークのスコアだけでなく、実務で使ったときの「日本語としての気持ちよさ」まで作り込んでいる点は、海外製モデルにはない国産LLMならではの強みといえます。
そのほか、miniでは複数ツールの同時呼び出しやマルチステップタスクへの対応、数学・コーディング・指示追従の顕著な改善が公式に示されています。
Sarashina3の日本語性能:ベンチマークで示された実力
Sarashina3のmini/nanoは、複数の日本語・数理系ベンチマークで前世代や海外モデルを上回るスコアが公式に報告されています。ただし公式ブログのスコアはmin-max正規化(0〜1)のグラフ表示で、生スコアの数値は非開示です。ここでは「公式主張」として紹介します。
mini/nanoの評価に使われた主なベンチマーク
ベンチマーク | 測定する能力 |
|---|---|
ELYZA-tasks-100 | 日本語の対話・タスク遂行 |
JamC-QA | 日本語の文化・知識QA |
AIME 2025 | 数学(高難度) |
MBPP+ | コーディング |
IFBench | 指示追従 |
BFCL v3 | ツール(関数)呼び出し |
τ2-bench Telecom | エージェント/カスタマーサポート |
Answer Carefully | 安全性 |
比較対象にはQwen3(4B/30B/235B)、GPT-4.1、GPT-5.4 mini(non-reasoning)、前世代Sarashina2 miniなどが挙げられており、日本語文化QAのJamC-QAでは、パラメータ規模で大きく上回るQwen3-235Bを超えるスコアを達成したと報じられています。前世代Sarashina2 miniと比べても、全ベンチマークで大幅な性能向上が示されています。
embeddingの性能:次元を40%減らしても高精度
RAGの土台となるembeddingは、日本語埋め込みの標準ベンチマークJMTEB v1.4.0で具体的な数値が公開されています。
次元数 | JMTEB平均スコア | 補足 |
|---|---|---|
1536(デフォルト) | 78.22 | Retrieval 79.3/Reranking 88.4/Classification 79.15/STS 83.57/Clustering 51.56 |
256 | 75.72 | OSSのruri-v3-310m相当を維持 |
64 | 61.50 | 大幅な軽量化でも実用水準 |
注目すべきは、Matryoshka Representation Learning(MRL)という技術により、1536/1024/512/256/128/64次元を1つのモデルで使い分けられる点です。前世代Sarashina2 embeddingの2560次元から約40%の次元削減を実現しつつ高性能を保っており、ベクトルデータベースの保存コストや検索速度を抑えたい現場にとって実利の大きい進化です。さらに、RETRIEVAL_DOCUMENT/QUERYやSEMANTIC_SIMILARITYなど7種類のタスク指示付き埋め込みに対応し、Qwen3-EmbeddingやGemini Embeddingと同様の最新アプローチを取り入れています。
ベンチマークのスコアはいずれもSB Intuitionsによる測定・公表値です。独立した第三者検証の結果ではない点は、導入判断の際に留意してください。
Sarashina3の料金・提供形態:Cloud PF Type Aで提供

出典:Oracle Cloud Infrastructure公式サイト(oracle.com)
Sarashina3は、ソフトバンクのソブリンクラウド「Cloud PF Type A」経由で提供され、料金は「共有型(従量課金)」と「専有型(月額固定)」の2形態が用意されています。ただし、具体的な単価(円)は公式・報道ともに非開示です。
提供形態の比較
提供形態 | テナント方式 | 課金方式 | 主な用途 | 対応モデル |
|---|---|---|---|---|
共有型(On-Demand) | マルチテナント(リソースを論理分離して共有) | 100万トークンごとの従量課金 | PoC・小規模プロジェクト | mini/nano/guard/embedding/rerank |
専有型(Dedicated) | シングルテナント(顧客専用GPU) | 月額固定料金 | 本番システム・大規模利用 | mini/nano(報道時点) |
共有型は初期コストを抑えやすく、まずは試したいPoCフェーズに向いています。専有型は専用GPUを確保するためコストを予測・管理しやすく、安定稼働が求められる本番システム向けです。
料金で「分かっていること/分かっていないこと」
誠実に整理すると、現時点で公開されているのは課金体系の枠組みのみです。
- ✅ 分かっている:共有型=100万トークン単位の従量課金、専有型=月額固定という2形態
- ❌ 非開示:円建ての具体的な単価、月額固定料金、モデルごとの価格差
そのため、正確なコスト試算にはソフトバンク/SB Intuitionsへの見積もり依頼が必要です。提供基盤そのものの詳細はCloud PF Type Aの解説記事も参考にしてください。本記事では、非開示の価格を推測で断定することは避けています。
Sarashina3の使い方と提供環境:ソブリン性が最大の訴求点
Sarashina3の利用は、Cloud PF Type A上でAPI/クラウドサービスとして呼び出す形が基本です。ここで鍵になるのが「ソブリン性(データ主権)」という考え方です。
Cloud PF Type Aは、米Oracleのクラウドインフラ技術「Oracle Alloy」を採用しつつ、ソフトバンクが日本国内のデータセンターで管理・運用します。つまり、データが海外に出ていかず、国内規制やデータ所在の要件に沿った形で生成AIを利用できます。これは、個人情報や機密情報を扱う金融・医療・自治体などにとって、海外SaaS型LLMでは満たしにくい要件を埋めるものです。
安全運用の面でも、guardによって入力・出力の有害性をモデルレベルで検査でき、embedding/rerankによる社内文書のRAG検索まで含め、「生成〜検索〜安全性」を国産スタックで完結できます。提供当初は東日本リージョン中心で、西日本リージョンは2026年10月の提供が予定されています(提供状況は導入時に要確認)。
Sarashina2・tsuzumi 2・PLaMo 3.0 Primeとの違い

出典:NTT R&D Website(rd.ntt)
Sarashina3は「業務実装フルスタック(生成+RAG+安全性)」と「ソブリンクラウド一体提供」で、他の国産LLMと差別化しています。主要な国産LLMと比べると位置づけがはっきりします。
項目 | Sarashina3(SB Intuitions) | Sarashina2(前世代) | tsuzumi 2(NTT) | PLaMo 3.0 Prime(PFN) |
|---|---|---|---|---|
提供時期 | 2026年6月 | 2024〜2025年 | 2025年10月 | 2026年(源内採用) |
学習規模 | 約30兆トークン | ― | 30Bパラメータ級 | 大規模・256Kコンテキスト |
モデル構成 | 5モデル(mini/nano/guard/embedding/rerank) | 70B/8x70B(MoE)等 | 単体LLM中心 | 単体LLM中心 |
提供形態 | Cloud PF Type A(ソブリンクラウド一体) | OSS公開中心 | 1GPU動作・オンプレ想定 | クラウド提供 |
特徴 | RAG・安全運用まで一気通貫 | 大規模MoEで日本語性能を追求 | 軽量・低推論コスト、源内採用 | 超長文コンテキスト、源内採用 |
前世代Sarashina2との違い
Sarashina2系は、70Bや総パラメータ460B(アクティブ130B)の8x70B MoEなど大規模モデルをOSSとして公開する路線が中心でした。第3世代のSarashina3は、そこから用途別5モデルの製品群+ソブリンクラウド提供へと舵を切り、研究成果を業務にそのまま組み込める形に整えたのが大きな違いです。mini/nanoは「長い思考(reasoning)を必要としない」Instructモデルとして設計されています。
NTT「tsuzumi 2」との違い
NTTのtsuzumi 2は、パラメータを30Bに拡大しつつ1GPUで動作する軽量・低推論コストを強みとし、政府の「源内(Gennai)」基盤にも採用されています。オンプレミス的な軽量運用を重視するならtsuzumi 2、RAGや安全判定まで含むクラウド一体運用を重視するならSarashina3、という選び分けが目安になります。
PFN「PLaMo 3.0 Prime」との違い
PLaMo 3.0 Primeは256Kという超長文コンテキストが特徴で、こちらも源内に採用されています。長大な文書を丸ごと読ませたい用途に強みがあります。国産LLM全体を横並びで比較したい場合は、国産LLM徹底比較の記事もあわせて確認すると、自社要件に合うモデルを絞り込みやすくなります。
Sarashina3が向いている企業・向いていない企業
Sarashina3は万能ではなく、「国内でデータを完結させたい業務実装」に強く、「無料で手軽に使いたい個人利用」には不向きというはっきりした輪郭を持っています。
向いている企業・組織
- 金融・医療・自治体など、データを国外に出せない組織 — 国内DC運用のソブリン性が要件に直結する
- 社内文書を使ったRAGを本格構築したい企業 — embedding+rerank+miniで検索精度と生成品質を両立できる
- 安全性・コンプライアンスを重視する企業 — guardで入力・出力の有害性チェックを標準化できる
- カスタマーサポートや業務自動化にエージェントを使いたい企業 — miniのツール自律呼び出しを活かせる
- 大量の定型データ処理を低コストで回したい企業 — nanoで分類・抽出を安価にさばける
向いていない・慎重に検討すべきケース
- 無料・手軽なチャットAIを個人で使いたい人 — 一般消費者向け無料Web UIは確認されておらず、Cloud PF Type A利用が前提
- 今すぐ厳密なコスト試算を確定させたい場合 — 円建ての具体的単価が非開示のため、見積もり取得が必要
- 推論専用(長い多段推論)の最先端モデルを求める場合 — mini/nanoはreasoning特化型ではないInstructモデル
- 西日本リージョンでの即時本番運用が必須の場合 — 西日本提供は2026年10月予定のため提供状況の確認が必要
よくある質問(FAQ)
Q. Sarashina3は無料で使えますか?
現時点では、一般消費者向けの無料チャットアプリやWeb UIとしての提供は確認できていません。Cloud PF Type A経由のAPI/クラウド利用が前提で、共有型の従量課金または専有型の月額固定で提供されます。具体的な単価は非開示です。
Q. Sarashina3のパラメータ数はどのくらいですか?
mini/nanoのパラメータ数・コンテキスト長・ライセンス・Hugging Face公開の有無は、公式で明示されていません(未開示)。embeddingについてはデフォルト1536次元などの仕様が公開されています。推測値を断定するのは避けるべき段階です。
Q. Sarashina3とtsuzumi 2はどちらが優れていますか?
用途によって異なります。tsuzumi 2は1GPU動作の軽量・低コスト運用と源内採用が強み、Sarashina3はRAG・安全性まで含むクラウド一体運用が強みです。「軽量オンプレ寄り」か「クラウドで業務フルスタック」かで選び分けるのが実務的です。
Q. Sarashina3でRAGは構築できますか?
できます。embeddingで社内文書をベクトル化し、rerankで検索結果を並べ替え、miniで回答を生成し、guardで安全性を確認する——という4モデル連携が、Sarashina3が想定する典型的なRAG構成です。
Q. Sarashina3はいつから使えますか?
2026年6月30日に東日本リージョンで提供が始まりました。西日本リージョンは2026年10月の提供が予定されています(導入時点で最新状況の確認を推奨します)。
まとめ:Sarashina3は「業務実装フルスタック」の国産LLM
Sarashina3は、SB Intuitionsがフルスクラッチで開発した第3世代の国産LLMで、mini/nano/guard/embedding/rerankの5モデルによって、生成・軽量処理・安全判定・文書検索までを国産スタックで完結できる点が最大の価値です。
- 約30兆トークンの高品質学習とOPSD・多段階強化学習で、日本語性能を強化
- JamC-QAでQwen3-235B超えを公式主張、embeddingは次元40%削減でもJMTEB 78.22の高精度
- 提供はソブリンクラウド「Cloud PF Type A」経由で、国内DC運用によるデータ主権が強み
- 料金は共有型(従量)/専有型(月額固定)の2形態だが、具体的単価は非開示
- 無料の個人向けチャットではなく、企業・自治体の業務実装向け
国内でデータを完結させたい組織、RAGや安全運用まで含めて国産LLMを本格導入したい企業にとって、Sarashina3は有力な選択肢です。競合する国産LLMと横並びで検討したい場合は、国産LLMの徹底比較やNTT tsuzumi 2の解説、PLaMo 3.0 Primeの解説もあわせて確認し、自社要件に合うモデルを見極めてください。
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

Claude Fable 5・Mythos 5 が米政府の輸出管理命令で世界停止した事件を完全解説|停止から復帰までの全経緯と現在の状況
2026/07/04

AIジェイルブレイク深刻度評価フレームワークとは?4次元スコアリング・CJSスケール・Fable 5停止の教訓を整理【2026年7月】
2026/07/04

Cloudflare Pay Per Use(旧Pay Per Crawl)とは?9月15日デフォルトブロックとAI無断学習規制を完全解説
2026/07/04

印刷・出版業のAI活用事例|DTP自動化・デジタル出版・コンテンツAIを徹底解説【2026年版】
2026/05/08

Gemini Omni Flashとは?会話型で動画を作るGoogleのAI ― 料金・使い方・Veoとの違いを解説
2026/07/04

福祉・NPO・非営利組織のAI活用事例|申請支援・多言語対応・業務自動化AI徹底解説【2026年最新】
2026/05/08

