Sakana Fuguとは？日本発マルチエージェントAIの仕組み・Fugu Ultra・料金・使い方を整理【2026年6月速報】

Sakana Fugu（サカナ・フグ）とは、東京拠点のSakana AIが2026年6月22日に公開した「複数のフロンティアLLMを自動で使い分け・協調させるマルチエージェント・システムを、ひとつのモデルAPIとして提供する」基盤モデルです。ユーザーは単一エンドポイントにリクエストを送るだけで、内部で「どのモデルに任せ、どう検証・統合するか」を自動判断してくれる点が最大の特徴です。

この記事では、次のことがわかります。

Sakana Fuguが「ただのLLM」ではなく何が違うのか（仕組み）
標準モデル「Fugu」と高性能版「Fugu Ultra」の違い
公式ベンチマークの数値と、その正しい読み方（誤解しやすい点）
料金プラン（サブスク／従量課金）とコスト感
OpenAI互換APIでの使い方
EU/EEA非対応・内部モデル非公開などのセキュリティ・制約
こんな人におすすめ／おすすめしない人

対象読者: 生成AIツールを業務やコーディングに使っている個人開発者・エンジニア、複数LLMの使い分けに悩む技術選定担当者、国産AI・データ主権に関心のある企業のAI導入検討者向けです。発表直後の速報のため、料金・モデルIDなどは変動する可能性があり、利用前にSakana AI公式ページでの再確認を推奨します。

Sakana Fuguの正体は「LLMの指揮者」

出典: Sakana AI

Sakana Fuguは、自分ですべてを生成する単体のLLMではなく、複数のフロンティアLLMを束ねて指揮する「コーディネーター（指揮者）」として振る舞うモデルです。公式キャッチコピーは "Multi-Agent System as A Model"（モデルとしてのマルチエージェント・システム）です。

従来、複数のAIモデルを使い分けるには、開発者が自分で「このタスクはGPT、ここはClaude」とルーティングを設計し、結果を統合するコードを書く必要がありました。Sakana Fuguは、この複雑なマルチエージェント処理をモデル内部に抽象化し、ユーザーからは「1つのモデルを呼ぶだけ」に見えるようにしています。

観点	一般的な単体LLM	Sakana Fugu
役割	自分で全部生成する	どのモデルに任せるかを判断・統括する
内部構造	単一モデル	複数フロンティアLLMのプール＋軽量コーディネーター
ユーザーの作業	プロンプトを送る	プロンプトを送る（同じ）。中身は自動委譲
強み	振る舞いが読みやすい	タスクごとに最適なモデルを使える可能性

マルチエージェントAIの基礎概念そのものについては、マルチエージェントAIとは何かを解説した記事やAIエージェントとは何かの総合解説もあわせて参照すると、Fuguの位置づけが理解しやすくなります。

仕組み：1モデルを呼ぶだけで、内部では複数LLMが協調する

Sakana Fuguの核心は、軽量なコーディネーターが大型のフロンティアモデル群に役割を動的に割り当てる点にあります。Fugu自身も「他のLLM群、そして自分自身のインスタンスを呼び出すよう訓練された言語モデル」であり、必要に応じて再帰的に自分を呼び出す設計です。

技術基盤として、Sakana AIはICLR 2026に採択された2本の論文を公表しています。

TRINITY: 軽量な進化型コーディネーターが、大型モデルに「Thinker（思考）」「Worker（実行）」「Verifier（検証）」の役割を動的に割り当て、複数のLLMを複数ターンにわたって統括する仕組み。
Conductor: 強化学習によって、自然言語ベースの協調戦略をモデル自身が発見・学習する仕組み。

つまりFuguは、あらかじめ人間が書いたルールで振り分ける「ルーター」ではなく、学習によって獲得した協調戦略で複数モデルを使い分けることを目指しています。この「学習された協調」が、OpenRouterなど従来のルーティングサービスとの本質的な違いだと位置づけられています。

補足（誤解しやすい点）: 一部メディアでは「約0.6Bパラメータの軽量コーディネーター」と紹介されていますが、公式ページにパラメータ数の明記はなく未確認です。本記事では断定を避けます。また、内部でどのモデル（GPT/Claude/Gemini系など）が選ばれているかは非公開（プロプライエタリ・ルーティング）で、ユーザーからは見えません。

FuguとFugu Ultraの違い

Sakana Fuguには2つのバリアントがあります。日常用途の標準版「Fugu」と、性能を最大化した「Fugu Ultra」です。用途と要件に応じて選び分けます。

項目	Fugu（標準）	Fugu Ultra
位置づけ	性能とレイテンシのバランス型	性能最大化（深いエージェントプール）
向く用途	日常のコーディング、コードレビュー、チャットボット、対話的作業	データ分析、Kaggle、論文再現、サイバーセキュリティ解析、特許・文献調査
エージェント制御	特定プロバイダ/エージェントのオプトアウト可（コンプラ対応）	エージェント除外不可（性能維持のため固定）
モデルID	`fugu`	`fugu-ultra-20260615`
レイテンシ	比較的速い	深く処理するため重くなりやすい

選び分けの基本: スピードやコストを重視する日常作業・対話用途なら標準のfugu、難易度の高い研究・分析タスクで精度を最大化したいならfugu-ultra、という使い分けが基本です。コンプライアンス上、特定のプロバイダを処理から外したい場合は、オプトアウトに対応する標準Fuguを選ぶ必要がある点に注意してください。

公式ベンチマークと、その正しい読み方

Sakana AIは公式ページで主要ベンチマークの数値を掲載しています。Fugu Ultraは、報道（MarkTechPost）によれば「テストした11ベンチマーク中10で首位」とされています。

ベンチマーク	Fugu	Fugu Ultra	参考（比較対象）
SWE-Bench Pro	59.0	73.7	Opus 4.8: 69.2
LiveCodeBench	92.9	93.2	GPT-5.5: 85.3 / Gemini 3.1: 88.5 ※メディア記載
Humanity's Last Exam	47.2	50.0	Opus 4.8: 49.8
GPQA-D	95.5	95.5	Opus 4.8: 92.0
MRCRv2	86.6	93.6	Opus 4.8: 87.9
SciCode	60.1	—	—
Long Context Reasoning	74.7	—	—

ベンチマークを鵜呑みにしない：3つの注意点

「Fable 5並み＝Fable 5を内部で使っている」ではない: 比較対象に挙がるAnthropicのFable 5やMythosは、公開停止・未公開のためFuguのオーケストレーション・プールには実際には含まれていません（the-decoderが指摘）。あくまで「到達した性能の比較」であり、それらのモデルを内部で呼んでいるわけではありません。
性能はプール構成に完全依存: Fuguの実性能は「プールにどのモデルが入っているか」で決まります。プール構成が変われば性能も変わるため、公開時のスコアが常に維持される保証はありません。
コミュニティの評価は割れている: 「結局はルーター/ラッパーでは？」という懐疑論もあります。一方で公式は「学習された協調戦略」による自動合成だと説明しており、評価は中立に見るのが妥当です。

フロンティアモデル単体の性能を比較したい場合は、GPT-5.4とClaude Opusの比較記事やGemini 3.1 Proの解説もあわせて確認すると、Fuguが目指す到達点が把握しやすくなります。

料金：サブスクと従量課金の2系統

Sakana Fuguの料金は、月額サブスクリプションと従量課金（Pay-as-you-go）の2系統です。以下は2026年6月23日時点の数値で、発表直後のため変動の可能性があります。利用前に公式での再確認を推奨します。

サブスクリプション（月額）

プラン	月額	備考
Standard	$20/月	基本プラン
Pro	$100/月	Standard比約10倍の利用枠
Max	$200/月	Standard比約20倍の利用枠

従量課金（100万トークンあたり）

区分	入力	出力	キャッシュ入力
Fugu Ultra（〜272Kトークン）	$5	$30	$0.50
Fugu Ultra（272K超）	$10	$45	$1.00
Fugu（標準）	基盤モデルの標準レート準拠	同左	同左

リクエストごとにトークン使用量とコストがレポートされ、リアルタイムでモニタリングできます。

コスト感の注意：実額が読みにくい

オーケストレーション型の宿命として、1タスクで複数のモデルを内部的に呼び出すため、実コストが事前に読みにくい点はメディアからも指摘されています。たとえば「思考→実行→検証」の各段階で別モデルが動けば、単純な単体LLM呼び出しよりトークン消費が増える可能性があります。

実務での目安: 反復的・大量処理のワークロードでは、まず少量のサンプルタスクで実際のトークン消費とコストをモニタリングし、1タスクあたりの実額を把握してから本番投入するのが安全です。コストの予測可能性を重視するなら、単価が明確な単体LLM APIのほうが向く場面もあります。

使い方：OpenAI互換APIでbase_urlを差し替えるだけ

Sakana FuguはOpenAI互換APIを提供しています。既存のOpenAI SDKクライアントのbase_urlとmodelを差し替えるだけで利用でき、SDKの移行は不要です。

from openai import OpenAI

client = OpenAI(
    base_url="https://api.sakana.ai/v1",
    api_key="YOUR_SAKANA_API_KEY"
)

response = client.chat.completions.create(
    model="fugu-ultra-20260615",  # 標準なら "fugu"
    messages=[
        {"role": "user", "content": "このリポジトリのバグを修正して"}
    ]
)

base URL（https://api.sakana.ai/v1）とモデルIDは公開直後の情報です。利用前に公式ドキュメントで最新値を確認してください。

公式はUbuntu / macOS向けのワンラインインストール（CLI）も案内しているとされます。コーディング用途では、OpenAI Codexの解説やClaude Codeの解説で扱っているようなエージェント型コーディングのワークフローに、Fuguをバックエンドとして組み込む使い方が想定されます。

単体LLM / OpenRouter / Sakana Fugu の違い

「複数モデルを使い分ける」という発想自体は新しくありません。OpenRouterのようなルーティングサービスも存在します。三者の違いを整理します。

観点	単体LLM API	OpenRouter等のルーター	Sakana Fugu
呼び出し方	1モデルを指定	自分でモデルを選んで指定	`fugu`を呼ぶだけ
モデル選択の主体	ユーザー	ユーザー（価格/可用性で振り分け）	Fuguが自動判断
協調の仕組み	なし	基本はルールベースの振り分け	学習された協調戦略（複数ターン）
ユーザーの役割	プロンプト設計	モデル選定＋プロンプト設計	プロンプト設計のみ
透明性	高い（使うモデルが明確）	高い（指定したモデルが動く）	低い（内部モデルは非公開）
強み	振る舞いが読みやすい/安価	価格最適化・冗長化	タスクに応じた自動最適化

OpenRouterが「どのモデルを使うかをユーザーが選ぶ」のに対し、Sakana Fuguは「どう協調させるかをモデル自身が判断する」点が本質的な違いです。一方で、内部で何が動いているか見えないため、振る舞いの再現性や監査性を重視する用途では単体LLMやルーターのほうが扱いやすいこともあります。

いつオーケストレーション型を選ぶべきか（判断の目安）

「Sakana Fuguのようなオーケストレーション型」と「単体の最強モデル」のどちらを選ぶか、用途別の目安を整理します。

状況・要件	向く選択肢
タスクの種類が多様で、最適モデルが事前に決められない	Sakana Fugu
研究・分析・難問解決で精度を最大化したい	Fugu Ultra
コストを1円単位で予測・固定したい	単体LLM API
内部で動くモデルを完全に把握・監査したい	単体LLM / 自前ルーター
特定プロバイダにデータを渡したくない（コンプラ）	標準Fugu（オプトアウト）or 単体LLM
EU/EEA圏でサービス提供する必要がある	Fugu以外（現状非対応）
とにかく1つのAPIで“だいたい良い結果”が欲しい	Sakana Fugu

セキュリティ・制約：利用前に必ず押さえる点

Sakana Fuguは仕組みが特殊なため、導入前に確認すべき制約があります。

EU/EEAでは利用不可: GDPR対応が完了するまで提供されません。EU圏でサービス展開する日本企業は、現時点では本番利用できない点に注意が必要です。
内部モデル・連携方法は非公開: どのLLMが選ばれているかユーザーには見えません。監査要件が厳しい業務では論点になります。
入力データが外部のフロンティアモデルに渡る可能性: 処理が外部プロバイダのモデルに委譲されるため、入力データの取り扱い範囲を理解する必要があります。機密情報・個人情報を扱う場合は特に慎重に。
データ利用はオプトアウト可: コンソール経由で学習等へのデータ利用を停止できます。
プロバイダのオプトアウトは標準Fuguのみ: Fugu Ultraは性能維持のためエージェント/プロバイダを固定しており、特定プロバイダを除外できません。
APIキー管理の徹底が前提: 外部委譲が前提のアーキテクチャのため、秘密情報の保護はより重要になります。

外部モデルへのデータ委譲を含むAIの安全な使い方全般については、生成AIのセキュリティ解説やAIエージェントのセキュリティガイドも参考になります。

日本発であることの意味：データ主権と依存リスク

出典: Sakana AI

Sakana Fuguは東京拠点のSakana AIが開発した、日本発のオーケストレーション基盤です。この点は日本の読者・企業にとって重要な文脈を持ちます。

メディア（BankInfoSecurity / buildfastwithai）は、Sakana AIの戦略を「フロンティアモデルそのものを開発するのではなく、エージェント・オーケストレーションに賭ける」ものと整理しています。複数モデルへ動的に振り分けられる構造は、ある特定プロバイダが輸出規制・買収・値上げなどの影響を受けても、別経路にルーティングできるというベンダーロックイン耐性につながると評価されています。

ただし、複数プロバイダが同時に制限されれば効果は限定的という指摘もあり、依存リスクが完全に消えるわけではありません。国産AIという文脈は魅力ですが、内部で外部の海外モデルを使う以上、データ主権の観点では「どこに何が渡るか」を個別に評価する姿勢が必要です。

こんな人におすすめ

多様なタスクを1つのAPIで処理したい個人開発者・エンジニア: 用途ごとにモデルを選ぶ手間を省き、おおむね良い結果を得たい人。
研究・分析・難問解決で精度を最大化したい人: Kaggle、論文再現、データ分析、サイバーセキュリティ解析などにFugu Ultraを活用したい人。
既存のOpenAI SDK資産を活かしたい人: base_urlの差し替えだけで試せるため、移行コストが低い。
特定プロバイダへの依存を減らしたい技術選定者: ベンダーロックイン耐性を重視する人。
国産AI・最新技術をいち早く試したい人: 2026年6月発表の最新動向を検証したい人。

まとめ

Sakana Fuguは、Sakana AIが2026年6月22日に公開した「複数のフロンティアLLMを学習された協調戦略で自動オーケストレーションし、1つのモデルAPIとして提供する」日本発の基盤モデルです。標準版FuguとハイエンドのFugu Ultraがあり、OpenAI互換APIで手軽に試せます。ベンチマークでは高い数値を示す一方、内部モデル非公開・コストの読みにくさ・EU/EEA非対応・外部委譲によるデータ取り扱いといった制約があります。

「最適モデルを自分で選ぶ手間を省きたい」「精度を最大化したい」用途には有力な選択肢ですが、「コストや振る舞いを厳密にコントロールしたい」用途では単体LLMのほうが向きます。発表直後で情報が変動しやすいため、導入前には必ずSakana AI公式ページで最新の料金・モデルID・対応地域を確認してください。

複数のAIを束ねる発想全般を理解したい場合はAIエージェントとはやマルチエージェントAIとはを、他のAIツールと比較検討したい場合は生成AIツールおすすめ比較もあわせてご覧ください。

よくある質問（FAQ）

Q. Sakana Fuguは無料で使えますか？
A. 月額$20のStandardプランからのサブスクリプション、または従量課金で利用します。無料枠の有無は公式で要確認です。発表直後のため価格は変動の可能性があります。

Q. 「フグ（Fugu）」という名前の由来は？
A. Sakana AI（サカナ）は魚にちなんだネーミングを採用しており、その一環として「Fugu（フグ）」と名付けられています。技術的な意味付けより、同社のブランド世界観に沿った命名です。

Q. FuguとFugu Ultraはどちらを使うべき？
A. 日常のコーディングや対話用途で速度・コストを重視するなら標準fugu、研究・分析・難問解決で精度を最大化したいならfugu-ultraが目安です。特定プロバイダを処理から外したい場合は、オプトアウトに対応する標準Fuguを選びます。

Q. 内部でどのLLM（GPTやClaudeなど）が使われていますか？
A. 内部で使用するモデルや連携方法は非公開で、ユーザーからは見えません。GPT/Claude/Gemini系という言及は報道・推測ベースであり、公式に特定モデル名が明示されているわけではありません。

Q. ベンチマークの「Fable 5並み」とは、Fable 5を内部で使っているということ？
A. いいえ。比較対象のFable 5やMythosは公開停止・未公開のため、Fuguのプールには含まれていません。あくまで到達性能の比較であり、それらを内部で呼んでいるわけではありません。

Q. 日本国内なら問題なく使えますか？
A. EU/EEAでは現状利用不可ですが、日本を含むその他地域での利用は想定されています。ただしEU圏でサービス提供する場合は影響を受けるため、提供対象地域は公式で確認してください。

Q. 既存のChatGPT向けコードから移行は大変ですか？
A. OpenAI互換APIのため、base_urlとmodelを差し替えるだけで利用でき、SDKの作り直しは基本的に不要です。

Q. コストが読みにくいと聞きましたが本当ですか？
A. 1タスクで複数モデルを内部的に呼び出すため、単体LLMより実コストが予測しにくい傾向があります。本番投入前に少量のサンプルで実際のトークン消費とコストをモニタリングするのが安全です。