SubQ LLMとは？非トランスフォーマー・SSAアーキテクチャと12Mトークンコンテキストを徹底解説【2026年5月】

SubQ LLMは、米Subquadratic社が2026年5月5日に発表した「世界初の完全サブクアドラティックLLM（Fully Sub-quadratic Frontier LLM）」を自称する新興AIモデルです。独自開発のSSA（Subquadratic Sparse Attention）アーキテクチャにより、従来のTransformerが構造的に抱えるO(n²)の計算ボトルネックを解消し、プロダクション環境で最大1Mトークン、研究・エンタープライズ限定環境では最大12Mトークンのコンテキスト処理を実現したと主張しています。

ただし2026年6月現在、プライベートベータ段階であり、ベンチマーク数値はSubquadratic社の自己申告、技術論文・独立検証は未公開です。本記事では公式情報と業界の批判的見解の両方を整理したうえで、「今ベータ申請すべき企業」と「正式版公開まで待つべき企業」の判断材料を提供します。

この記事でわかること：

SSAアーキテクチャが何を解決するのか（技術的仕組み）
SubQ API / SubQ Code / SubQ Searchの3製品の概要
主要LLMとのベンチマーク・コンテキスト長・コスト比較
料金・アクセス方法（ウェイトリスト制）
現時点の制約・批判・懸念点
セキュリティとプライバシーポリシーの要点
導入を検討すべき企業とそうでない企業の分類

対象読者：長文脈AI処理の選定を担当するエンジニア・CTO・AI活用推進担当者、およびSSAアーキテクチャに興味を持つ技術者。

SubQ LLMとは：概要と背景

SubQ LLM（正式製品名: SubQ 1M-Preview）は、「Efficiency is Intelligence」をキャッチコピーに掲げる、完全非トランスフォーマー型のAI言語モデルです。開発元のSubquadratic Inc.は2026年5月5日にステルス期間を終え、シード調達2,900万ドル（参加投資家：Tinderの共同創業者Justin Mateen氏、元SoftBank Vision FundのJavier Villamizar氏ら）とともに製品を公開しました。

「Subquadratic（サブクアドラティック）」という社名・製品名は、計算複雑度理論の用語に由来します。二次（Quadratic）未満の計算量でAI推論を行う、という技術コンセプトをそのまま名前にしています。

CEOのJustin Dangel氏は発表時にこう述べています。

「トランスフォーマーはこの10年のAIを定義しましたが、計算要件がコンテキスト長に伴って二次的に増加することが根本的な制限になっていました」

この「根本的な制限」を技術的に解消する、というのがSubQの核心的な主張です。

生成AIの基礎や主要LLMの全体像については、「生成AIとは」の解説記事もあわせて参照してください。

SSAアーキテクチャとは：O(n²)問題をどう解決するか

SubQの最大の特徴は、Transformerを使わない独自アーキテクチャ「SSA（Subquadratic Sparse Attention）」です。これを理解するには、まずTransformerの計算上の弱点を把握する必要があります。

Transformerが抱えるO(n²)の壁

2017年のTransformer登場以来、ChatGPT・Claude・Geminiをはじめほぼすべての主要LLMはTransformerアーキテクチャをベースにしています。しかしTransformerには構造的な制約があります。

すべてのトークン間の「注意（Attention）」を計算するため、コンテキスト長nに対して計算量がO(n²)で増加します。

具体的に言うと：

コンテキスト長	必要な注意計算回数（概算）
100トークン（約75語）	10,000回
10,000トークン（約7,500語）	1億回
1Mトークン（約75万語）	1兆回
12Mトークン（約900万語）	144兆回

コンテキストを2倍にすると計算量は4倍になります。100万トークンの処理を1兆回の演算で行うTransformerに対し、12Mトークンでは144兆回——これがコスト・速度両面でのボトルネックです。

SSAの3ステップ：内容を見て動的に選別する

SSAはこの問題を「スパース（疎）な注意計算」で解決します。動作原理は3ステップです。

ステップ1：入力受け取り
通常通りトークン列を受け取る。

ステップ2：コンテンツ依存選択（核心）
各クエリトークンについて、「意味のある信号がある位置」を入力内容を見て動的に選別します。全トークンとの類似度スコアを軽量に算出し、スコアが高い位置（k個）のみを次のステップに渡します。

ステップ3：スパース注意計算
選ばれた少数のトークン位置にのみ、精密な注意計算を実施します。

これにより、計算量がO(n²)からO(n·k)（kは選択トークン数）へ削減されます。Subquadratic社は12Mトークン処理において、注意計算を最大1,000倍削減、FLOPを62.5倍削減、プリフィル速度を52.2倍高速化（FlashAttention比）すると主張しています。

既存アーキテクチャとの技術的違い

SSAは同様に「Transformer代替」を目指す他のアーキテクチャとも異なります。

アーキテクチャ	代表モデル	特徴	SubQ（SSA）との違い
標準Transformer	GPT-4, Claude Opus	全トークン間注意計算	O(n²)の計算量が残る
固定パターン疎注意	Sliding Window Attention	隣接トークンのみ参照	位置固定・内容依存でない
状態空間モデル（SSM）	Mamba、RWKV	過去情報を状態に圧縮	特定の過去事実の正確な検索が苦手
ハイブリッド	Jamba, Nemotron 3	TransformerとSSMを混合	O(n²)が依然として支配的な層に残る
SSA（SubQ）	SubQ 1M-Preview	内容依存で動的選択	任意位置からの正確な検索を維持しつつO(n²)を回避

SSMアーキテクチャ（MambaやRWKV）との最大の違いは、「過去情報の圧縮をしない」点です。状態空間モデルは過去のトークン情報を固定サイズの状態ベクトルに圧縮するため、長文の特定箇所を精確に引き出す検索（needle-in-a-haystack型タスク）が苦手になります。SSAは必要な箇所を内容を見て選ぶため、この問題を回避していると主張しています。

3段階のトレーニング設計

SSAアーキテクチャの性能を引き出すため、SubQは3段階のトレーニングを採用していると説明しています。

事前学習（Pre-training）: 長文脈を含む大規模データでの基盤訓練
教師あり微調整（SFT）: 長文脈タスクへの性能特化
強化学習（RL）: 長文脈を実際に「使える」能力の強化

⚠️ 注記: アーキテクチャの詳細を記述した技術論文・技術レポートは2026年6月現在未公開です。上記の説明はSubquadratic社の公式ブログおよびサイトの記述をもとにしており、第三者による独立検証は行われていません。

SubQの3製品：できることと対象ユーザー

出典: Subquadratic公式サイト

現時点（プライベートベータ）で提供されている製品は以下の3つです。

SubQ API

OpenAI互換のREST APIエンドポイントです。既存のOpenAI APIクライアントからほぼそのまま移行でき、ストリーミングレスポンスとツール使用（Function calling）に対応しています。

主な用途: 大規模ドキュメント処理、社内ナレッジ検索、長文分析パイプライン
対象: API開発者・エンタープライズエンジニアリングチーム
コンテキスト上限: プロダクション環境で1Mトークン
処理速度: 150 tokens/秒（公式発表値）

SubQ Code

コードベース全体を単一コンテキストに読み込む開発支援CLIツールです。Claude CodeやCursorと互換性のあるインターフェースを持ち、大規模リポジトリのバグ調査・リファクタリング・依存関係の分析に使えると説明されています。

主な用途: モノレポ・大型プロジェクト全体の横断解析、クロスファイルのバグトレース
対象: ソフトウェアエンジニア・テックリード
強み: ファイル数が多いリポジトリでもワンパスで全体把握できる点

Claude Code等の競合AIコーディングツールとの比較については、Claude Opus 4.8の解説記事も参考になります。

SubQ Search

長文書検索に特化したリサーチツールです。大量のPDFや社内文書を一括でコンテキストに投入し、質問応答形式で情報を引き出せると説明されています。

主な用途: 法務契約書の横断分析、研究論文レビュー、社内ナレッジの一括検索
対象: 法務・コンプライアンス担当者、リサーチャー

ベンチマーク・他モデルとの比較

コンテキスト長比較（2026年5月時点）

長文脈処理の市場競争は急速に激化しています。

モデル	最大コンテキスト	提供状況
SubQ（研究・エンタープライズ）	12Mトークン	限定公開
SubQ（プロダクション）	1Mトークン	プライベートベータ
Gemini 3.1 Pro	10Mトークン	公開済み
Gemini 1.5 Pro	2Mトークン	公開済み
Claude Opus（最新）	1Mトークン	公開済み
Kimi K2.6	長文脈対応	公開（一部）

Kimi K2.6の詳細についてはKimi K2.6の解説記事もあわせて参照してください。

ベンチマーク比較（Subquadratic社発表値）

以下の数値はすべてSubquadratic社の自己申告です。第三者機関による独立した再現は2026年6月現在確認されていません。

ベンチマーク	SubQ 1M-Preview	Claude Opus 4.6/4.7	GPT-5.5	Gemini 3.1 Pro
RULER @ 128K	95.6%	94.8%	未公表	—
MRCR v2 @ 1M（プロダクション）	65.9%	32.2%	74.0%	26.3%
MRCR v2 @ 1M（研究環境）	83.0%	—	—	—
SWE-Bench Verified	81.8%	87.6%	88.7%	—
処理速度	150 tokens/秒	—	—	—

注目すべき点：

長文検索（MRCR v2）に特化した強さ: 1Mトークンの長文検索タスクでClaude Opusを32ポイント上回ると主張（プロダクション環境）
コード生成（SWE-Bench）は劣位: Claude Opus・GPT-5.5には及ばない
研究環境とプロダクション環境で17ポイントの差: MRCR v2スコアが83%（研究）と65.9%（プロダクション）で乖離しており、この差についてSubquadratic社は現時点で説明していません

コスト効率（公式比較）

具体的な料金は未公開ですが、Subquadratic社は以下の相対コスト比較を公表しています。

他の主要LLMと比べて約1/5のコスト
Claude Opus比でRULER 128K実行コストが約1/325

これらは長文脈タスクにおけるFLOP削減（62.5倍）に基づく計算とみられますが、実際の課金単価は未公開であり、独立した検証も行われていません。

料金・アクセス方法

現時点の料金体系

2026年6月現在、SubQの具体的な料金は公式サイトに掲載されていません。 プライベートベータ段階のため正式価格は未発表です。

アクセスするには、公式サイト（subq.ai）の「Request early access」フォームからウェイトリストへの申請が必要です。

項目	状況
正式料金	未発表（ウェイトリスト制）
無料プラン	不明
12Mトークンコンテキスト	研究・エンタープライズパートナー限定
プロダクションAPI	1Mトークン・プライベートベータ
SLA・稼働率保証	未定義（ベータ段階のため）

アクセス申請の流れ

subq.ai にアクセス
「Request early access」からフォームを送信
審査後、招待メールを受け取りAPIキーを発行
OpenAI互換エンドポイントのため、既存コードのベースURLとAPIキーを変更するだけで試用可能

できないこと・現時点の制約

SubQを実際の業務に導入する前に把握すべき制約を整理します。

機能面の制約

制約	内容
マルチモーダル非対応	テキスト・コード以外（画像・音声・動画）の処理は公式発表なし
短文タスクの性能未報告	短い入力での一般推論能力の評価データが未公表
数学・科学ベンチマーク未公表	MATH、GSM8K等の標準ベンチマーク結果なし
多言語対応不明	日本語を含む非英語言語の性能詳細は未発表
オープンウェイト非公開	モデルの重みは非公開（クローズドプロプライエタリ）
クロスセッション記憶なし	コンテキストが長くても永続メモリは別途実装が必要

運用面の制約

制約	内容
SLA未定義	ベータ段階のため稼働率保証なし
技術論文未公開	アーキテクチャの詳細を記述した論文なし
セキュリティ評価未公開	モデルカード・レッドチーム評価は「近日公開予定」
12Mトークンは一般未開放	プロダクションAPIの上限は1Mトークン

特に重要なのは、日本語対応の情報が完全に欠落している点です。日本語で業務利用を検討している場合は、日本語でのテストが必要です。

批判・懸念点：業界の反応を正面から整理する

SubQの発表は注目を集めた一方、技術コミュニティからの批判的な指摘も多数あります。導入判断に際してこれらを把握しておくことが重要です。

主な批判

1. 独立検証なし
VentureBeatや技術系メディアで「論文もない、デモもない、一般公開されたAPIアクセスもない」状態での大きな主張、として批判されています。公式はサードパーティテストの実施を主張していますが、その詳細は未公開です。

2. ベンチマーク選択の偏り
報告されているベンチマーク（RULER、MRCR v2、SWE-Bench）は、SubQが特に力を入れている長文脈・コード領域に偏っています。短文推論・数学・科学などの標準ベンチマークは未公表であり、総合的な評価には不十分です。

3. アーキテクチャの独自性への疑問
AIエンジニアのWill Depue氏ほか複数の研究者から、SubQのアーキテクチャがKimiやDeepSeekのスパース注意ファインチューンと実質的に同じ可能性があるという指摘がされています。

4. HackerNewsでのアストロターフィング疑惑
発表直後のHackerNewsスレッドで、新規アカウントによる不自然な支援コメントが多数観察され、マーケティング目的の操作ではないかという疑念が生じました。

5. 数値表現の混乱
発表当初「O(n)」「O(1)」と表現が混在しており、Subquadratic社が後に「O(n)」と修正しています。

6. 研究環境とプロダクションのギャップ
MRCR v2スコアで研究環境（83%）とプロダクション（65.9%）の間に17ポイントの差があり、この乖離について公式説明がありません。

7. 歴史的前例との比較
2024年のMagic.dev（100Mトークンコンテキスト・1,000倍効率を主張、約5億ドル調達）は、2026年初頭時点で公開利用の証拠が限定的です。SubQと同様のパターンに見えるとの指摘があります。一部では「AI版Theranos」という批判コメントも見られました。

肯定的な評価

一方で、仮に主張が本物であれば、2017年のTransformer論文以来の重要なアーキテクチャシフトという意見もあります。長文書処理は多くの業界で実用上の課題であり、解決策としての価値は潜在的に高いという評価です。

⚠️ 結論として: 現時点では主張の真偽を独立的に確認する手段が限られています。本記事では公式情報・批判両方を記載しますが、ベータ段階の高リスクな情報として判断されることをお勧めします。

セキュリティ・プライバシーポリシーの要点

SubQをエンタープライズ利用する前に、公式のプライバシーポリシーとAcceptable Use Policy（AUP）を確認しておく必要があります。

プライバシーポリシーの主要点

学習への非使用が明記されています。 公式プライバシーポリシー（subq.ai/privacy-policy）では以下の通り定めています。

ユーザーのContent（プロンプト・補完・テキスト入力等）を、基盤モデルの訓練・改善に使用しないと明記
データはサービス提供のみに使用し、他ユーザーへの利益や汎用モデル改善には使わない
データ保存期間：サービス提供に必要な期間のみ

問い合わせ先：

一般プライバシー：privacy@subq.ai
DPO（データ保護責任者）：dpo@subq.ai

Acceptable Use Policy（AUP）の注意点

AUP（subq.ai/acceptable-use-policy）で特にビジネス利用者が注意すべき禁止事項があります。

競合利用禁止条項：

競合AIモデルの開発・訓練・改善への使用（書面同意なし）
SubquadraticのAPIを使った競合サービスの構築

これはAI企業・LLMプロバイダーがSubQを試す際に特に注意が必要な制約です。

その他の主な禁止事項：

個人情報の不正収集・ドクシング
テロ・マネーロンダリング・詐欺・個人情報窃盗等の違法コンテンツ生成

ベータ段階特有のリスク

SLA・稼働率保証が不明確：本番システムへの組み込みには注意が必要
モデルカード・安全性評価が「近日公開予定」のまま（2026年5月時点）
技術レポート未公開のため、脆弱性・バイアスの独立評価が困難

こんな企業・人におすすめ / おすすめしない人

今ベータ申請を検討すべき企業・用途

用途	具体例	理由
大規模コードベース解析	モノレポのバグ調査・リファクタリング	ファイル数百本を一括コンテキストに投入できる
法務・契約書分析	数千ページの契約書の横断比較	長文検索ベンチマーク（MRCR v2）での主張が強い
エンタープライズ知識ベース	社内規程・議事録の大規模検索	1Mトークン以内の静的文書ならRAG不要化が見込める
RAG削減・シンプル化	更新頻度の低い知識ベース	断片化しがちなRAGパイプラインを単一コンテキストで代替
新興技術の先行検証	技術評価・競合調査目的	ベータ時点で評価しておくことで正式版への備えができる

向いているのは：AIエンジニア・CTO・技術検証担当者で、ベータ品質のリスクを受け入れたうえで新しいアーキテクチャを試したい方、または長文脈処理のボトルネックで具体的に困っている組織。

正式版公開まで待つべき企業・用途

向いていないケース	理由
高可用性が必要な本番システム	SLA未定義・ベータ段階のためダウンタイムリスクあり
マルチモーダル処理が必要	画像・音声対応は公式発表なし
日本語中心の業務	多言語対応の詳細不明・日本語性能データなし
独立検証必須の業界（金融・医療）	技術論文・重み非公開で第三者監査が困難
短文タスク中心の用途	長文脈以外での優位性は未確認
AI競合サービスを構築する企業	AUPで競合利用が明示的に禁止
コスト確定前に予算計上が必要	料金未公開のためROI計算が困難

SubQ LLMに関するよくある質問（FAQ）

Q1. SubQはトランスフォーマーをまったく使っていないのですか？

Subquadratic社は「完全非トランスフォーマー型」を主張していますが、技術論文が未公開のため独立した確認はできていません。SSA（Subquadratic Sparse Attention）は独自の疎注意機構で、固定パターン疎注意・状態空間モデル・ハイブリッドアーキテクチャとは異なると説明されています。

Q2. 12Mトークンはすぐ使えますか？

現時点では使えません。12Mトークンコンテキストは研究・エンタープライズパートナー限定です。プロダクションAPIの上限は1Mトークンで、これもプライベートベータ段階のため申請が必要です。

Q3. 料金はどのくらいですか？

2026年6月現在、具体的な料金は公式サイトに掲載されていません。公式の主張では「主要LLMの約1/5のコスト」とされていますが、この比較の前提条件（どのタスク・どの量）は明示されておらず、独立検証も未実施です。

Q4. 日本語には対応していますか？

公式から日本語対応に関する具体的な情報は発表されていません。英語ドキュメント・UI中心のため、日本語での性能は自分でテストして確認する必要があります。

Q5. OpenAI APIからの移行は簡単ですか？

OpenAI互換エンドポイントを採用しているため、コードの変更は最小限です。ベースURLとAPIキーを変更するだけで既存のPythonクライアントから接続できます。ただし、SubQ固有の長文脈機能（1Mトークン対応）を活用するには入力処理の設計変更が必要になる場合があります。

Q6. Claude CodeやCursorの代替として使えますか？

SubQ Codeはこれらと互換性のあるインターフェースを持つと説明されています。ただしベータ段階でありSWE-Benchスコアでは現在のClaude OpusやGPT-5.5に劣るため、コード生成品質を重視する場合は慎重に評価してください。

Q7. RAGは不要になりますか？

静的な知識ベース（更新頻度が低い文書群）については、1Mトークン以内に収まる場合RAGを使わずコンテキストに直接投入できる可能性があります。ただし、リアルタイムで更新されるデータや動的なドキュメント管理が必要な場合はRAGが引き続き必要です。アクセス制御・監査証跡の管理にもRAGや別途のデータガバナンス基盤が必要です。

Q8. AIエージェントへの応用はできますか？

長いコンテキストウィンドウを活かした長期履歴保持型エージェントの構築は理論上可能ですが、永続メモリ（クロスセッション記憶）はコンテキスト長と別の機能のため別途実装が必要です。AIエージェントの仕組みと活用については「AIエージェントとは」の記事で詳しく解説しています。

まとめ：SubQ LLMをどう評価すべきか

SubQ LLMは、長文脈処理の計算コスト問題に真正面から取り組んだ点で技術的に興味深いプロジェクトです。SSAアーキテクチャによるO(n²)→O(n·k)の削減という設計思想、OpenAI互換API・SubQ Code・SubQ Searchという3製品の展開、「学習に使わない」という明示的なプライバシーポリシーは評価できます。

しかし2026年6月現在の客観的な立場からは、以下の点に注意が必要です。

ポジティブな点：

長文脈検索タスク（MRCR v2）での主張が具体的
OpenAI互換のため試用のハードルが低い
プライバシーポリシーでの学習非使用の明記

慎重になるべき点：

技術論文・アーキテクチャ詳細は未公開
ベンチマーク数値はすべて自己申告・独立検証なし
プロダクションと研究環境のMRCR v2スコアに17ポイントの説明のない差
日本語対応の情報が完全に欠落
過去の類似事例（Magic.dev等）との比較で注意が必要

実践的な判断基準：

長文脈処理で具体的に困っていて、ベータ品質のリスクを取れるエンジニアや技術検証チームは、今すぐベータ申請して自分のユースケースで試す価値があります。一方、本番運用・予算確定・日本語メイン・独立検証必須という条件がある組織は、技術論文の公開・正式版リリースを待つのが現実的です。

生成AI全体のアーキテクチャ動向については生成AIとはで、新興LLMの比較についてはArcee AI Trinity Largeの解説記事やClaude Opus 4.8の解説記事も参考にしてください。

公式リンク：

この記事のポイント