Thinking Machines Lab(TML)とは?Mira Murati創業・フルデュプレックスAI・Tinkerの機能と料金を解説【2026年版】

この記事のポイント
Thinking Machines Lab(TML)は元OpenAI CTOのMira Muratiが2025年2月に設立したAIスタートアップ。0.40秒応答のフルデュプレックスAI「TML-Interaction-Small」とファインチューニングAPI「Tinker」の機能・料金・向いている用途を解説。
Thinking Machines Lab(TML)は、元OpenAI CTOのMira Muratiが2025年2月に設立したAIスタートアップです。ファインチューニングAPI「Tinker」と、AIが「聞きながら話す」フルデュプレックス型のリアルタイムAI「TML-Interaction-Small」の2本柱で、次世代の人間×AI協働を研究・開発しています。
この記事では、TMLの会社概要・創業者プロフィール・2大プロダクトの詳細・競合比較・Tinkerの料金体系・向いている用途まで、2026年6月時点で確認できる情報を体系的に整理します。生成AI業界の最新動向を追いたいエンジニア・研究者・企業担当者の方を主な読者として想定しています。

出典: Thinking Machines Lab 公式サイト
Thinking Machines Lab(TML)とは?会社の基本情報
Thinking Machines Labは、OpenAIのCTOを務めたMira Muratiが創業した、次世代AI研究・開発スタートアップです。法人形態はPublic Benefit Corporation(公益法人型の株式会社)で、純粋な営利企業ではなく、社会的使命も持った事業体として設立されています。
項目 | 内容 |
|---|---|
会社名 | Thinking Machines Lab, Inc.(略称: TML) |
設立 | 2025年2月 |
本社 | サンフランシスコ(アメリカ) |
CEO | Mira Murati(元OpenAI CTO) |
法人形態 | Public Benefit Corporation(公益法人型) |
公式サイト | https://thinkingmachines.ai/ |
従業員数 | 約140〜169名(2026年6月時点) |
公式ミッションは「誰もが自分のニーズと目標に合わせてAIを使いこなすための知識とツールにアクセスできる未来を構築する」とされており、AI研究の民主化・アクセス拡大を中心に据えています。
TMLが取り組む3つの課題(公式より):
- フロンティアAIシステムに対する科学的理解が不足している
- AI訓練に関する知識が一部の大手機関に集中している
- AIシステムの個人向けカスタマイズが困難な状況にある
これらはいずれも「OpenAI・Anthropicのような大企業が独占しているAI研究を、より多くの研究者・企業・個人が活用できるようにする」という方向性を示しています。生成AI全体の入門的な位置づけについては、生成AIとは何か・仕組み・種類・活用事例を総合解説も参照してください。
創業者Mira Muratiとは?経歴とTML設立の背景
Mira Muratiのプロフィール
Mira Muratiは1988年にアルバニア・ヴロラで生まれ、アルバニア系アメリカ人として知られる人物です。コルビー大学でBA、ダートマス大学でBEを取得した後、Goldman Sachs、ARスタートアップのLeap Motion、テスラ(Model Xプロダクトマネジャー)と渡り歩き、2018年にOpenAIへ入社しました。
OpenAI在籍中はChatGPT・DALL-E・Codex・Soraの開発を主導し、2022年5月にCTO就任。2023年11月のSam Altman解任騒動では暫定CEOを務めた経験も持ちます。2024年9月にOpenAIを退職し、わずか数カ月後の2025年2月にTMLを設立しました。
創業時のドリームチームと離職の経緯
TML発足時は、OpenAI出身の著名研究者6名が共同創業者として集結しました。
名前 | 役職 | 主な経歴 | 現在の状況 |
|---|---|---|---|
Mira Murati | CEO | 元OpenAI CTO | 在籍中 |
John Schulman | チーフサイエンティスト | OpenAI共同創業者・ChatGPT設計者 | 在籍中(確認範囲) |
Barret Zoph | 当初CTO | 元OpenAI 研究副社長 | 2026年1月退職→OpenAIへ復帰 |
Lilian Weng | — | 元OpenAI 安全研究副社長 | 現状未確認 |
Andrew Tulloch | — | OpenAI出身 | 2025年10月Meta Superintelligence Labsへ |
Luke Metz | — | OpenAI出身 | 2026年1月退職→OpenAIへ |
2025年10月〜2026年3月にかけて複数の共同創業者が離職しており、MetaやOpenAIへの人材流出が相次いでいます。Barret Zophの退職については「非倫理的行為」を理由にMuratiが解雇したとする報道(TechCrunch、2026年1月)もあり、経緯には複数の見方があります。なお、Devendra Chaplot氏も2026年3月にxAIへ退職しています。
投資家・アドバイザーにはAndreessen Horowitz(a16z)、NVIDIA、AMD、Cisco、Jane Street Capital、Accel、アルバニア政府($1,000万ドル)など計23社以上が参加。Bob McGrew(元OpenAI チーフリサーチオフィサー)がアドバイザーを務めています。
TMLの2大プロダクト:TinkerとInteraction Models
TMLが現時点で提供・発表しているプロダクトは大きく2つです。

プロダクト | 概要 | 公開状況 | 対象 |
|---|---|---|---|
Tinker | オープンウェイトモデルのファインチューニングAPI | 一般公開済み(一部ウェイトリスト) | 研究者・AIエンジニア |
TML-Interaction-Small | フルデュプレックス型リアルタイム会話AI | 研究プレビュー(限定パートナーのみ) | 限定パートナー企業 |
フルデュプレックスAIとは?TML-Interaction-Smallが実現すること
従来のAIとの根本的な違い
現在主流の音声AIは「ハーフデュプレックス方式」です。ユーザーが話し終わるのを待ち→AIが処理し→AIが話す、という一方通行の繰り返しです。これは無線機(トランシーバー)の通話に例えられます。話す側が「どうぞ」と言ったあと、受け側が返す方式です。
TML-Interaction-Smallが実装するのは「フルデュプレックス(Full Duplex)」。電話のように、双方が同時に聞き・話すことができる双方向同時通信です。
方式 | 比喩 | AI動作 |
|---|---|---|
ハーフデュプレックス(従来) | 無線機 | 話し終わるまで待って→処理→回答 |
フルデュプレックス(TML) | 電話 | 聞きながら同時処理→割り込み・先読みも可能 |
TML-Interaction-Smallの技術仕様
2026年5月11日に発表された研究プレビューモデルの主なスペックです。
項目 | 仕様 |
|---|---|
パラメータ数(総計) | 2,760億(276B)MoE構成 |
アクティブパラメータ | 120億(12B) |
処理単位 | 200ミリ秒マイクロターン |
入力形式 | 音声・映像・テキスト(ネイティブマルチモーダル) |
発表日 | 2026年5月11日 |
一般公開 | 未定(2026年内予定) |
MoE(Mixture of Experts)構成を採用しているため、276Bのパラメータ総数を持ちながら、推論時に使われるのは12Bのアクティブパラメータのみです。これにより低遅延かつ効率的な処理が可能です。
3つの主要技術
1. タイムアラインド・マイクロターン
200ミリ秒単位でストリームを処理し、会話中の「沈黙」「発話の重なり」「割り込み」をすべてコンテキスト情報として保持します。従来モデルが「ターンの終わり」を待つのに対し、TML-Interaction-Smallは発話の流れそのものを連続的に理解します。
2. エンコーダーフリー早期融合
音声(dMel変換)と映像(40×40パッチのhMLP処理)を、別体の専用エンコーダーに通さずモデル中核に直接統合します。音声・映像・テキストをスクラッチ(ゼロ)から共同訓練することで、モダリティ間の整合性が高まります。
3. 2層構成アーキテクチャ
- インタラクションモデル層: リアルタイム応答を担当
- バックグラウンドモデル層: ツール実行・複雑な非同期推論を担当(会話を止めずに動作)
バックグラウンド処理により、「調べ物をしながら会話を続ける」ようなシナリオが実現します。
TML独自の能力:TimeSpeak・CueSpeak
TimeSpeak(時間指定発話)
ユーザーが「3秒後に話し始めて」などと指定したタイミングで正確に発話を開始する能力。
TML: 64.7 vs 競合最高: 4.3
CueSpeak(意味的割り込み)
会話の流れを読んで意味的に適切なタイミングで話し始める能力。
TML: 81.7 vs 競合最高: 2.9
現時点では競合がほぼゼロスコアの領域で、フルデュプレックス設計の恩恵が最も出やすい評価項目です。
ベンチマーク比較:0.40秒応答は実際どの程度速いのか
TMLが自社発表したベンチマーク比較は以下の通りです。
ベンチマーク | TML-Interaction-Small | Gemini 3.1 Flash Live | GPT-Realtime-2.0 |
|---|---|---|---|
FD-bench v1.5(インタラクション品質) | 77.8 | 54.3 | 46.8 |
エンドツーエンド応答レイテンシ | 0.40秒 | 0.57秒 | 1.18秒 |
TimeSpeak(時間指定発話) | 64.7 | — | 4.3 |
CueSpeak(意味的割り込み) | 81.7 | — | 2.9 |
FD-bench v3(音声+ツール応答品質) | 82.8% | — | — |
⚠️ 重要な注意点: これらはすべてThinking Machines Lab自身が発表した数値であり、2026年6月時点で第三者による独立検証は実施されていません。自社ベンチマークは比較対象の選定・評価条件の設定において開発者に有利になりやすい側面があります。TechCrunch(2026年5月11日)も「研究プレビューであり実際のユーザーテストが追いついていない点」を指摘しています。
0.40秒という数値について言えば、人間同士の会話では通常200〜400ミリ秒程度の応答ラグが自然とされており、TMLの主張する0.40秒(400ms)はその範囲内です。GPT-Realtime-2.0の1.18秒と比較すると約3倍の速度差があるとされていますが、独立した再現検証が待たれます。
Tinker(ファインチューニングAPI)の機能と料金
Tinkerとは何か
Tinkerは2025年10月にリリースされたオープンウェイトLLMのファインチューニング(微調整)専用APIプラットフォームです。「インフラを気にせず、データとアルゴリズムに集中できる」環境を研究者・エンジニア向けに提供しています。
対象ユーザーとして、Contrary Researchの分析ではPrinceton・Stanford・UC Berkeley・Redwood Researchなどのアカデミック機関が挙げられており、消費者向けサービスではなく、研究者・AI開発者向けの専門ツールに位置付けられています。

出典: Thinking Machines Lab - Announcing Tinker
Tinkerの主な機能
forward_backward(勾配計算)/optim_step(重み更新)/sample(トークン生成)/save_state(進捗保存)という基本操作をAPIで直接制御- LoRA(Low-Rank Adaptation)ベースの軽量ファインチューニング(フルパラメータ更新不要)
- MoE(Mixture of Experts)モデル対応(アクティブパラメータへの課金で大幅コスト削減)
- 複数チームが同一コンピューティングプールを共有可能
- OpenAI API互換の推論エンドポイント(既存ワークフローへの統合が容易)
- ビジョン・言語モデル、推論モデルにも対応
対応モデル(2026年6月確認済み)
シリーズ | パラメータ範囲 |
|---|---|
Qwen(MoE/Dense両方) | 4B〜397B |
Llama | 1B〜70B |
DeepSeek-V3.1 | — |
GPT-OSS | 20B・120B |
NVIDIA Nemotron | 30B〜550B |
Moonshot Kimi(K2シリーズ) | — |
Tinkerの料金(2026年6月・公式ドキュメント確認)
従量課金制(USD/100万トークン)。プランに応じて以下の範囲で課金されます。
操作 | 料金レンジ(USD/100万トークン) |
|---|---|
Prefill(入力処理) | $0.03〜$3.32 |
Sample(出力生成) | $0.09〜$10.00 |
Train(訓練) | $0.09〜$12.00 |
ストレージ | $0.10/GB・月 |
- MoEモデルはアクティブパラメータ分のみ課金されるため、同品質の密集型モデルより大幅なコスト削減が可能
- NVIDIA Nemotronシリーズは期間限定50%割引中(2026年6月確認)
- 無料枠・固定月額プランの有無は現時点で未確認(公式ドキュメントに記載なし)
- トライアルへのアクセスは公式Tinkerページのウェイトリストから申請
提供形態はWeb(APIアクセス)とPython SDKです。
資金調達・評価額・パートナーシップの現状

資金調達の経緯
時期 | 内容 | 評価額 |
|---|---|---|
2025年7月 | a16z主導でシード調達 $20億 | $120億(約1.8兆円) |
2025年11月 | $500億評価での追加調達交渉開始→失敗 | — |
2026年3月 | NVIDIA戦略的提携(非公開額)・Vera Rubin 1GW合意 | $120億(シード時と同水準) |
2026年4月 | Google Cloud AI Hypercomputer拡張契約(数十億ドル規模) | — |
注目すべきは2025年11月の「$500億評価での追加調達失敗」です。シード時の$120億から4倍超の評価を目指した交渉でしたが、成立しませんでした(Bloomberg報道ベース。公式コメントなし)。2026年6月時点での評価額はシード時の$120億に留まっています。
主要パートナーシップ
NVIDIA(2026年3月): Vera Rubin GPU 1ギガワット規模の導入合意。大規模モデル訓練インフラの確保が目的です。NVIDIA公式ブログで発表。
Google Cloud(2026年4月): AI Hypercomputer(Google CloudのAI特化型インフラ)の拡張契約。数十億ドル規模とされています。
他社サービスとの比較
会話AIとしての比較(リアルタイム音声領域)
比較項目 | TML-Interaction-Small | GPT-Realtime-2.0 | Gemini 3.1 Flash Live |
|---|---|---|---|
応答レイテンシ | 0.40秒 | 1.18秒 | 0.57秒 |
方式 | フルデュプレックス | ハーフデュプレックス系 | ハーフデュプレックス系 |
一般公開 | ✗(研究プレビューのみ) | ✓ | ✓ |
料金 | 未発表 | 有料API | 有料API |
マルチモーダル | ネイティブ対応 | 音声+テキスト | 音声+テキスト |
自社ベンチマーク独立検証 | 未実施 | 一部実施 | 一部実施 |
ファインチューニングAPIとしての比較(Tinker vs 競合)
比較項目 | Tinker(TML) | OpenAI Fine-tuning API | Hugging Face |
|---|---|---|---|
対象ユーザー | 研究者・エンジニア | 開発者・企業 | 研究者・開発者 |
ベースモデル | オープンウェイト(Qwen・Llama等) | GPT系(クローズド) | オープンウェイト全般 |
MoEモデル対応 | ✓(アクティブパラメータ課金) | ✗ | 限定的 |
OpenAI API互換 | ✓ | — | ✗(独自API) |
LoRA対応 | ✓ | ✗(フルファインチューニング) | ✓ |
最大モデルサイズ | 397B(Qwen MoE) | 〜数十B | 制限なし(インフラ依存) |
料金体系 | 従量課金($0.03〜$12/Mトークン) | 従量課金 | 多様 |
Contrary Researchの分析では、TinkerはOpenAI/Anthropicの「ブラックボックス型(モデルは非公開)」とHugging Face/MosaicMLの「オープンインフラ型(自前でインフラ構築が必要)」の中間に位置づけられています。
TMLの研究成果:LLM推論の非決定性解消

出典: Thinking Machines Lab ブログ - Defeating Nondeterminism in LLM Inference
Tinkerや会話AIとは別に、TMLは2025年9月に重要な基礎研究成果を発表しています。
LLM推論の非決定性問題の解消(発表: 2025年9月)
「Temperature=0に設定しても、同一プロンプトから異なる出力が生成される」という問題は多くのLLM開発者が経験してきたものです。TMLはこの根本原因をGPUカーネルレベルのバッチ感応性(batch-sensitive nondeterminism)と特定しました。
実証実験では、Qwen3-8Bを同条件で1,000回実行したところ、80種類の異なる出力が生成されることを確認。解決策としてPyTorchの不変カーネル実装をオープンソースで公開しており、これはTMLの「AI研究の民主化」というミッションを体現した取り組みです。
詳細は公式ブログを参照してください。
プライバシー・セキュリティの注意点
TMLのプライバシーポリシー(2025年8月18日改定版)で確認できる主な注意事項です。
データ収集:
- ユーザー提供情報・自動収集(デバイス/ロケーション/Cookie)・公開情報の3チャネル
データ利用:
- サービス提供・改善・不正防止・法的義務対応に限定
- CCPAで定義される「販売」「共有」はしていないと明記
注意すべき点:
- 「完全なセキュリティは保証できない」と公式に明記されている
- データは米国または他国に移転される可能性があり、居住国と異なる保護レベルが適用される場合がある
- データ保持期間は「業務上の必要性・法的要件・紛争解決」に応じて判断(固定期間の定めなし)
- 日本の個人情報保護法(APPI)への対応については公式に言及なし
企業でTinkerを利用する場合は、訓練データに個人情報・機密情報を含めることのリスクを事前に評価した上で利用してください。
できること・現時点でできないこと
現時点でできること
カテゴリ | 内容 |
|---|---|
ファインチューニング | オープンウェイトモデル(Qwen・Llama・DeepSeek等)のLoRAベース微調整 |
推論 | OpenAI API互換エンドポイントでのモデル推論 |
会話AI(限定) | リアルタイム音声・映像・テキスト同時処理(研究パートナーのみ) |
リアルタイム翻訳 | 話しながらの同時翻訳(研究プレビュー) |
映像への反応 | カメラ映像の変化への自発的な応答(研究プレビュー) |
現時点でできないこと・制約
制約 | 内容 |
|---|---|
一般向け会話AI利用 | TML-Interaction-Smallへの一般アクセスは不可(2026年6月時点) |
独自フロンティアモデル | OpenAI・Anthropicに相当する独自基盤モデルは未提供 |
日本語対応の確認 | 公式サイト・ドキュメントは英語のみ。日本語対応の有無は未確認 |
Interaction Modelの料金 | 研究プレビュー段階のため価格未発表 |
低速環境での利用 | 安定したインターネット接続が必須(低遅延要件) |
大規模長時間音声入力 | 長時間連続の音声・映像入力はコンテキスト管理が課題(現時点) |
こんな人・企業に向いている
Tinkerに向いているケース
- AI研究者・大学院生: オープンウェイトモデルのファインチューニング実験をインフラ整備なしで行いたい場合
- AIエンジニア(スタートアップ・企業): OpenAIのクローズドモデルではなく、オープンウェイトモデルをカスタム微調整してプロダクトに組み込みたい場合
- MoEモデルを活用したいチーム: Qwen MoEなど超大型モデルをコスト効率良くファインチューニングしたい場合
- OpenAI APIからの移行を検討中の開発者: OpenAI互換エンドポイントのため既存コードの変更が最小限
TML-Interaction-Smallが向いているケース(将来的に一般公開された場合)
- リアルタイム音声アシスタント(コールセンター・カスタマーサポート)
- オンライン家庭教師・語学学習アプリ
- 映像を使ったインタラクティブなAIデモや展示
- 低遅延が必須の音声インターフェース開発
向いていないケース
- 一般ユーザーが今すぐ試したい場合: TML-Interaction-Smallはまだ一般公開されておらず、ChatGPTやGeminiのように誰でも使えるサービスは存在しません
- 日本語に特化したサポートが必要な場合: 公式ドキュメント・サポートは英語のみ(現時点)
- 小規模・個人利用: Tinkerは研究者・エンジニア向けAPI。技術的な知識なしに使える一般向けサービスではありません
- 完成度の高い製品としてすぐ導入したい企業: 主力プロダクトはまだ研究プレビュー段階であり、本番品質の保証が得られる段階ではありません
- 独自のフロンティアモデルを期待している場合: TMLは現時点でOpenAIやAnthropicのような独自基盤モデルを提供していません
今後の注目点(2026年内)
TMLについて現時点で確認できる今後の動向は以下の通りです。
- TML-Interaction-Smallの一般公開: 「2026年内」とされているものの、具体的な日付は未発表
- 追加資金調達: $500億評価での調達失敗後、次ラウンドの動向が注目されている
- NVIDIA Vera Rubin 1GW環境の活用: 大規模モデル訓練基盤が整うと、より大型のInteraction Modelが開発される可能性がある
- 日本語対応: 現時点では未確認だが、アジア市場への展開が進む場合に注目
AIエージェントやリアルタイムAIの全般的な動向については、AIエージェントとは?仕組みと活用事例を解説もあわせて参照してください。
よくある質問(FAQ)
Q. Thinking Machines Labは一般ユーザーが使えますか?
A. 2026年6月時点では、一般ユーザーが直接使えるサービスは提供されていません。Tinkerは研究者・AIエンジニア向けのAPIで、TML-Interaction-Smallは限定パートナー向けの研究プレビュー段階です。
Q. TML-Interaction-Smallはいつ一般公開されますか?
A. 公式発表では「2026年内」とされていますが、具体的な日付は2026年6月時点で未発表です。
Q. Tinkerの無料プランはありますか?
A. 公式ドキュメント(2026年6月確認)には無料枠・無料トライアルの明記がありません。ウェイトリストへの申請後、担当者とのやり取りで確認することを推奨します。
Q. フルデュプレックスはChatGPTのAdvanced Voiceとどう違うのですか?
A. OpenAIのAdvanced Voiceモードは基本的にターン制(ハーフデュプレックス)です。TMLのフルデュプレックスは「聞きながら同時処理・同時出力」を行う設計で、アーキテクチャレベルから異なります。ただし独立したユーザーテストによる比較検証は2026年6月時点で未実施です。
Q. Mira Muratiはなぜ共同創業者を複数解雇・退職させているのですか?
A. Barret Zophの退職については「非倫理的行為」を理由にMuratiが解雇したとする報道がありますが、TML公式からのコメントはありません。Andrew TullochはMeta、Luke MetzとZophはOpenAIへ移籍しており、AIスタートアップ間での人材争奪の側面が大きいとみられています。
Q. TMLはOpenAIとどんな関係にありますか?
A. 直接の関係はありませんが、CEO・チーフサイエンティスト・複数の共同創業者がOpenAI出身で、OpenAIに復帰した元メンバーも複数います。競合関係にあります。
まとめ
Thinking Machines Labは、元OpenAI CTOのMira Muratiが2025年2月に設立し、$120億の評価額でスタートした注目のAIスタートアップです。
2026年6月時点の現状は以下の通りです。
- Tinker: 研究者・AIエンジニア向けのオープンウェイトモデルファインチューニングAPI。現在利用可能。従量課金制($0.03〜$12/Mトークン)。
- TML-Interaction-Small: 0.40秒応答のフルデュプレックスリアルタイムAI。2026年5月に研究プレビュー発表。一般公開は「2026年内」だが日時未定。
- 評価額: シード時$120億に留まる($500億での追加調達は失敗)。
- 人材: OpenAI出身メンバーが多数だが離職も相次ぎ、組織の安定性には注意が必要。
- 日本語対応: 未確認(英語のみ)。
生成AIの会話インターフェースが「ターン制から同時双方向へ」移行する転換点において、TMLは技術的に注目すべきポジションにあります。ただし現時点では多くが研究プレビュー段階であり、実際のユーザーが活用できるプロダクトはTinker(研究者・エンジニア向け)に限られています。
生成AIツール全般を比較・検討したい方は、生成AIツールおすすめ比較も参考にしてください。
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

OpenRouterとは?機能・料金・Claude/GPT/Gemini比較・$1.3B評価額まで解説【2026年5月速報】
2026/06/10

iOS 27 Apple Intelligenceとは?Siri AI・Extensions(Claude/Gemini/ChatGPT/Grok選択)完全ガイド【WWDC 2026正式発表】
2026/05/17

Microsoft 365 Copilotエージェントとは?5種類の機能・Word/Excel/PowerPoint自律実行・料金を徹底解説
2026/06/10

Claude Fable 5とは?料金・性能・Mythos 5との違い・Opus 4.8比較を完全解説【2026年6月速報】
2026/06/10

Sunoとは?料金・機能・V5.5・著作権問題を完全解説【2026年最新】
2026/06/09

Claude 5とは?2026年4月時点の公式ステータス・リリース予測・Opus 4.7との違いを徹底解説
2026/04/18

