GLM 5.2とは？Z.aiの中国最高水準コーディングLLM｜100万トークン・GPT-5.5対抗・MIT公開・GLM-5.1との違いを徹底解説

GLM-5.2は、中国のAIスタートアップ Z.ai（旧Zhipu AI／智譜AI） が2026年6月中旬に公開した、コーディングと長期エージェントタスクに特化したフラッグシップ大規模言語モデルです。前世代GLM-5.1の後継にあたり、コンテキストウィンドウを20万トークンから100万（1M）トークンへ5倍に拡大、ベンダー公称では一部の長期コーディングベンチでGPT-5.5やClaude Opusを上回りつつ、APIコストはその数分の一という点で大きな注目を集めています。重みはMITライセンスのオープンウェイトとして公開されています。

本記事では、GLM-5.2の定義・仕組み・機能・料金・使い方・GLM-5.1からの進化点・GPT-5.5やClaude Opusとの違い、そして中国発モデルを日本企業が使う際のセキュリティ・コンプライアンス上の注意点まで、導入判断に必要な情報を1ページに整理します。生成AIコーディングツールを比較検討している開発者・Claude CodeやCursorの代替を探している方・APIコストを下げたい企業担当者に向けた内容です。

GLM-5.2とは：3行でわかる要点

GLM-5.2の要点は次の3点に集約されます。

100万トークンのコンテキストウィンドウを備えたMoE（Mixture-of-Experts）モデルで、総パラメータ約744〜753B・アクティブ約40B／トークン。長期にわたる自律的ソフトウェアエンジニアリング（long-horizon agentic coding）に最適化されている
MITライセンスのオープンウェイトとして公開され、商用利用・改変・再配布・ファインチューニングが原則自由（重み配布の状況は時期により異なる）
APIは入力$1.40／出力$4.40（100万トークンあたり）と低価格で、ベンダー公称ではGPT-5.5やClaude Opusの数分の一のコストで同等以上のコーディング性能を狙う

まず押さえておきたいのは、GLM-5.2が汎用チャット用途ではなく、「コーディングとAIエージェント運用」に振り切ったモデルだという点です。画像や音声を扱うマルチモーダルには対応せず、テキスト入力・テキスト出力に特化しています。「賢いチャットボット」ではなく「長時間自律で動くコーディングエンジン」として捉えると、強みも制約も理解しやすくなります。

中国オープン系のコーディングLLMという系譜では、DeepSeek-V4 や Qwen3.7 Max と並ぶ存在で、GLM-5.2はとりわけ「長期タスクとコンテキスト長」を武器にしています。

開発元：Z.ai（旧Zhipu AI／智譜AI）とは

出典: Z.ai（zai-org）公式GitHub

GLM-5.2を開発しているのは、清華大学発のAIスタートアップ Z.ai（旧Zhipu AI／智譜AI）です。Alibaba・Tencent・Ant Group など中国大手からの大型出資を受けて成長し、2026年1月には香港証券取引所へ上場しました。ファウンデーションモデル企業として史上初の上場とされ、中国のオープンソースAI戦略を象徴する存在になっています。

Z.aiは「GLM」シリーズを継続的にオープンウェイトで公開してきました。前世代の GLM-5.1 はSWE-Bench Proで世界トップクラスのスコアを記録し、MITライセンスでの完全公開が話題となりました。GLM-5.2はその路線を引き継ぎつつ、コンテキスト長と長期タスク性能を大きく引き上げたモデルです。

なお、Z.aiは2025年1月に米商務省のEntity List（輸出規制対象リスト）に追加されており、米国製アクセラレータの調達が制限されています。GLM-5.2はHuawei Ascend + MindSpore系のインフラで学習されたと報じられており、「NVIDIA非依存」を訴求している点も特徴です。この地政学的な背景は、企業が採用を検討する際の重要な判断材料になります。

リリース日の整理：6月13日・16日・17日が混在している

GLM-5.2のリリース日は報道によって日付が分かれているため、ここで整理しておきます。「いつ出たのか」が曖昧なまま語られがちなので、用途別に分けて理解するのが正確です。

日付	何が起きたか
2026年6月13日	GLM Coding Plan（Lite/Pro/Max/Team）の各ティアでGLM-5.2が先行提供開始。Claude CodeやCursorなどコーディングツール経由で利用可能に
2026年6月16日	従量課金のスタンドアロンAPI（pay-per-token）が有効化。入力$1.40／出力$4.40で利用開始
2026年6月17日前後	一部英語メディアが「リリース」として報道

つまり、コーディングプラン経由の先行提供が6月13日、誰でも従量課金で叩けるAPIの提供開始が6月16日と捉えるのが実態に近い表現です。「6月17日リリース」という記述だけを見ると混乱しますが、提供チャネルごとに段階的に開いていったと理解してください。

GLM-5.2の仕組み：744B級MoE＋100万トークン

GLM-5.2のアーキテクチャは、長期タスクと長文処理を効率よくこなすための工夫が中心になっています。

項目	仕様
アーキテクチャ	MoE（Mixture-of-Experts）。総パラメータ約744〜753B、アクティブ約40B／トークン
コンテキスト長	100万（1,000,000）トークン（`glm-5.2[1m]` で有効化）
最大出力トークン	131,072（128K）トークン
推論モード	High（既定）と Max の2系統。Maxはより深い推論に対応
入出力モダリティ	テキスト入力／テキスト出力（マルチモーダル非対応）
Thinkingモード	対応（切替可）
Function Calling / MCP統合	対応
Context Caching / 構造化出力	対応

MoE構造により、巨大な総パラメータを持ちながら推論時にはその一部（約40B）だけを稼働させるため、フルパラメータの密モデルより計算効率が高くなります。

技術的に注目されているのが IndexShare と呼ばれる仕組みです。これは4つのスパースアテンション層ごとに同じインデクサを再利用するもので、Z.aiの提案によれば100万トークンのコンテキストで1トークンあたりのFLOPを約2.9倍削減できるとされています。長文・長期タスクを安価かつ高速に処理することが狙いです。100万トークンは日本語の書籍にして数冊分に相当し、大規模なコードベース全体やプロジェクト履歴をまるごと文脈に入れた状態でコーディングを進められます。

GLM-5.2で何ができるのか

GLM-5.2が想定している主な利用シーンは次の通りです。いずれも「単発の質問応答」ではなく「長く動かし続ける開発作業」が中心です。

大規模コードベースの理解と改修：100万トークンのコンテキストにリポジトリ全体を入れ、横断的にコードを読みながら修正する
長期自律エージェントタスク：数百ラウンドの反復・多数のツール呼び出しを伴うバグ修正やリファクタリングを、人の介入を最小限にして進める
ターミナル操作・CLIエージェント：シェルコマンドの実行・テスト・デバッグを繰り返す自動化ワークフロー
ツール連携（Function Calling / MCP）：外部API・データベース・ファイルシステムと連携した実務タスク
構造化出力：JSONなど決められた形式での安定した応答

逆に、画像を見て説明する・図表を読み取る・音声を扱うといったマルチモーダル用途には使えません。あくまでテキストとコードの世界に特化したモデルです。

AIエージェントの基礎概念や、コーディングエージェントの全体像を整理したい場合は、AIコーディングツールおすすめ比較もあわせて参考にしてください。

GLM-5.1との違い：世代比較

GLM-5.2の最大の進化点は、コンテキスト長と長期タスク性能です。GLM-5.1からの主な変更を整理すると次のようになります。

項目	GLM-5.1（前世代）	GLM-5.2（最新）
公開時期	2026年4月	2026年6月中旬
コンテキスト長	20万トークン	100万トークン（5倍）
アーキテクチャ	MoE 約754B（アクティブ40B）	MoE 約744〜753B（アクティブ40B）
長文効率化技術	—	IndexShare（1Mで約2.9倍のFLOP削減）
Terminal-Bench 2.1（公称）	62.0〜63.5	81.0
SWE-bench Pro（公称）	58.4%	62.1%
API料金	入力$1.40／出力$4.40	入力$1.40／出力$4.40（据え置き）
ライセンス	MITオープンウェイト	MITオープンウェイト

ポイントは、料金を据え置いたままコンテキストを5倍に広げ、コーディングベンチのスコアを底上げしたことです。とくにTerminal-Bench 2.1のスコアが大きく伸びており、ターミナル上で長く動き続けるエージェント用途での実力向上が示唆されています。

すでにGLM-5.1を導入済みのチームにとっては、「より長いコンテキストが必要か」「ターミナルエージェントの精度を上げたいか」が乗り換えの判断軸になります。前世代の詳細はGLM-5.1の解説記事で確認できます。

ベンチマーク性能：公称値と独立検証を区別する

GLM-5.2の性能を語るうえで重要なのは、現時点で公開されている数値の多くがベンダー（Z.ai）自己報告である点です。独立した第三者による再現検証はまだ出揃っておらず、一部メディアは「5.2専用の公式ベンチが整備されておらず、5.1の数値が代理的に使われている可能性がある」とも指摘しています。以下の数値はベンダー公称として、独立検証待ちの前提でご覧ください。

ベンチマーク	GLM-5.2（公称）	位置づけ
Terminal-Bench 2.1	81.0	オープンモデルでトップクラス
SWE-bench Pro	62.1%	GPT-5.4・Claude Opus 4.6（5.1時点比較）を上回る水準
FrontierSWE	Claude Opus 4.8に約1%差	西側最上位に肉薄するが僅差で及ばず

複数の海外メディア（VentureBeatなど）は「複数の長期コーディングベンチでGPT-5.5やClaude Opus 4.7を上回る」と報じる一方、Claude Opus 4.8やGPT-5系には僅差で及ばない領域も残ると伝えています。総評としては「オープンソースモデルとしては最高ランク、西側フロンティアの最上位とは僅差で競る」という位置づけが妥当です。

業界の反応も大きく、Vercel CEOが「状況を変える」級のコメントを残したと報じられ、「規制で閉じていく西側 vs オープンソースで開いていく中国勢」という構図で語られています。ただし、こうした評価が一人歩きしないよう、実務では自社のタスクで実際にベンチマークを取ることを強くおすすめします。

競合モデルとの比較

出典: Anthropic Claude Code 公式

GLM-5.2を検討する際に比較対象となる主要モデルを整理します。コーディング用途・コスト・ライセンスの観点でまとめました。

モデル	ライセンス	コンテキスト	強み	コスト感
GLM-5.2（Z.ai）	MITオープンウェイト	100万トークン	長期コーディング・コスト・自社運用の自由度	低（API入力$1.40／出力$4.40）
GPT-5.5（OpenAI）	クローズド	大	汎用推論・エコシステム・マルチモーダル	高
Claude Opus（Anthropic）	クローズド	大	コーディング品質・安全性・企業導入実績	高
DeepSeek-V4	オープンウェイト	大	コスパ・推論・中国オープン系の代表格	低
Qwen3.7 Max（Alibaba）	オープン系	大	推論・多言語・Alibabaエコシステム	低

GLM-5.2の差別化は、「100万トークンの長文 × 長期エージェント × 低コスト × MITで自社運用可能」という組み合わせにあります。クローズドの西側フロンティアは汎用性能とマルチモーダル、エンタープライズサポートで優位ですが、コストと運用の自由度ではGLM-5.2が際立ちます。中国オープン系同士では、DeepSeek-V4が汎用推論寄り、GLM-5.2がコーディング・長期タスク寄りという棲み分けです。

DeepSeekとGPT-5.5の直接比較を知りたい場合はDeepSeek-V4とGPT-5.5の比較記事も参考になります。

GLM-5.2の料金：APIとコーディングプラン

GLM-5.2の料金体系は、用途に応じて従量課金APIとサブスク型のGLM Coding Planの2系統があります。

① API（従量課金）

項目	GLM-5.2
入力	$1.40 / 100万トークン
出力	$4.40 / 100万トークン
キャッシュ入力	$0.26 / 100万トークン
キャッシュ保存	期間限定無料

入出力合計でおおむね$5.80／100万トークン水準となり、複数メディアは「GPT-5.5やClaude Opusの約6分の1〜10分の1」と表現しています。100万トークン版は glm-5.2[1m] を指定して有効化します。

② GLM Coding Plan（サブスク）

公式サブスクページ（z.ai/subscribe）では「GLM-5.2 & GLM-5-Turbo」搭載と明記されています。ベース価格（割引前）は以下の通りです。

プラン	ベース月額	概算の枠	想定ユーザー
Lite	$18/月	約400プロンプト/週	個人・入門
Pro	$72/月	約2,000プロンプト/週	中量利用
Max	$160/月	さらに大きい枠	大量利用
Team	要確認	チーム向け	組織利用

課金サイクルに応じた割引があり、月払い10%・四半期20%・年払い30%OFFが適用されます。年払いを選ぶと、Liteで実質約$12.6／月、Proで約$50.4／月、Maxで約$112／月（いずれも月換算）まで下がります。

注意点として、初期報道で「$10〜」という表記が出回りましたが、現行のベース価格はLiteで$18です。割引を前提にした実質額と混同しやすいので、契約前に公式ページで最新価格を確認してください。なお、日本語は1文字あたり3〜5トークンを消費しやすく、英語よりトークン効率が悪くなる傾向があるため、日本語中心のワークロードでは想定より消費が増える点も見込んでおくと安全です。

GLM-5.2の使い方：Claude Code・Cursor・OpenClawなどから

GLM-5.2をバックエンドに設定できるコーディングエージェントClineの公式GitHub

出典: Cline 公式GitHub

GLM-5.2は、主要なコーディングエージェントやIDEからAPI互換で呼び出せる設計になっています。GLM Coding Planまたは従量課金APIのキーを取得し、各ツールでエンドポイントとモデル名を設定する流れが基本です。

Claude Code：APIエンドポイントとキーをGLM-5.2向けに切り替えて利用。長期タスクとの相性が良い
Cursor：カスタムモデル設定からGLM-5.2を指定
OpenClaw：オープンソースのコーディングエージェントとして、GLM-5.2をバックエンドモデルに設定して動かせる
Cline：VS Code拡張のエージェントからAPI経由で接続

設定の基本は「①Z.aiでAPIキーを発行 → ②各ツールのモデル設定でエンドポイントとモデル名（glm-5.2 または glm-5.2[1m]）を指定 → ③推論モード（High/Max）を選択」という3ステップです。100万トークンを使う場合は glm-5.2[1m] を明示的に有効化する必要があります。

自社サーバーで自己ホスティングすることも理論上は可能ですが、744B級のモデルは推論に約860GBのVRAM（複数GPU構成が前提）が必要とされ、単一GPUでは事実上動きません。多くのチームにとっては、APIまたはコーディングプラン経由の利用が現実的です。

ライセンス：MITオープンウェイトの自由度

Z.ai（zai-org）公式Hugging Faceのオープンウェイト配布ページ

出典: Z.ai（zai-org）公式 Hugging Face

GLM-5.2はMITライセンスのオープンウェイトとして公開されています。MITは最も制約の緩いライセンスのひとつで、原則として以下が自由です。

商用利用
改変・ファインチューニング
再配布・派生モデルの公開
自社製品への組み込み

これはGLM-5.1から継続する方針で、「DeepSeekと同様、誰でもダウンロード・改変・自社運用できる」点が、米中AI競争のなかでの競争優位として注目されています。ただし注意点として、「MITで公開」と報じられても、重み配布のタイミングが公開直後ではなく保留されるケースがあると一部ソースが指摘しています。実際にダウンロードできるかは時期により変動するため、利用前にHugging FaceなどでGLM-5.2の重みが配布されているかを確認してください。

GLM-5.2の制約・できないこと

導入を検討する前に、現時点の制約を正直に押さえておきましょう。

マルチモーダル非対応：画像・音声・動画の入力は不可。テキストとコード専用
自己ホスティングのハードルが高い：約860GBのVRAMが必要で、複数GPU前提。個人や小規模チームでの自前運用は非現実的
独立検証が限定的：公開されている性能数値の多くがベンダー公称で、第三者再現はこれから。数値を額面通りに受け取らない
日本語のトークン効率：日本語はトークン消費が多くなりやすく、コスト・速度面で英語より不利になりうる。日本語性能の公式ベンチも未確認
データ取り扱いポリシーが不透明：API入力が学習に使われるかなど、公式の明示を確認できない部分がある。機密データを扱う場合は契約条件を要確認

セキュリティ・規制上の注意点：中国発モデルを使う前に

GLM-5.2を業務利用する際は、性能やコストだけでなく、中国発モデル特有のリスクを社内で評価する必要があります。

米Entity List対象：Z.aiは2025年1月に米商務省のEntity Listに追加済み。米国の規制動向次第で、調達や取引に影響が及ぶ可能性がある
規制業種でのデータ越境リスク：政府調達・金融・医療など規制の厳しい業種では、データの越境やベンダーリスクの観点から、社内承認やセキュリティ審査が必要になるケースが多い
APIのデータ取り扱い：学習利用の有無など公式の明示が確認できていないため、機密性の高いコードやデータをAPIに送る場合は慎重に。自己ホスト（重みを自社管理）の方が情報統制はしやすい
オープンウェイトの利点：一方で、重みを自社環境で動かせるMITモデルは、外部へデータを送らずに運用できるため、適切な構成を取ればクローズドAPIより統制しやすい面もある

中国モデルの採用判断やリブランド問題の文脈は議論が続いており、生成AI全般のセキュリティ観点は生成AIのセキュリティ解説もあわせて確認することをおすすめします。実務では「機密データは自己ホスト構成、一般的な開発タスクはAPI」といった使い分けが現実的です。

こんな人・企業におすすめ

GLM-5.2は次のようなケースに向いています。

大規模コードベースを丸ごと文脈に入れて開発したいチーム（100万トークンが効く）
APIコストを大きく下げたい開発組織（西側フロンティアの数分の一）
長時間の自律エージェントタスク（リファクタリング・大規模バグ修正・CLI自動化）を回したい
モデルを自社環境で動かしたい／改変・ファインチューニングしたい（MITオープンウェイト）
Claude CodeやCursorなど既存ツールにバックエンドモデルとして組み込みたい

こんな人・企業にはおすすめしない

一方、次のケースでは別の選択肢を検討したほうがよいでしょう。

画像・音声・動画を扱うマルチモーダル用途が中心（GLM-5.2は非対応）
規制の厳しい業種で、中国発モデルの社内承認が難しい（金融・医療・政府関連など）
日本語の長文処理が大半で、トークン効率・コストを最重視する（実測での検証が必要）
エンタープライズの手厚いサポート・SLAを重視する（クローズドのClaude・GPTが優位な領域）
公称ベンチを鵜呑みにせず、独立検証された安定性を求める段階

判断に迷う場合は、まず無料・少額のAPI枠で自社の典型タスクを試し、コストと精度を実測してから本格導入を決めるのが安全です。生成AIツール全体の選び方は生成AIツールおすすめ比較も参考になります。

よくある質問（FAQ）

Q. GLM-5.2はGLM-5.1と何が一番違いますか？
最大の違いはコンテキスト長です。GLM-5.1の20万トークンから、GLM-5.2では100万トークンへ5倍に拡大しました。あわせてTerminal-Bench 2.1などコーディング系ベンチのスコアも向上し、長期タスク性能が底上げされています。料金は据え置きです。

Q. GLM-5.2は本当にGPT-5.5より優れているのですか？
ベンダー公称では、複数の長期コーディングベンチでGPT-5.5を上回るとされ、コストはその数分の一です。ただし数値の多くはZ.ai自己報告で、独立検証はこれからです。汎用性能やマルチモーダルでは西側フロンティアが優位な領域も残るため、自社タスクでの実測をおすすめします。

Q. GLM-5.2の料金はいくらですか？
従量課金APIは入力$1.40／出力$4.40（100万トークンあたり）。サブスクのGLM Coding Planは割引前でLite $18／Pro $72／Max $160（月額）で、年払いなどで最大30%OFFになります。

Q. GLM-5.2は無料で使えますか？
重みがMITライセンスのオープンウェイトとして公開されており、自己ホストすれば利用料はかかりません。ただし744B級モデルの実行には約860GBのVRAM（複数GPU）が必要なため、現実的にはAPIまたはコーディングプランの利用が中心になります。

Q. GLM-5.2は日本語に対応していますか？
テキスト処理として日本語の入出力は可能ですが、日本語性能の公式ベンチは確認できていません。日本語はトークン消費が多くなりやすく、コスト面で英語より不利になる傾向があります。

Q. Claude CodeやCursorからGLM-5.2を使えますか？
使えます。GLM Coding Planまたは従量課金APIのキーを取得し、各ツールのモデル設定でエンドポイントとモデル名を指定すれば、Claude Code・Cursor・OpenClaw・ClineなどからGLM-5.2を呼び出せます。

まとめ：GLM-5.2は「長期コーディング × 低コスト × 自社運用」の有力な選択肢

GLM-5.2は、Z.aiが2026年6月中旬に公開した、100万トークンのコンテキストとMITオープンウェイトを武器とするコーディング特化LLMです。前世代GLM-5.1から料金を据え置いたままコンテキストを5倍に広げ、ベンダー公称では一部の長期コーディングベンチでGPT-5.5やClaude Opusを数分の一のコストで上回るとされています。

一方で、性能数値の多くは独立検証待ちであり、マルチモーダル非対応・自己ホストの高いハードル・中国発モデルとしての規制リスク・データ取り扱いの不透明さといった制約も残ります。コストと長期タスク性能を重視する開発チームには非常に魅力的ですが、規制業種やマルチモーダル用途、手厚いエンタープライズサポートを求める場合はクローズドの西側モデルが向きます。まずは少額のAPIで自社タスクを実測し、精度・コスト・コンプライアンスの3点で判断するのが堅実な進め方です。