AIツール2026年6月更新

Mistral OCR 4とは?170言語対応の文書解析AI・旧版との違い・料金・Google/Azure OCR比較を解説

公開日: 2026/06/28
Mistral OCR 4とは?170言語対応の文書解析AI・旧版との違い・料金・Google/Azure OCR比較を解説

この記事のポイント

Mistral OCR 4はMistral AIが2026年6月に公開した文書解析モデルです。バウンディングボックス・ブロック分類・信頼度スコアの新機能、170言語対応、旧版との違い、料金、Google/Azure OCRとの比較、向き不向きまで整理します。

Mistral OCR 4(ミストラル OCR 4)は、フランスのAIスタートアップMistral AIが2026年6月23日に公開した、文書解析(ドキュメント・インテリジェンス)モデルの最新版です。単に文字を読み取るだけでなく、各文字・ブロックの位置(バウンディングボックス)・種別の分類・信頼度スコアを構造化データとして返す点が従来のOCRとの最大の違いで、日本語を含む170言語に対応します。

本記事では、Mistral OCR 4の定義・できること・旧版(初代/OCR 3)との違い・表や手書きの認識精度・日本語精度の実情・料金・使い方・Google/Azure OCRとの比較・向いている人までを、2026年6月時点の公式情報をもとに整理します。「Mistral OCR 4が旧版から何が変わったのか知りたい」「他社OCRとどちらを使うべきか迷っている」「社内文書を外部に出さずにOCRできるか確認したい」という方に向けた記事です。

Mistral OCR 4とは何か(開発元・基本情報)

Mistral OCR 4の公式モデルイメージ

出典:Mistral AI公式サイト(mistral.ai)

Mistral OCR 4は、PDFや画像化された文書からテキスト・表・数式・レイアウト構造をまとめて抽出する文書解析AIです。Mistral AIはこのモデルを「単なる文字起こし(text)ではなくセグメンテーション(segmentation)」と表現しており、紙やスキャン文書を、RAG(検索拡張生成)やAIエージェント、社内検索にそのまま組み込める構造化データに変換することを目的としています。

項目

内容

開発元

Mistral AI(フランス)

リリース日

2026年6月23日

APIモデル名

mistral-ocr-latest

提供形態

Mistral Studio(API)/Le Chat/Amazon SageMaker/Microsoft Foundry(Azure)/セルフホスト

対応言語

170言語・10言語グループ(日本語を含む)

対応フォーマット

PDF、DOC、PPT、OpenDocument

出力形式

構造化JSON(位置情報・ブロック種別・信頼度を含む)

従来のOCRが「文字列だけ」を返していたのに対し、OCR 4は「どこに」「何が」「どれくらいの確からしさで」書かれているかまで一括で返します。これにより、抽出結果を人手でチェックする際に、誤認識が起きやすい箇所をピンポイントで特定したり、引用元の位置をエビデンスとして提示したりできるようになっています。

従来のOCRとの違い:「文字を読む」から「文書を構造化する」へ

Mistral OCR 4が従来型OCRと一線を画すのは、出力に位置情報・分類・信頼度という3つのメタ情報が付与される点です。これがOCR 4の中核機能であり、旧版からの最大の進化でもあります。

1. バウンディングボックス(位置座標)

抽出した文字やブロックが、ページ上のどこに配置されていたかを座標で返します。これにより、抽出テキストと元のPDFを重ね合わせて表示したり、「この数値はこの表のこのセルから来た」と紐づけたりできます。RAGで回答の根拠(引用元)を提示する用途で特に有効です。

2. ブロック種別の分類(typed-block classification)

各ブロックが見出し・本文・表・数式・署名などのどれに当たるかを自動分類します。たとえば契約書から署名欄だけ、論文から数式だけを抽出する、といった後工程の自動化がしやすくなります。

3. 信頼度スコア(confidence score)

ページ単位・単語単位で「読み取りの確からしさ」を数値で返します。スコアが低い箇所だけを人がレビューすれば済むため、全件目視に比べて確認コストを大きく減らせるのが実務上のメリットです。監査証跡(誰がどこを確認したか)を残す用途にも向きます。

一般的なOCR(テキスト抽出のみ)では、これらの情報は得られないか、別途レイアウト解析モデルを組み合わせる必要がありました。OCR 4はこれを一律のページ課金で一括提供します。

Mistral OCRの版ごとの違い(初代・OCR 3・OCR 4)

Mistral OCRはこれまで複数回アップデートされており、ネット上には旧版の情報が混在しています。現行のOCR 4と旧版を混同しないことが重要なので、主要な版の違いを整理します。

リリース

主な特徴

出力形式

初代 Mistral OCR

2025年3月6日

Markdown出力、表・数式・複雑レイアウト対応、画像とテキストの順序保持

Markdown

Mistral OCR 3

2025年12月17日

手書き認識・フォーム処理・複雑な表・スキャン文書を強化、HTMLベースの表再構築

Markdown/HTML

Mistral OCR 4

2026年6月23日

バウンディングボックス+ブロック種別分類+信頼度スコア、170言語対応

構造化JSON

ポイントは2つです。第一に、初代はMarkdown出力が中心でしたが、OCR 4は位置・分類・信頼度を含む構造化JSONを返すようになりました。第二に、手書きや複雑な表の処理はOCR 3で大きく強化され、OCR 4でさらに多言語と構造情報が加わったという流れです。古い記事の多くは初代またはOCR 3時点の情報で止まっているため、料金や機能を参照する際は版を確認してください。

表・手書き・日本語の認識精度はどれくらいか

OCRで読み取る対象となる紙文書の束

2026年6月時点の実情として、表や複雑なレイアウトの構造保持は高水準である一方、日本語の文字認識は前進したものの「完璧」とは言い切れないのが現状です。

公式ベンチマーク(ベンダー評価)

Mistralの公称値では、OCR 4は以下のスコアを示しています(いずれもMistral自身による評価である点に注意してください)。

  • OlmOCRBench: 85.20(総合トップを主張)
  • OmniDocBench: 93.07
  • 600以上の文書・12以上の言語での人手評価で、全競合に対し平均72%の勝率

ただしMistral自身も、自動ベンチマークには「正解データ側の誤り」「表記の等価性の判定ミス」「列順の前提」といった限界があり、正しく抽出していても減点されるケースがあると言明しています。スコアはあくまで参考値として捉えるのが妥当です。

表・手書き・数式

OCR 3以降、手書き文字やフォーム、複雑な表、スキャン文書への対応が強化されています。表はHTMLベースで構造を再構築でき、数式はLaTeX形式で扱えます。レイアウトや表構造を崩さずに抽出できる点は、日本語の文書を扱う検証レポートでも比較的高く評価されています。

日本語精度

OCR 4で日本語が170言語に正式に含まれた点は前進です。一方、日本語の実用精度を数値で断定できる公式データは現時点では公開されていません。日本語の検証レポート(複数の国内技術ブログ)では、「表や見出しなどの構造保持は良好だが、文字の誤認識が一部残る」という傾向が共通して報告されています。英語の論文・ビジネス文書では「格安かつ高精度」との評価が多い一方、日本語の重要文書を扱う場合は信頼度スコアを使った人手レビューを併用するのが安全です。

Mistral OCR 4の料金・プラン

Mistral OCR 4はページ単位の従量課金で、機能の充実に伴い旧版より価格が上がっています。2026年6月時点の主な料金は以下のとおりです。

プラン

料金

内容

Mistral OCR 4 標準API

$4 / 1,000ページ

テキスト+位置・分類・信頼度の構造化出力

バッチAPI

$2 / 1,000ページ(50%割引)

即時性が不要な大量処理向け

Document AI

$5 / 1,000ページ

構造化JSON出力などの機能を含む

Le Chat(公式チャットUI)

無料でOCR利用可能(2026年6月時点)

まず試したい個人・小規模向け

注意点として、旧 Mistral OCR 3 は $2 / 1,000ページ(バッチ $1) でした。ネット上に残る「1,000ページあたり1〜2ドル」という記載は旧版の料金であり、現行のOCR 4とは異なります。OCR 4の値上げ分は、位置情報・ブロック分類・信頼度スコア・170言語対応という追加価値に対応していると理解するとよいでしょう。まず精度や使い勝手を確認したい場合は、Le Chat上で無料のOCR機能を試すのが手軽です。

Google/Azure OCRとの比較

Google Cloud(Document AI)のロゴ

出典:Google Cloud公式サイト(cloud.google.com)

「Mistral OCR 4は他社より高いのでは?」という疑問は、何を抽出したいか(テキストだけか、構造化までか)で答えが変わります。単純な文字抽出ならGoogle/Azureの方が安く、位置・分類・信頼度・多言語・セルフホストまで一括で欲しいならMistralに分があります。

サービス

テキスト抽出(Read系)料金

レイアウト/構造化料金

無料枠

セルフホスト

Mistral OCR 4

$4 / 1,000ページ(バッチ $2)

Document AI $5 / 1,000ページ

Le Chatで無料

◯(単一コンテナで可)

Google Document AI

Read API $0.65 / 1,000ページ

Layout/Prebuilt $10、Custom $30

新規$300クレジット

×(GCP前提)

Azure Document Intelligence

Read API $1.50 / 1,000ページ

Layout/Prebuilt $10、Custom $30

月500ページ恒常

△(一部コンテナ提供)

※料金は2026年の集計に基づく目安です。各社の料金は変動するため、導入前にGoogle Document AIの料金ページAzure Document Intelligenceの料金ページで最新値を確認してください。

読み取り方のポイントは次のとおりです。

  • テキストだけ大量に抽出したい → Google Read APIが$0.65/1,000ページと圧倒的に安い。
  • 位置・分類・信頼度・多言語・引用可能な構造化を一律料金で欲しい → Mistral OCR 4。Google/Azureで同等の構造化(Layout/Custom)を使うと$10〜$30/1,000ページに跳ね上がるため、用途次第でMistralがコスト優位になる。
  • 独立系の比較では、複数ページ文書ではAzureとMistralが同等、単一ページのフォームではAzureがやや上回るという報告もあります。GoogleのDocument AIはMistral OCR 4と同等精度・同等価格帯で言語数も多く、GCP統合の密さが評価されています。

Mistral OCRはGoogle Cloud(Gemini Enterprise Agent Platform)でもパートナーモデルとして提供されており、既存のクラウド環境に組み込みやすい点も特徴です。クラウド側のAIサービスを比較検討している場合は、Geminiとは何かを解説した記事もあわせて参考にしてください。

Mistral OCR 4の使い方(3つの利用方法)

Mistral OCR 4は、目的に応じて3つの方法で利用できます。

1. Le Chat(無料で試す)

Mistralの公式チャットUI「Le Chat」では、2026年6月時点でOCR機能を無料で利用できます。文書をアップロードして抽出結果を確認できるため、API契約なしに精度や日本語の読み取り具合を試したい個人・小規模利用に向きます。

2. API(システムに組み込む)

mistral-ocr-latest をMistral Document AI APIのOCRプロセッサとして呼び出します。出力は構造化JSONで返るため、RAGパイプラインやAIエージェント、社内検索システムに「引用可能(citation-ready)」な形で組み込めます。即時性が不要な大量処理にはバッチAPI(50%割引)が使えます。

3. セルフホスト(自社インフラで動かす)

単一コンテナでの完全セルフホストデプロイに対応しており、文書データを自社インフラの外に出さずにOCR処理ができます。提供形態はMistral Studio(API)、Amazon SageMaker、Microsoft Foundry(Azure)、オンプレミス(セルフホスト)と幅広く、Snowflake連携も提供予定(2026年6月時点でComing soon)です。

セルフホストとデータ主権:日本企業のコンプライアンス観点

Mistral AIのブランドイメージ

出典:Mistral AI公式サイト(mistral.ai)

Mistral OCR 4が国内のエンタープライズ用途で注目される理由のひとつが、セルフホストによるデータ主権(data sovereignty)の確保です。

契約書・人事書類・医療記録・財務書類といった機密文書をクラウドOCRに送ると、データが外部サーバーを経由します。これは個人情報保護法や社内規程上、ハードルになるケースがあります。Mistral OCR 4は単一コンテナでセルフホストできるため、文書を外部に送信せず、自社環境内で完結してOCR処理ができるのが強みです。

機密データを扱う際のリスクと対策については、生成AIのセキュリティリスクと対策をまとめた記事もあわせて確認してください。社内文書をAIで処理する前提のセキュリティ設計を整理しておくと、導入判断がスムーズになります。なお、自社のどの業務にAIを組み込むべきか検討段階の場合は、生成AIの業務活用事例をまとめた記事も参考になります。

Mistral OCR 4が向いている人・向いていない人

向いている人・企業

  • 多言語の文書を扱う(170言語対応。希少・低リソース言語を含む)
  • RAGやAIエージェントに文書を組み込みたい(位置情報付きの引用可能な構造化出力が必要)
  • 抽出結果の人手レビューを効率化したい(信頼度スコアで低確度箇所だけ確認できる)
  • 機密文書を外部に送りたくない(セルフホストでデータ主権を確保したい)
  • 表・数式・複雑レイアウトを構造を保ったまま抽出したい
  • 構造化抽出を一律のページ課金でシンプルに使いたい

向いていない人・企業

  • 単純なテキスト抽出だけで十分(Google Read APIの$0.65/1,000ページの方が大幅に安い)
  • 日本語の重要文書を人手チェックなしで完全自動処理したい(日本語の文字誤認が残るため、信頼度スコアを使ったレビュー併用が前提)
  • すでにGCPやAzureに深く統合しており、同一環境内のOCRで完結させたい
  • 月数百ページ程度の少量利用で、Azureの恒常無料枠(月500ページ)で足りる

迷ったときは「テキストだけならGoogle/Azure、位置・分類・信頼度・多言語・セルフホストが要るならMistral OCR 4」という基準で判断するとよいでしょう。生成AIツール全体の選び方を整理したい場合は、生成AIツールのおすすめ比較記事も参考になります。

よくある質問(FAQ)

Mistral OCR 4は無料で使えますか?

公式チャットUI「Le Chat」で、2026年6月時点では無料でOCR機能を利用できます。APIでシステムに組み込む場合は$4/1,000ページ(バッチ$2)の従量課金です。無料枠の仕様は変更される可能性があるため、本格利用前に公式の料金ページで確認してください。

旧版のMistral OCR 3との一番大きな違いは何ですか?

OCR 3が手書き・フォーム・複雑な表の処理を強化したのに対し、OCR 4はバウンディングボックス(位置座標)・ブロック種別の分類・信頼度スコアを構造化JSONで返すようになり、対応言語が170言語に拡大した点が最大の違いです。料金も$2/1,000ページから$4/1,000ページに改定されています。

日本語の精度は実用レベルですか?

OCR 4で日本語が170言語に正式対応しました。表や見出しなどの構造保持は良好と評価される一方、文字の誤認識が一部残るという検証報告もあります。日本語の重要文書では、信頼度スコアを使って確度の低い箇所だけ人手で確認する運用が安全です。

社内の機密文書を外部に送らずに使えますか?

可能です。Mistral OCR 4は単一コンテナでの完全セルフホストに対応しており、文書データを自社インフラ内に保持したままOCR処理できます。データ主権や個人情報保護の要件がある組織に向いています。

Google Document AIとどちらが安いですか?

単純なテキスト抽出だけならGoogle Read API($0.65/1,000ページ)の方が安価です。ただしGoogleで位置情報や構造化(Layout/Custom)を使うと$10〜$30/1,000ページになるため、構造化抽出を一律料金で得たい場合はMistral OCR 4($4/1,000ページ)がコスト優位になることがあります。

まとめ

Mistral OCR 4は、2026年6月23日にMistral AIが公開した文書解析AIで、バウンディングボックス・ブロック種別分類・信頼度スコアを構造化JSONで返し、日本語を含む170言語に対応する最新版です。従来のOCRが「文字を読む」だけだったのに対し、OCR 4は「文書を構造化する」段階へ進み、RAGやAIエージェント、人手レビューの効率化、監査証跡といった実務用途に直結する出力を返します。

料金は$4/1,000ページ(バッチ$2、Le Chatは無料)で、旧版より上がっていますが、その分の追加価値が付与されています。単純なテキスト抽出だけならGoogle/AzureのRead APIが安く、位置・分類・信頼度・多言語・セルフホストまで一括で欲しいならMistral OCR 4という選び方が現実的です。特にセルフホストによるデータ主権の確保は、機密文書を扱う日本企業にとって大きな判断材料になります。日本語の重要文書を扱う場合は、信頼度スコアを使った人手レビューを併用しながら導入を進めるのがおすすめです。

AIツールの導入でお困りですか?

お客様のビジネスに最適なAIツールをご提案します。まずは無料相談から。

この記事の著者

AI革命

AI革命

編集部

AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。

採用募集中 AI時代の実装力が、身につく。FDE募集中・副業可・未経験歓迎枠あり
AI Revolution Growth Arrow

AIでビジネスを革新しませんか?

あなたのビジネスにAIがどのような価値をもたらすかをご提案いたします。