OpenAIのAIが80年来の数学難問を解いた|エルデシュ予想の反証・証明の全容・AI推論の現在地【2026年5月速報】

この記事のポイント
2026年5月20日、OpenAIの汎用推論モデルが1946年提起のエルデシュ単位距離予想を反証。フィールズ賞受賞者を含む9名の数学者が「AIのマイルストーン」と認定した歴史的成果の技術的全容、Google DeepMindとの比較、AIにできないことの限界まで整理します。
2026年5月20日、OpenAIは内部の汎用推論モデルが1946年にハンガリーの数学者ポール・エルデシュが提起した「単位距離問題」に関する予想を自律的に反証したと発表しました。数学専用のシステムではなく、日常タスクにも使われる汎用推論モデルが未解決の研究レベル問題を自律的に解決した世界初の事例とされています。
数学・科学研究者、AI/MLエンジニア、AIツールの将来性を業務判断に活かしたいビジネスパーソンにとって、AI能力の現在地を把握する最良の事例です。
まとめ:3点で把握する今回の出来事
① 80年間解けなかった問題をAIが自律的に反証した
エルデシュ単位距離問題の下限に関する予想は1946年から未解決でした。OpenAIの汎用推論モデルが、代数的整数論という意外な数学領域を橋渡しすることで、従来の「正方格子配置がほぼ最適」という定説を覆す新しい点配置族の存在を証明しました。
② フィールズ賞受賞者が「AIのマイルストーン」と認定した
ケンブリッジ大学のTim Gowers(フィールズ賞受賞)は「これまでのAI生成証明は一流数学誌の掲載基準に近づいたことすらなかった。これは歴史的マイルストーンだ」と評しました。
③ 翌日、Google DeepMindが9問を解決と発表した
AI×数学の競争が一夜にして加速。ただし両社のアプローチは根本的に異なり、単純な「どちらが上か」の比較は適切ではありません。
エルデシュの「単位距離問題」とは:なぜ80年間解けなかったのか

問題を日常語で理解する
「単位距離問題」を非専門家向けに説明すると、次のようになります。
「平面(紙の上)にn個の点を配置するとき、ちょうど同じ距離(1単位)だけ離れた点のペアは最大でいくつ作れるか?」
例として考えてみましょう。3つの点を正三角形の頂点に置くと、すべてのペア(3組)がちょうど同じ距離になります。点の数が増えると「全ペアが同じ距離」にはなれなくなりますが、賢く配置すれば同じ距離のペアを最大化できます。問題の核心は「n個の点を最も賢く配置したとき、同じ距離のペアの数の上限と下限はいくつか」です。
従来の定説と「ギャップ」
エルデシュが1946年に予想した上限は「n^(1+o(1))」(nのほぼ1乗程度)で、当時から正方格子(碁盤目状の配置)がほぼ最適解に近いと考えられていました。
下限については長年「n^(1 + c/log log n)」という改善速度の非常に遅い値しか示されておらず、上限と下限の間に大きなギャップが存在していました。
このギャップを「多項式スケール」で埋めることが80年間誰にもできなかったのは、正方格子の枠の中で考える限り大幅な改善が困難だったからです。
AIはどうやって解いたのか:代数的整数論という「意外な鍵」

AIが使った核心的手法
OpenAIのモデルが発見したアプローチは、数学者たちが予想しなかった分野横断にありました。
ステップ1: 高次元格子の構築
単純な2次元の格子から発想するのではなく、高次元空間に特殊な対称性を持つ格子を構築します。
ステップ2: 代数的整数論の活用
ガウス整数(複素整数)から一歩進んで、より複雑な「代数体(algebraic number fields)」を用います。特にGolod-Shafarevich理論と「無限類体塔(Infinite class field towers)」という高度な整数論のツールを活用しました。
ステップ3: 2次元への「投影」
構築した高次元格子を2次元平面に投影(「影」として落とす)することで、正方格子を超えた新しい点配置を得ます。得られた点配置は「紙の上に描けないほど複雑」な構造です。
成果の数値
指標 | 値 | 意味 |
|---|---|---|
従来の下限(最良) | n^(1 + c/log log n) | ほぼn^1と同等の改善速度 |
AIが生成した新下限 | n^(1 + δ) | 多項式スケールの改善(世界初) |
δの値(Sawin改善後) | 0.014 | n^1.014 ≈ 従来の約1.4%の指数改善 |
単純な数字に見えますが、「log log nによる改善」と「多項式改善(定数δが存在する)」の間には質的な断絶があります。80年間誰も達成できなかった多項式スケールの改善を、AIが初めて達成しました。
なぜ人間数学者は気づかなかったか
Scientific Americanの取材では、検証に参加した数学者たちがこのアプローチを「elegant(エレガント)」「clever(巧み)」と表現しました。代数的整数論と離散幾何学の接続自体は既知の技術ですが、それをこの問題に適用しようと考えた数学者はほぼいませんでした。
Jacob Tsimerman(トロント大学)は「AIは数学者より長く、より危険な領域で戦い続けられる。圧倒されることなく」と評しました。AIは「退屈」を感じず、人間が忌避しがちな膨大な試行を続けられる点が強みです。
9名の数学者が証明を検証:信頼性の担保
事前独立検証プロセス
OpenAIは発表前に証明を独立した数学者グループへ送付し、9名が共同で19ページの検証論文(companion paper)を執筆・連署しました。
検証者 | 所属 | 備考 |
|---|---|---|
Tim Gowers | ケンブリッジ大学 | フィールズ賞受賞者 |
Noga Alon | プリンストン大学 | 「傑出した成果」と評価 |
Will Sawin | プリンストン大学 | δをより良い値0.014に改善 |
Thomas Bloom | (複数大学) | 2025年10月の誤主張を批判した数学者。今回は共著者 |
Daniel Litt | トロント大学 | — |
Jacob Tsimerman | トロント大学 | — |
Melanie Matchett Wood | ハーバード大学 | — |
その他 | 複数名 | — |
フィールズ賞受賞者の評価
Tim Gowersは次のように述べています。
「これまでのAI生成証明はどれも一流数学雑誌への掲載基準に近づいたことすらなかった。これは歴史的マイルストーンだ。もし人間がこの論文を一流数学誌に投稿してきて私がレビュワーなら、迷わず掲載推薦する」
Daniel Littの評価は端的です。「これはAIが自律的に産出した唯一の興味深い成果だ」。
参照できる公開資料
資料 | 内容 |
|---|---|
9名連署の検証論文(英語) | |
証明の詳細(英語) | |
発表ページ(英語) |
過去の「誤主張」と今回の違い:2025年10月インシデントの教訓
7ヶ月前の失敗
2025年10月、OpenAIのKevin Weil(当時VP)がSNSに「GPT-5がエルデシュ問題を10個解決した」と投稿しました。しかし実態は既存の解法をウェブ検索して提示しただけでした。Thomas Bloomが「dramatic misrepresentation(劇的な誇張)」と批判し、投稿は削除されました。
Yann LeCun(Meta)やDemis Hassabis(Google DeepMind)も批判に加わったこの事件は、業界内でOpenAIの数学分野での信頼を大きく傷つけました。
今回が違う3つの根拠
比較軸 | 2025年10月(誤主張) | 2026年5月(今回) |
|---|---|---|
解決の方法 | 既存解法の検索・提示 | 新しい証明を自律生成 |
検証プロセス | なし(事後に批判) | 事前に9名の独立数学者が検証 |
批判者の行動 | Thomas Bloomが批判・炎上 | Thomas Bloom本人が検証論文の共著者 |
批判者だったBloomが今回は共著者として名を連ねている事実が、最大の信頼性の担保です。
Google DeepMindも翌日9問解決:AI×数学の競争時代へ

2日間で2社が歴史的発表
比較軸 | OpenAI(5月20日) | Google AlphaProof Nexus(5月21日) |
|---|---|---|
発表日 | 2026年5月20日 | 2026年5月21日(翌日) |
解決数 | 1問(80年来の核心予想反証) | 9問(エルデシュ問題) |
検証方式 | 人間数学者チーム(9名) | Lean証明支援システムで機械検証 |
アプローチ | 自然言語推論 + 外部数学者検証 | LLM + 形式証明(機械的に検証可能) |
問題の性質 | 80年来の核心的未解決予想の反証 | 複数のエルデシュ問題(難易度多様) |
モデル | 汎用推論モデル(名称非公開) | AlphaProof専用システム |
「どちらが上か」ではなく、アプローチの違いを理解する
単純な比較は適切ではありません。
OpenAIの特徴: 汎用モデルが問題を「理解して自律的に解いた」。特別な数学チューニングなし。ただし証明の検証は人間依存。
Googleの特徴: 形式証明(Lean)を使うため、証明が機械的に100%検証可能。人間レビュアーのバイアスがない。解決数も9問と多い。ただし専用システム。
この2社の異なるアプローチが1日の差で並んだことは、テレンス・タオ(フィールズ賞受賞者)が2026年1月に予測した「証明の豊富化から証明の枯渇へ(from proof scarcity to proof abundance)」というシフトの始まりを示しています。
AI×数学の発展タイムライン(2024〜2026年)
時期 | 出来事 |
|---|---|
2024年 | Google DeepMind、AlphaGeometryが国際数学オリンピック(IMO)レベルの幾何問題を解決 |
2025年10月 | OpenAI VP、「GPT-5がエルデシュ問題10個を解決」と投稿 → 実際は既存解法の検索と判明し削除 |
2026年1月 | GPT-5.2 Pro + Harmonic社「Aristotle」がエルデシュ問題#728を解決。テレンス・タオが「AIがほぼ自律的にエルデシュ問題を解いた最初の事例」と評価 |
2026年1月時点 | 27個のエルデシュ問題が解決・確認済み。そのうち約70%(19問)にAIが関与 |
2026年5月20日 | OpenAI、内部汎用推論モデルによる単位距離予想反証を発表。9名の数学者が検証 |
2026年5月21日 | Google DeepMind、AlphaProof Nexusによる9つのエルデシュ問題解決を発表 |
この発見がビジネス・産業に与える影響
直接的な現在の影響:一般ビジネスには「ほぼなし」
正直に言えば、今回の発見が明日の業務に直接影響することはありません。離散幾何学の予想の反証は純粋数学の成果であり、実用製品にすぐ転換されるものではありません。
現在のAIツール活用(文章生成、データ分析、コーディング支援)には変化がなく、ChatGPTやClaudeのような製品への即時の影響もありません。
生成AIやAIエージェントの現在の活用については、AIエージェントとは?や生成AIセキュリティの考え方も参照してください。
中長期的な応用可能性
ただし、「汎用AIが複雑な論理的証明を自律的に生成できる能力」は、次の分野で中長期的に波及効果を持ちます。
分野 | AIの役割 | 時間軸の目安 |
|---|---|---|
薬剤開発 | 分子構造最適化・副作用予測の証明的検証 | 3〜7年 |
材料科学 | 新素材の特性予測・最適構造探索の数学的裏付け | 3〜7年 |
形式的ソフトウェア検証 | バグのない証明済みコードの自動生成 | 2〜5年 |
宇宙物理学・理論物理 | 複雑な数式の自律的な検証・発展 | 5〜15年 |
暗号・セキュリティ | プロトコル脆弱性発見(ポジティブ・ネガティブ両面) | 5〜10年 |
暗号技術・セキュリティへの影響(現時点の評価)
現時点では、今回の成果が既存の暗号技術(RSA、楕円曲線暗号など)を脅かすことはありません。単位距離問題は暗号の数学的基盤(素因数分解困難性・離散対数問題など)とは直接無関係です。
将来的に汎用AIの数学的証明生成能力が飛躍的に向上した場合の暗号技術への影響については、引き続き注視が必要です。ただし現在「AI数学能力の向上に備えて暗号設定を変更すべき」というフェーズではありません。
AIにできること・まだできないこと

今回で明らかになったAIの能力
- 長い論理的推論チェーンの維持: 単純な1ステップ回答ではなく、複数段階の数学的証明を組み立てる
- 分野横断的な接続: 代数的整数論と離散幾何学という別々の分野のツールを組み合わせる(人間数学者が見逃していた接続)
- 人間が「退屈」と判断する探索の継続: 膨大な可能性空間を圧倒されることなく探索し続ける
現時点での限界(過大評価しないために)
モデル名が非公開: 使用されたモデルは「内部汎用推論モデル」としか発表されていません。o3、GPT-5.5などとの対応は現時点で未確認です。一般ユーザーが同じ実験を再現することは現時点では不可能です。
成功確率は約50%: 最大トークン予算を使っても問題を解ける確率は約50%程度と報告されています。1回で必ず解けるシステムではなく、「50%の確率で解ける可能性を持つシステム」です。
数値精緻化は人間が担った: 核心的なアイデアはAIが生成しましたが、δの値をより良い値(0.014)に改善したのはプリンストン大学のWill Sawin(人間数学者)です。完全自律ではありません。
「革新的新手法」より「既存技法の創造的組み合わせ」: Tim Gowersを含む複数の数学者は、今回の成果が全く新しい数学の体系を構築したわけではなく、「既存技術の巧みな組み合わせ」という側面を認識しています。「数学の革命」と「非常に重要な一歩」は区別すべきです。
論文の査読状況: 2026年6月時点でarXivとOpenAI公式PDFの段階。正式な学術誌での査読通過・掲載先は未確定です。
この発見に関心を持つべき人・特に変化がない人
今すぐ詳しく追うべき人
- 数学・理論物理学・計算科学の研究者: 代数的整数論と離散幾何学の新しい接続は直接の研究材料になります
- AI/ML研究者・エンジニア: 「汎用推論モデルの能力限界はどこか」を測る重要な事例。OpenAI推論モデルの系譜と合わせて理解するとより深まります
- ソフトウェア形式検証・暗号エンジニア: AI補助による証明生成の実用化を見据えた戦略立案が必要
- AI投資・事業開発担当者: GPT系モデルと数学・科学領域の応用拡大を判断する材料として重要
- 生成AIの将来性を深く理解したい学習者: AI能力の現在地を把握する最良の事例
今すぐ行動変更が必要ではない人
- 現在AIツールをビジネス利用している一般ユーザー: ChatGPTやClaudeの日常利用に変化はありません
- AIの業務活用を検討中の担当者: ツール選定の判断基準(使いやすさ・料金・日本語対応など)は変わりません。2026年時点のAIツールおすすめも参照してください
- セキュリティ担当者: 今回の成果が既存システムの即時の脅威になることはありません
よくある質問(FAQ)
Q. 使用されたモデルはGPT-5やo3ですか?
公式発表では「内部汎用推論モデル」としか記載されていません。o3、GPT-5.5などとの対応は現時点で公式に確認されておらず、断定できません。OpenAI自身もモデル名を公開していない状況です。
Q. なぜ一般ユーザーは同じことができないのですか?
使用されたモデルはOpenAIの内部研究モデルであり、ChatGPTやAPIとして提供されている製品とは異なります。また成功確率が約50%であることや、最大トークン予算を必要とすることも考慮が必要です。
Q. Google DeepMindは9問解いたのに、OpenAIの1問の方が注目されているのはなぜですか?
注目の理由は「解いた問題の歴史的重要性」にあります。OpenAIが反証したエルデシュ単位距離問題は80年来の核心的未解決予想です。また「汎用AIが特別な数学チューニングなしに自律的に解いた」という点も評価されています。Googleの9問解決も重要な成果ですが、異なる軸での評価が必要です。
Q. この成果はChatGPTやClaudeに近いうちに反映されますか?
現時点では近い将来の反映予定は発表されていません。今回使用されたモデルは研究用の内部モデルであり、製品化のタイムラインは未発表です。
Q. AI証明に誤りが発見される可能性はありますか?
理論的には否定できませんが、現時点では可能性は低いと考えられます。フィールズ賞受賞者を含む9名の数学者が独立して証明を検証し、19ページのcompanion paperを連署しています。ただし正式な学術誌での査読は未完了です。
Q. この発見で暗号技術は危なくなりますか?
現時点では危険ではありません。単位距離問題は現代暗号の数学的基盤(素因数分解問題・離散対数問題・楕円曲線問題)とは直接関係がありません。
Q. 「世界初」という表現は正確ですか?
正確には「未解決の研究レベル数学問題を、数学専用でない汎用AIが自律的に解決した世界初の事例」です。AlphaGeometry等の専用数学AIによる先行事例とは区別される点がポイントです。
まとめ
OpenAIの汎用推論モデルが2026年5月20日に反証した「エルデシュ単位距離予想」は、AI技術の能力マイルストーンとして歴史的な意義を持ちます。
特筆すべきは、これが特殊な数学専用AIではなく、日常業務にも使われる汎用推論モデルによる成果という点です。代数的整数論と離散幾何学を意外な形で橋渡しし、80年間誰も達成できなかった多項式スケールの改善(n^1.014)を実現しました。
同時に、現時点の限界も明確です。モデル名は非公開、成功確率は約50%、数値精緻化は人間の数学者が担当、査読論文は未確定。フィールズ賞受賞者のTim Gowersも「既存技法の応用」という側面を認識した上で評価しています。
翌日のGoogle DeepMindによる9問解決の発表と合わせ、AI×数学の競争は2026年5月に明確な転換点を迎えました。薬剤開発・材料科学・形式検証など科学全般への波及は今後数年から十数年のスパンで期待されます。AIが「長くて複雑な論理的推論」において人間を超えるポテンシャルを示した一方で、数学の本質的な創造性の領域ではまだ多くが人間に委ねられています。
この記事の著者

AI革命
編集部
AI革命株式会社の編集部です。最新のAI技術動向から実践的な導入事例まで、企業のデジタル変革に役立つ情報をお届けしています。豊富な経験と専門知識を活かし、読者の皆様にとって価値のあるコンテンツを制作しています。
最新記事

iOS 27 Apple Intelligenceとは?Siri AI・Extensions(Claude/Gemini/ChatGPT/Grok選択)完全ガイド【WWDC 2026正式発表】
2026/05/17

Microsoft 365 Copilotエージェントとは?5種類の機能・Word/Excel/PowerPoint自律実行・料金を徹底解説
2026/06/10

Claude Fable 5とは?料金・性能・Mythos 5との違い・Opus 4.8比較を完全解説【2026年6月速報】
2026/06/10

Sunoとは?料金・機能・V5.5・著作権問題を完全解説【2026年最新】
2026/06/09

Claude 5とは?2026年4月時点の公式ステータス・リリース予測・Opus 4.7との違いを徹底解説
2026/04/18

Studio by Spotify Labsとは?AI音声エージェント・ElevenLabs連携・パーソナルポッドキャスト生成を徹底解説【2026年5月発表】
2026/06/09

