数学におけるAI革命が到来した

AIは、新たな研究成果を急速に証明するために活用されている。数学者たちは、これはまだ始まりに過ぎないと考えている。

転換点は2025年の夏に訪れた。その年の7月、複数の人工知能モデルが、世界最高峰の高校生が競う毎年恒例の国際数学オリンピックで、6問中5問を解いた。数学者たちは衝撃を受けたものの（プログラムがこれほど早く高性能になると予想していた者はほとんどいなかった）、この目覚ましい成果は、必ずしもAIが研究数学において重要な進歩を遂げることを意味するものではなかった。結局のところ、オリンピックの問題は、答えが既知の難問であり、未解決の問題ではないのだ。

しかし、その結果は人々の注目を集めた。AIモデルはエラーを起こしやすく役に立たないと見なしていた数学者たちも、実際に使い始めた。初期の導入者たちは、モデルがパズルを解くのに優れているだけでなく、真に新しい分野を開拓するのに役立つことを発見し、驚いた。間もなく、数学者たちはAIを使って新しい結果を発見し証明するようになり、かつては数週間、あるいは数ヶ月かかっていたことを1日で成し遂げるようになった。「2025年は、AIがさまざまなタスクで真に役立つようになった年だった」とテレンス・タオは語った。（新しいタブが開きます）カリフォルニア大学ロサンゼルス校の著名な数学者。

いずれも世界を席巻するような画期的な成果ではないものの、中には専門の数学誌に掲載されるような発見に匹敵するものもある。アルゴリズムが仮説を立て、それを証明し、人間の介入を最小限に抑えながら証明を検証するケースもあれば、ChatGPT、Claude、Geminiといった大規模な言語モデルとの長時間の対話を通じて、斬新な証明戦略が生まれるケースもある。

「こいつはシャベルを持ってる。こいつはつるはしを持ってる。二人で協力すればトンネルを掘れる」とタオは言った。「色々なものを壁に投げつけて、何がくっつくか見てみるんだ」。

タオはおそらく数学におけるAIの有用性を最も顕著に提唱した人物だが、他の人々も同意見である。

ダニエル・リットは、簡単な問題を解くだけでも（新しいタブが開きます）トロント大学のAIは「数学のやり方を変えつつある」と述べている。

「まもなく、数学の伝統的なやり方とは全く異なる様相を呈するだろう」とタオ氏は語った。以前は数学者は一度に一つの問題を研究していたが、「これらのツールを使えば、一度に何千もの問題を解決し、統計的な研究を始めることができる」。私が話を聞いた人の中で、AIが数学者に取って代わると考えている人はいなかったが、タオ氏は「多くの制度的、文化的変化が必要になるだろう」と付け加えた。この記事を共有する

黄色いシャツを着て眼鏡をかけた男性。 — テレンス・タオ氏は、AIモデルが数学者にもたらす可能性に胸を躍らせている。「間もなく、数学は従来の数学とは全く異なる様相を呈するだろう」と彼は語った。リード・ハッチンソン/UCLA

こうした変化は、数学分野だけでなく、AIの影響に苦慮している他の学問分野においても議論を呼ぶだろう。AIモデルが強力な新しいツールとなるにつれ、数学者が数学的理解に直接触れる機会を失う危険性があると、アクシャイ・ヴェンカテシュ氏は述べている。（新しいタブが開きます）ベンカテシュ氏はプリンストン高等研究所に所属している。タオ氏と同様、ベンカテシュ氏も数学界で最も権威ある賞であるフィールズ賞を受賞している。両者ともAIの影響は大きいという点では一致しているが、ベンカテシュ氏はより慎重な姿勢を示している。「私たちの文化には、守るべき貴重なものがたくさんある」と彼は語った。

現在、一部の数学者は学術界を離れ、OpenAIやGoogleのような大手テクノロジー企業で働いたり、 Harmonicのような数学に特化したAIスタートアップ企業に加わったりしている。（新しいタブが開きます）論理的知能（新しいタブが開きます）公理数学（新しいタブが開きます）、およびMath Inc.（新しいタブが開きます）「企業社会で数学におけるAIへの関心が高まっている理由の一つは、汎用知能の鍵は機械学習から得られる洞察と数学から得られる精度を組み合わせることだと人々が認識し始めているからだ」とジェレミー・アヴィガドは述べた。（新しいタブが開きます）カーネギーメロン大学の数学におけるコンピュータ支援推論研究所の所長。

2026年の初めまでに、AIの力に対する衝撃は、驚きに近いものへと変化した。2月に開催された「ファーストプルーフ」と呼ばれるチャレンジでは、（新しいタブが開きます）参加者には、数学のさまざまな分野における10問の研究レベルの問題をAIモデルで解くための1週間が与えられた。数学者たちは、アルゴリズムの学習データに登場しそうにない問題を選定した。モデルは、自律性のレベルは様々だったものの、問題の半分以上を解決することに成功した。オリンピックの結果がAIが野心的な大学の数学プログラムに入学した瞬間だとすれば、First Proofの結果は、AIが大学院を卒業した瞬間と言えるだろう。結果を分析したブログ記事では、（新しいタブが開きます）リット氏は「この技術は コンピューターよりも大きな可能性を秘めている」と書いている。

創造的進化

2025年の夏はAIの能力における転換点となったが、それは突然現れたものではない。Google DeepMindの科学担当副社長であるプッシュミート・コーリ氏は、DeepMindは2018年からAIを使って数学の問題を解こうとしてきたと述べている。フランソワ・シャルトン（新しいタブが開きます）現在Axiomに所属する彼は、2019年に初めて機械学習を使って数学の問題を解決しようと試み始めた。

しかし、初期の頃はニッチな分野だった。当初、チャートン氏と数人の研究者は、新しい技術が機能するかどうかを確かめるため、既に解法が分かっている問題をAIを使って解決していた。2024年になると、彼らは本格的に研究を進め始めた。分析できる豊富なデータセットが存在する問題を探し出し、AIを使って定量化可能な特性を持つ数学的オブジェクトを構築した。例えば、二等辺三角形を形成せずにグリッド上に収まる最適な点の配置などだ。（新しいタブが開きます）。

2025年1月、タオとハビエル・ゴメス＝セラーノ（新しいタブが開きます）ブラウン大学のアダム・ワグナー氏は、ディープマインドの2人の数学者と共同研究を始めた。（新しいタブが開きます）そしてボグダン・ゲオルギエフ（新しいタブが開きます）彼らはAlphaEvolveと呼ばれるAIシステムを使用しました。AlphaEvolveは、Geminiを使って数百行にも及ぶPythonコードでプログラムを作成し、遺伝的アルゴリズムと呼ばれる手法を用いてこれらのプログラムを「進化」させ、数学の問題に対する最適な解を見つけ出そうとします。4人の数学者は、数ヶ月にわたり、1～2日おきに新しい問題にAlphaEvolveを適用しました。

そうする中で、彼らはAlphaEvolveに与える指示を改善する方法も学んだ。重要な教訓の一つは、このモデルは励ましによって効果を発揮するようだったということだ。「LLMに肯定的な強化を伴う指示を与えたとき、よりうまく機能しました」とゴメス＝セラーノ氏は語った。「『君ならできるよ』と言うなど、これは効果があるようでした。これは興味深いことです。理由は分かりませんが。」

眼鏡をかけた男性。 — ハビエル・ゴメス＝セラーノ氏とその同僚たちは、AlphaEvolveと呼ばれるAIシステムを用いて、数十もの数学の問題解決に進展を遂げた。ジェイソン・ロッシ／ブラウン大学

5月下旬までに、研究チームはAlphaEvolveを数学の様々な分野における67の異なる問題に適用した。そのうち23の問題では、AlphaEvolveは既知の最良の解をわずかに上回った。67のうち36の問題では、既存の解と同等の結果が得られ、残りの数問では、既知の最良の結果に匹敵することはできなかった。数学者たちは、2025年11月に発表した論文「大規模な数学的探究と発見」でその成果を発表した。（新しいタブが開きます）ゴメス＝セラーノ氏は、彼らの研究結果のどれもが、特定の分野の専門家が数ヶ月かけて研究すれば得られたものかもしれないと指摘した。しかし、私たちはこれらの分野の多くで専門家ではないにもかかわらず、「1日か2日で同等の結果を得ることができた」と彼は述べた。

タオ氏が述べたように、現在のAIモデルは「膨大な問題リストの中から、簡単に解決できるものを見つけ出すのが非常に得意だ。それは退屈で報われない作業であり、人間がやりたいことではない」。彼は、モデルは「報告されていない失敗の海の中で、散発的な成功を収めている」と警告した。しかし、その成功は注目に値する。

ゴメス＝セラーノ氏は、現在、自身の時間の約3分の2をAIの利用に費やしていると推定している。「AIは、有用かつ実用的な段階に達しつつある。これは、私たちが数学を行う新しい方法の始まりだ」と彼は述べた。

誤認された人違い

過去数年間、AIの特別な力は、難解な文献に埋もれた、長らく忘れ去られていた証明を掘り起こす能力にあるように思われた。イゴール・パク（新しいタブが開きます）UCLAの教授は、ChatGPTは現在「適切な参考文献や文献を見つけ、意味論的に機能しないGoogle Scholarでは見つけられないような関連性を見つける点で素晴らしい」と指摘した。

そして、2025年の間に、ヨハネス・シュミットは（新しいタブが開きます）チューリッヒ連邦工科大学での日々の中で、何かが変わった。「LLM（法学修士）の学生と話すことが役に立つようになったのは、彼らが完全な答えをくれるからではなく、良い会話相手になってくれたからだ」と彼は語った。

屋外で微笑む男性。 — ヨハネス・シュミットは最近、数学におけるAIの役割が急速に拡大していることに気づいた。それは、AIが対話相手としての役割を担うというものだ。アイトール・イリバル＝ロペス

彼が話を聞いたLLMは必然的に多くの間違いを犯し、一部の数学者はそれらを完全に無視した。多くの研究者は「それが言うことすべてが間違っているなら、それとは話さないことにする」と決めると彼は言う。しかし、彼自身もその一人である他の研究者は、「このでたらめなモデルと話す苦痛」に対してより高い耐性を持っている。彼らは、「この会話から何かを得ることができる。すべてのアイデアが良いとは限らないが、悪いアイデアは無視して良いアイデアを取り入れることができる」と言う。そして、シュミットが指摘した間違いは奇妙なものだ。数学の訓練を受けた人が、微妙で独創的で正しいアイデアを生み出すことに成功しながら、これほど多くの基本的な間違いを犯す可能性はほとんどない。

UCLAのアーネスト・リュウ（新しいタブが開きます）主に最適化理論と呼ばれる応用数学の分野で研究を行っているリュウ氏も、オリンピックの結果を受けてLLM（法学修士）に注目し始めた。AlphaEvolveが特定の量を最適化しようとしていたのに対し、リュウ氏は最適化アルゴリズムが機能する条件について証明しようとしていた。

2025年の夏、彼はLLMの数学的能力が劇的に向上していることに気づいた。彼は講義ノートの作成にLLMを使い始め、主に特定の証明の詳細に関する記憶の欠落部分を補うために利用した。彼は、「LLMは私の推論の誤りを見つけてくれることがあり、時には重大な誤り、時には軽微な誤りだった。時には、私のノートに書かれているよりも簡単な証明を見つけてくれることもあった」と語った。

彼はAIモデルが「生命の兆候を示している」と感じていた。懐疑的でありながらも楽観的だったことを覚えている。LLMが何ができて何ができないのかを自分で判断するために、彼は実験をしてみることにした。10月のある晩、幼い息子が寝た後、彼は過去に何度か試みたことのある最適化理論の未解決問題の解決に取り掛かった。今回はChatGPTを使用した。「最も重要な問題ではないが、解決策を非常にありがたく思う人が10人いることを知っている」と彼は言った。

リュウの問題は、1983年にロシアの数学者ユーリー・ネステロフによって初めて提唱されました。ネステロフは、多くの変数を入力として受け取り、特定の数学的性質において「うまく」振る舞う単一の値を出力する関数の最小値を求めようとしていました。出力が標高マップを形成すると考えると、最終的に最低点に収束し、それを求めて延々と跳ね回ることにならないことを証明したいのです。

この種の問題は応用数学、特に機械学習において頻繁に発生し、ニューラルネットワークの学習において中心的な役割を果たします。例えば、地図上のどこかからスタートするとします。勾配降下法と呼ばれる広く用いられている手法では、微積分学の基本的なツールを用いて、どちらの方向が下り坂で、自分が立っている地点での坂の傾斜がどれくらいかを判断します。毎回最も傾斜のきつい方向に一歩ずつ下っていくと、最終的には一番下までたどり着きます。

しかし、勾配降下法は正しい答えにたどり着くことはできるものの、時には非常に時間がかかることがあります。そのため、数学者たちはより速く正しい答えに収束する手法を長年模索してきました。ネステロフは、そのための手法の一つを開発しました。この手法では、下り坂の各ステップの大きさは、特定の点における関数の傾斜だけでなく、そこに至るまでに辿ってきた経路にも依存します。過去に大きなステップを踏んできた場合は、今後も大きなステップを踏むことになります。

直感的には、この方法を使えば丘の麓に早くたどり着けるのは明らかだ。しかし、速すぎて行き過ぎてしまったらどうなるだろうか？真の最小値の周りを延々と振動し続け、決してそこに到達できないというリスクがある。ネステロフは、自身のアルゴリズムが最終的に最適値に収束することを証明できなかった。そして42年間、他の誰もそれを証明できなかったのだ。

リュウ氏は、ChatGPTに質問したところ、「間違った証明ばかり返ってきた」と語った。「しかし、避けられない誤りに至るまでの過程には興味深いステップがあり、潜在的に有用と思われる正しい部分的な結果もあった」。LLMが少しずつ進歩するにつれ、リュウ氏はその回答を確認し、正しい部分だけを残して、新しいプロンプトとともにモデルにフィードバックした。「私は検証者の役割を担わなければならなかった」とリュウ氏は述べた。「ChatGPTのおかげで、一人で行うよりもはるかに速く、多くのことを迅速に進めることができていると感じた。それが私のモチベーションになった」。

彼は3日間かけて約12時間の作業を行い、問題の簡略化されたバージョンの証明にたどり着いた。さらに数日後、彼はついにネステロフの方法が収束することを証明した。（新しいタブが開きます）リュウ氏は、「最も独創的なことでも、最も複雑なことでもなかった。しかし、決して簡単なものでもなかった」と述べた。人生を変えるような成果ではないものの、「AIの要素がなくても、一流の最適化ジャーナルに掲載できるような内容だ。良い成果だ」と付け加えた。

「これは、ChatGPTの活用によって発見が本当に加速した具体的な事例です」と彼は述べた。そして、LLMの能力は今後も向上し続けるだろうと考えている。「改善のスピードを見れば、驚異的です。このまま1年後、2、3回のモデルリリースを経て、AIの支援を受けた、本当に印象的で重要な発見が実現するでしょう。それは必ず実現します。」

ネステロフの手法に関する論文を発表してから数か月後、リュウはUCLAを休職し、OpenAIに就職した。現在は同社の技術スタッフの一員である。

法廷の秩序

2025年から2026年の最初の数ヶ月にかけて、AIはますます抽象的な結果を証明するために利用されてきた。

2025年9月、世界中から100人以上の数学者がブラウン大学に集まり、代数的組み合わせ論に関する特別プログラムが開催された。（新しいタブが開きます）ニコラス・リベディンスキー（新しいタブが開きます）そしてデビッド・プラザ（新しいタブが開きます）チリ出身のホセ・シメンタル（新しいタブが開きます）メキシコ出身のジョーディー・ウィリアムソン（新しいタブが開きます）オーストラリア出身のジョーダン・エレンバーグ（新しいタブが開きます）ウィスコンシン州出身。

彼らは皆、それぞれ異なる理由から、数学の多くの分野に現れるd不変量と呼ばれる量の計算に興味を持っていた。d不変量とは何かを理解するには、まずこれらの分野の一つでよく研究されている置換群という対象を見てみるのが役立つ。この置換群は、トランプの山札のように、一連のアイテムをシャッフルするさまざまな方法を記述する方法である。

最初は単純です。カードが1枚しかないデッキの場合、シャッフルすることはできません。したがって、順列群S ₁には要素が1つあります。S 2_には2つの要素があります。カードが2枚ある場合、2通りの順序で並べることができます。S _3はもう少し複雑になります。3枚のカードのデッキを並べる方法は6通りあります。

マーク・ベラン／クアンタ・マガジン

カードの並べ方の様々なパターンは、頂点と辺からなるグラフと呼ばれるネットワークにまとめることができます。最初の並び順である123は一番下に配置されます。グラフの各辺（矢印で示されています）は、2枚のカードの交換を表しています。

カードの枚数nが大きくなるにつれて、Sn_は非常に急速に増加するため、 S4以降のグループではこのグラフを描くことはほぼ不可能になります。（_S60_には、観測可能な宇宙に存在する原子の数とほぼ同じ数の要素が含まれています。）

数学者たちは、これらのグラフの構造を、それ自体としての対象として、また他のものを分析するためのツールとして理解したいと考えている。

6 つの要素、つまり 6 つの順列を持つ順列群S ₃のグラフをもう一度考えてみましょう。これらの順列間の関係を調べたいと思います。そのための 1 つの方法は、矢印をたどってある順列から別の順列へ移動するすべての方法を調べることです。ある順列が別の順列よりも「小さい」のは、最初の順列から 2 番目の順列へ矢印に沿って移動できる場合です (Bruhat 順序と呼ばれるサイズの定義を使用)。したがって、213 は 321 よりも小さいです。

次に、2つの順列間の「ブルハット区間」を調べます。これは、グラフの矢印をたどったときに、それらの間に存在するすべての異なる順列の集合です。たとえば、213と321の間の区間（下の図の赤色で示されている）には、231と312が含まれます。（矢印をたどって一方の順列から他方の順列へ移動できない場合、例えば213から132へ移動できない場合、どちらの順列も他方より小さくはなく、それらの間の区間は定義されません。）

2つの順列に関連付けられたd不変量は、大まかに言えば、それらのブルハット間隔の根底にある構造の複雑さを測る尺度である。この同じ量は、一見無関係に見える多くの数学的問題に現れるため、数学者にとって非常に興味深いものとなっている。

より大きな順列群では、与えられた 2 つの順列間の Bruhat 間隔がどのようなものかを一般的に言うのは難しい。「間隔は非常に複雑なものです」と Libedinsky 氏は語った。彼、 Simental、Plaza、Williamson、Ellenberg は、それぞれ異なる理由で、与えられた順列群に対して可能な限り最大のd不変量を見つけたいと考え、AI の助けを借りることにした。

アクセス制限あり

一部の数学者は、AIが既存の不平等を悪化させるのではないかと懸念している。「私がAlphaEvolveを利用できたのは、アメリカで1学期を過ごしたからだということを、私は決して忘れていない」と、メキシコシティにあるメキシコ国立自治大学のホセ・シメンタル氏は語る。「私たち数学者コミュニティは、こうしたツールへの公平なアクセスを確保することに、非常に注意を払う必要があると思う。」

彼らは結局、全く別のものを発見した。

2025年10月、エレンバーグはディープマインドのワグナーに、AlphaEvolve（一般には公開されていない）を使って数十の順列群のブルハット間隔の構造を解析するよう依頼した。解析は一晩かけて行われた。「翌朝、私たちは『このプログラムは本当に面白いことをしている』と思った」とウィリアムソンは語った。「そしてその日は、メールのやり取りが立て続けにあったのを覚えている」。

LLMは計算をしながら独り言を言っていた。「この問題に対して、とんでもなく突飛な『クレイジー・イワン』作戦を提案しようと思う」と、トム・クランシーの小説『レッド・オクトーバーを追え』で有名になった、潜水艦が敵を探知するために時折行う急旋回作戦を指して、独り言を言った。

最終的に、AlphaEvolveは大きなd不変量を持つ区間を見つけようとする過程で、50行ほどのPythonコードを生成した。数学者たちがこのコードの動作を解明しようと試みる中で、エレンバーグは、デッキのカードの枚数が2のべき乗（例えば16枚、つまり2の^4乗）であれば、プログラムがはるかに短くなり、約5行になることに気づいた。「非常に明確に分析できます」とウィリアムソンは述べた。「とても美しいことをしているのです。」

5人の数学者の肖像。 — 左上から時計回りに、ジョーディ・ウィリアムソン、ジョーダン・エレンバーグ、ホセ・シメンタル、ニコラス・リベディンスキー、デビッド・プラザは、AIのおかげで、よく研究されている数学的対象の中に驚くべき新しい構造を発見した。シドニー大学;ローレン・ジャスティス、*Quanta Magazine*に寄稿。イメルダ・パレデス・サモラーノ/マテマティカス研究所 UNAM;エステバン・ロマンフェルナンダ・フエンテス

AlphaEvolveは、2026年1月3日のプレプリントで、Bruhat間隔が（新しいタブが開きます）これらの特定の順列群には、驚くほど特殊な構造がありました。研究者たちが区間を調べたところ、ハイパーキューブと呼ばれる高次元の立方体を形成していることがわかりました。「AlphaEvolveが何を考えているのかを見ると、本当に驚きました」とリベディンスキー氏は語りました。「もしそれが人間だったら、非常に創造的な人間でしょう。」

AlphaEvolveは、彼らが気づいていなかった疑問に答えてくれた。「私たちはAlphaEvolveに大きなハイパーキューブを見つけるように頼んだわけではありません」とエレンバーグ氏は語った。「何か別のものを見つけるように頼んだのですが、考えてみると、そこに巨大なハイパーキューブが存在することに気づいたのです。それは私たちが予想していなかったものでした。」

これは、数学者たちがAlphaEvolveに与えた課題からの抜粋で、カケヤ集合と呼ばれるオブジェクトを構築するように指示した内容である。数学者たちは、AIは励ましを受けることでより良いパフォーマンスを発揮することを発見した。

ウィリアムソン氏が述べたように、「それは50年間、私たちの目の前にあった建造物だった。ただ、私たちはそれに気づいていなかっただけだ。」

従来の機械学習手法でも、誰も思いつかなかったパターンを発見するなど、こうした偶然の数学的発見は可能だった。しかし、ウィリアムソン氏によれば、以前は「まさにエンジニアリングの努力が必要だった。コーディングの知識が必要で、ニューラルネットワークのトレーニングの詳細をじっくりと調べる必要があった。基本的に、機械学習の知識がほとんどない数学者にとって、これは非常に困難だった」という。

LLM（法学修士）を取得したことにより、「2年前なら2週間かかっていた実験を、今では20分で済ませられるようになった」と彼は語った。「ほとんどの場合うまくいかない」ものの、AIは今やかつてないほど活用され、「想像を絶するほどの豊かさを秘めた世界を発見する」ことができるようになったという。

球体の周り

ブルハット間隔は純粋に組み合わせ論的な対象のように見えるが、代数幾何学と呼ばれる数学の特に抽象的な分野でも重要な役割を果たしている。（新しいタブが開きます）スタンフォード大学の数学者であり、現大統領（新しいタブが開きます）アメリカ数学会の会員であり、専門分野は。

^{代数幾何学と}は、x³ + 2x²y + xz = 5のような多項式方程式で定義される図形を研究する学問であり、これらの方程式は^、整数指数で累乗された変数の和を含みます。方程式の次数は、多項式が持つ最大の指数であり、この場合は3です。

柱の前に立つ眼鏡をかけた男性。 — ラヴィ・ヴァキル氏と彼の同僚たちは最近、特注版のジェミニと会話しているうちに、斬新な証明のアイデアを思いついた。「このアイデアは誰のおかげだろう？」と彼は問いかけた。「私たちのおかげだろうか？それともモデルのおかげだろうか？」ロッド・サーシー

ヴァキルと彼の同僚、バラズ・エレク（新しいタブが開きます）ニューサウスウェールズ大学とジム・ブライアン（新しいタブが開きます）ブリティッシュコロンビア大学の研究者たちは、球体を旗多様体と呼ばれる特殊な空間に埋め込む方法の研究に興味を持っていた。（旗多様体はブルハット研究チームの論文にも登場する。）球体上の各点を旗多様体内の点に関連付ける方法である各埋め込みは、多項式方程式で定義できる。

球面を埋め込む方法は数多く存在する。数学者たちは、それぞれの埋め込みを、別々の高次元空間における独立した点として表現する。そして、異なる次数の多項式によって定義される埋め込みが形成する様々な空間を分析することで、それらを研究する。

次数が増加するにつれて、数学者たちはこれらの空間がどのように変化するのかを理解したいと考えている。次数が任意に大きくなると、つまり無限大に近づくと、その空間は多項式で定義されるものだけでなく、すべての連続埋め込みの空間に似てくることは分かっていた。しかし、この類似性はいつ生じるのだろうか？

AlphaEvolveは、置換群のブルハット間隔に関する問題を解決しようとする際に、自己対話を行った。

ヴァキル氏と彼の同僚たちは、驚くべきことに、それが非常に速やかに起こることを示唆する事例を発見した。「無限大に達するまで起こらないはずだった一貫性が、すでに起こっていたのです」と彼は述べた。

フレディ・マナーズと共に（新しいタブが開きます）そしてジョージ・サラファティノス（新しいタブが開きます）当時DeepMindに勤務していた彼らは、Google Gemini上に構築された2つの特殊モジュール、公開されているDeepThinkと、Salafatinosが開発した非公開のFullProofというシステムを使って、それを証明しようと試みた。彼らはより単純なケースから始めた。「その証明は非常に洗練されていて、正確で、美しく書かれていました。一行ずつ追うことができました」とVakilは語った。「当時は明らかではなかった構造が明確になりました。そこから、議論全体と重要な一般化がどのように機能する可能性があるかを理解しました。」

ヴァキル氏と彼の同僚はその後、AIモデルに戻り、一般的なケースの証明を概説し、詳細を補完するようにAIに依頼した。2026年1月12日のプレプリントで報告されたように（新しいタブが開きます）そして、それは成功した。「私にとって、本当のことは最初のことだった」とヴァキルは言う。それは、より単純なケースを証明したDeepMindの成果だ。「議論の明快さが、私たちに新しいアイデアを与えてくれた」。しかし彼は疑問に思う。「そのアイデアは誰のおかげだろうか？私たちのおかげだろうか？それともモデルのおかげだろうか？」

功績を誰に帰するかは別として、ヴァキル氏は「十分な時間があれば、私はその証拠を見つけ出せたはずだ」と述べた。

しかし彼はためらった。「そう思う。確信はない。分からない。もしかしたら、ぎこちないやり方でやっていたかもしれない。おそらく、その助けがなければ論文は完成しなかっただろう。」

そして最後に、「私たちは試行錯誤を繰り返す必要がありました。AIモデルは、これまで時間がなくてできなかったことを可能にすることで、数学の研究を支援してくれるでしょう。」

これは、現代においてAIがいかに役立つかを示す典型的な例と言えるでしょう。一群の熟練した数学者たちが、大手テクノロジー企業の支援を受けて、本来であれば不可能だったであろう速さで何かを解明します。しかも、一行ずつ検証できるため、その正しさを確信できるのです。

知っておくべきことすべて

AIが数学研究にどのような影響を与えているかを問う際には、成功事例だけを見るべきではない。リット氏は「AIが生み出すナンセンスによって、共有財産が汚染されている」と警告した。ジョエル・デイビッド・ハムキンス（新しいタブが開きます）ノートルダム大学の教授は、「私たちの学術誌システムを圧倒しているこの膨大な量の論文に絶望している」と述べた。

数学者たちは、この混乱の海を航海する手段として、形式的な証明に望みを託している。彼らは証明をコンピュータが理解できる言語に変換し、コンピュータプログラムを使って証明のすべての論理が成り立つことを検証している。「検証のないAIは信頼性が低すぎて、本格的な応用には役立たない」とタオ氏は語った。

現在、このような方法で数学的証明を形式化する作業は、時間のかかる複雑なプロセスであり、それ自体が高度な数学的知識を必要とする、ある種の職人技と言える。そのため、数学者たちは、AIモデルが数学的な命題を形式的で論理的な命題に変換し、それを証明していく「自動形式化」にますます注目している。「初めて、数学のかなりの部分をAIによって形式化できるような気がしてきた」とタオ氏は語った。

多くの数学者が、AIの数学能力の向上に伴うもう一つの大きな課題として挙げているのは、それが学生の学習方法にどのような影響を与えるかということだ。AIの最も熱心な支持者でさえ、この点については懸念を抱いている。最近休職してAxiomの「創設数学者」となったバージニア大学のケン・オノ教授は、「AIが数学研究に役立つ可能性については明るい見通しを持っているが、あらゆるレベルの仕事や教育におけるAIの役割については深く懸念している」と私に語った。

タオ氏は、「私たちが生徒に課す問題の多くは、AIが瞬時に解決できてしまう。そのため、多くの生徒が思考力を鍛える意欲を失ってしまう可能性がある」と述べた。

ハムキンス氏も同意した。「以前はかなりの量の宿題を出していたが、もう無理だ」と彼は述べた。学生が提出する課題のかなりの割合がAIによって作成されているからだ。「私はそれを読みたくない。AIの監視役になりたくないんだ」。宿題は教育的に非常に価値があったが、今では「すべて授業内での小テストと課題で済ませなければならない。これは学術界全体にとっての問題だ」。

ある一流研究大学の数学者が私に語ったように、「AIは、真剣な数学研究者の進歩を加速させる一方で、より多くの数学研究者を育成することを阻害するという深刻なリスクがある」。

新しい共著者

数学研究にAIを活用することは急速に一般的になりつつあり、現在の傾向が続けば、数学者が技術的な表現を整形するために使用するLaTeX組版言語の使用と何ら変わらないものになるだろう。この記事で取り上げた成果以外にも、ここ数ヶ月で数十件もの成果が発表されている。

AIの貢献をどのように評価するかについては、いまだに規範が形成されつつある段階です。論文によっては、人間の数学者がLLMとどのようにやり取りしたかについての詳細な補足情報（会話の記録を含む）を掲載しているものもあります。要約の中でAIの貢献を大きく取り上げているものもあれば、謝辞の中でAIの協力について簡単に触れているだけのものもあります。数学者の中には、AIが研究を支援したものの、論文は自分自身で執筆したと強調する人もいれば、執筆にもAIの貢献を認めている人もいます。

この1年間の急速な変化にもかかわらず、この記事の取材で話を聞いた数学者たちは、数学という学問が時代遅れになることを恐れてはいない。タオ氏は、数学者たちが「高い山々や多くの丘陵地帯がある大きな山脈」を登ろうとしている様子を例に挙げた。人間は一度に一歩ずつしか登れないが、エベレストのような山の頂上までのルートを計画することはできる。一方、現在のAIはジャンプするロボットのようなものだとタオ氏は言う。人間が登れない6フィートの壁を「パルクールのように登り切る」ことはできるかもしれないが、長期的な戦略計画を立てることはできない。その6フィートが10フィート、あるいは100フィートになるかもしれないとタオ氏は想像するが、「小さなジャンプするロボットは、数学のエベレストには到底及ばない」。

パク氏は、 π + eのような和を分数で表せるかどうかといった数論における大きな問題など、いくつかの難問は今後何世紀にもわたって未解決のまま残るだろうと考えている。「AI がそこに少しでも貢献できるとは到底思えません」と彼は述べた。「これは AI が成し遂げられることではありません。しかし、人類が生き残れば、いずれは解決できると確信しています。」

もちろん、今後の数年間でAIアルゴリズムの能力がどのように変化し向上するかに大きく左右される。最も鋭敏で慎重な観察者でさえ、モデルがどのように発展していくかを確実に予測することはできない。停滞の兆候を感じている者はほとんどいない。「物事は非常に速いスピードで進んでいます。減速の兆候は全く見られません」とリット氏は語った。2026年の最初の数か月で、Googleのような大手企業から新しい成果が次々と発表されている。（新しいタブが開きます）そしてOpenAI（新しいタブが開きます）そしてAxiomのような小規模なもの（新しいタブが開きます）学者からも（新しいタブが開きます）そして趣味で楽しむ人（新しいタブが開きます）。

「20年後には、AIツールが生み出す数学が、多くの点で人間の数学者を凌駕するようになるだろうと私は確信している」とリット氏は述べた。「もしそうならなかったら、私は驚くだろう。」

しかし、ヴェンカテシュ氏が私に語ったように、「結局のところ、どんな数学の問題でも、定式化する方法には無限の可能性がある」。私たちが下す選択は、人間の価値観によって左右され、数学が科学であるだけでなく芸術でもあるという事実によって形作られる、と彼は述べた。

科学と芸術のこうしたバランスこそが、数学に美しさを与えている大きな要因であり、ヴェンカテシュ氏が守り続けたい「私たちの文化における貴重なもの」の一つだ。もしAIが数学をその芸術的遺産から遠ざけてしまうなら、たとえ毎月新たな定理が証明されたとしても、数学という学問分野は衰退してしまうだろう。結局のところ、ソネットの最適な形を見つけるために統計的回帰分析を行うことを真剣に語る詩人はいないのだから。

AIに対する最大の期待は、数学者がこれまで謎のままだった事柄を発見し、証明するのを助けることにある。ほとんどの数学者は、過去80年間、コンピューターがまさにそれを成し遂げてきたと認めている。しかし、現在進行中の変化の規模は、多くの人々に不安感を与えている。

世界最大の数学の年次会議は毎年1月初旬に開催される。2026年、ワシントンDCでは、AIによって時代遅れになるという不安げな冗談が飛び交ったが、表向きには誰もがAIは人間の数学者の助け手になると主張していた。長年AIに取り組んでおり、AIに非常に興奮しているウィリアムソンは、一連の権威ある講演を行うために選ばれた。（新しいタブが開きます）彼は会議参加者全員に向けて、AIと数学について講演した。そして、AIの発展に対して無知や恐怖で反応するのは間違いだと聴衆に語った。

しかし彼は、その恐怖がどこから来るのか理解していると述べた。

彼は数学を「人々が人生をかけて、人生を捧げてきた技術」と捉えており、「将来、その価値が大きく低下する可能性もある」と語った。

Reference : The AI Revolution in Math Has Arrived
https://www.quantamagazine.org/the-ai-revolution-in-math-has-arrived-20260413/

創造的進化

誤認された人違い

法廷の秩序

球体の周り

知っておくべきことすべて

関連記事:

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル