一次單挑30位頂尖數學家 OpenAI o4-mini 10分鐘破解天才級難題

2025-07-21

記者鄧天心／綜合報導

到底AI推理思考有沒有辦法超越人類？今年美國加州五月Epoch AI舉辦一場閉門會議，集結全球30位頂尖數學家，針對OpenAI最新的o4-mini模型出題驗證，o4-mini模型能預測語句、生成文本，還以理解、分析，甚至能解開連博士級數學家都可能會被難倒的問題。

b9d2673b 72d2 4c15 9717 bc7b349c2973 1 — AI推理能力超越全球30位頂尖數學家。（圖／AI生成）

延伸閱讀：

挑戰Google！Perplexity攜手輝達推瀏覽器Comet 瞄準手機內建市場

xAI爭議不斷：虛擬女友、反猶言論馬斯克考慮推兒童版AI「Baby Grok」

為什麼AI寫的文章有種「機器味」？研究指出：你的感覺其實沒錯

Epoch AI是一家專門驗證新模型並評估推理能力的非營利組織，他們從2024年9月起啟動測試計劃「FrontierMath」，邀請資深數學家們設計出超過300個新題目，這些題目從大學到學術研究等級，甚至有需要像是「天才」的數學家才有辦法解的開的題目。

兩天實體會議中，30位數學家被分為數組，遊戲規則是每出現一題連o4-mini都無法解答的問題，出題人可獲得7,500美元的報酬，題目挑戰性不斷提高，而參與者都不能用一般的電子郵件跟外界溝通，都必須透過加密訊息軟體Signal，就是怕被AI發現討論過程。

參與其中的維吉尼亞大學教授Ken Ono表示，他特地準備一個原以為能難倒機器的題目，沒想到o4-mini只花了短短十分鐘，不僅完整讀懂相關領域論文，就給出正確且有條理的解答，不少學者坦言，如今AI不只達到研究生水準，更逼近數學天才的境界。

專案負責人透露，o4-mini僅用一年時間就從只會背誦，到現在可結合知識推理、推出新解法，認為AI進步超乎我們想像，AI前所未有的解題效率，也讓人們不得不重新思考未來與AI的合作又會是什麼樣。

標籤

2025-07-21

發佈留言取消回覆

很抱歉，必須登入網站才能發佈留言。