一次單挑30位頂尖數學家 OpenAI o4-mini 10分鐘破解天才級難題

記者鄧天心/綜合報導

到底AI推理思考有沒有辦法超越人類?今年美國加州五月Epoch AI舉辦一場閉門會議,集結全球30位頂尖數學家,針對OpenAI最新的o4-mini模型出題驗證,o4-mini模型能預測語句、生成文本,還以理解、分析,甚至能解開連博士級數學家都可能會被難倒的問題。

b9d2673b 72d2 4c15 9717 bc7b349c2973 1
AI推理能力超越全球30位頂尖數學家。(圖/AI生成)

延伸閱讀:

挑戰Google!Perplexity攜手輝達推瀏覽器Comet 瞄準手機內建市場

xAI爭議不斷:虛擬女友、反猶言論 馬斯克考慮推兒童版AI「Baby Grok」

為什麼AI寫的文章有種「機器味」?研究指出:你的感覺其實沒錯

Epoch AI是一家專門驗證新模型並評估推理能力的非營利組織,他們從2024年9月起啟動測試計劃「FrontierMath」,邀請資深數學家們設計出超過300個新題目,這些題目從大學到學術研究等級,甚至有需要像是「天才」的數學家才有辦法解的開的題目。

兩天實體會議中,30位數學家被分為數組,遊戲規則是每出現一題連o4-mini都無法解答的問題,出題人可獲得7,500美元的報酬,題目挑戰性不斷提高,而參與者都不能用一般的電子郵件跟外界溝通,都必須透過加密訊息軟體Signal,就是怕被AI發現討論過程。

參與其中的維吉尼亞大學教授Ken Ono表示,他特地準備一個原以為能難倒機器的題目,沒想到o4-mini只花了短短十分鐘,不僅完整讀懂相關領域論文,就給出正確且有條理的解答,不少學者坦言,如今AI不只達到研究生水準,更逼近數學天才的境界。

專案負責人透露,o4-mini僅用一年時間就從只會背誦,到現在可結合知識推理、推出新解法,認為AI進步超乎我們想像,AI前所未有的解題效率,也讓人們不得不重新思考未來與AI的合作又會是什麼樣。

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button