Google、OpenAI拿下數學奧林匹亞金榜 證明推理解題不輸人類

記者鄧天心/綜合報導

AI對複雜數學推理能力,似乎能與人類天才並駕齊驅了,Google DeepMind的Gemini模型以及OpenAI最新開發的大型語言模型這兩大科技巨頭幾乎在同一時間宣布,他們研發的AI成功解出了國際數學奧林匹亞(IMO)的試題,同時達到金牌,兩套AI都展現出能和人類數學高手差不多的能力。

341a53dc 2d55 4813 b126 86b10f4e2e72
Google(Alphabet 旗下 DeepMind)和 OpenAI 各自開發的 AI 模型,首次在國際數學奧林匹亞(IMO)賽事中同時解出五道高難度題目,拿下金牌標準分數35分,與全球前10%的人類菁英數學選手並駕齊驅。(圖/AI生成)

延伸閱讀:

川普的「科技新歡」換人!黃仁勳成他的最愛 蘋果庫克慘遭冷落

OpenAI攜軟銀的5,000億美元「星際之門」縮水 短期僅建小型數據中心

Netflix承認用了AI 縮短傳統特效成本10分之1

Google負責開發的團隊用了升級版Gemini,可以直接用自然語言閱讀IMO的題目,它在4.5小時內,逐題思考、證明,最終獲得滿分42分中的35分,通過了IMO官方審查,也被正式列入比賽記錄,成為史上首個獲得IMO金牌分數的AI。

OpenAI沒有正式參賽,但他們將自家剛研發完成、尚未對外開放的大型語言模型挑戰同組IMO題目,研究團隊強調,這套模型的運作邏輯並非為數學賽事特別設計,而是把重點放在培養AI的通用推理。

比賽過程全程錄影,他們讓多位前IMO金牌和數學家組成的獨立評審團替AI評分,最終也得到與Google Gemini同等的金牌成績,2025年賽事中,全球630位參賽學生僅67人奪金,Google與OpenAI的AI則超過「人類平均」。

Google DeepMind負責人Junehyuk Jung形容,AI未來不會只是純粹「工具」,而是有可能和科學家們並肩合作,OpenAI則一再強調,他們的目標不是「打敗」人類選手,而是讓AI協助解決更複雜的問題。

雖然目前AI仍無法百分百全解最難題目,但成為金牌級「AI數學選手」已經達到新的里程碑。

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button