Google、OpenAI拿下數學奧林匹亞金榜 證明推理解題不輸人類
記者鄧天心/綜合報導
AI對複雜數學推理能力,似乎能與人類天才並駕齊驅了,Google DeepMind的Gemini模型以及OpenAI最新開發的大型語言模型這兩大科技巨頭幾乎在同一時間宣布,他們研發的AI成功解出了國際數學奧林匹亞(IMO)的試題,同時達到金牌,兩套AI都展現出能和人類數學高手差不多的能力。

延伸閱讀:
OpenAI攜軟銀的5,000億美元「星際之門」縮水 短期僅建小型數據中心
Google負責開發的團隊用了升級版Gemini,可以直接用自然語言閱讀IMO的題目,它在4.5小時內,逐題思考、證明,最終獲得滿分42分中的35分,通過了IMO官方審查,也被正式列入比賽記錄,成為史上首個獲得IMO金牌分數的AI。
OpenAI沒有正式參賽,但他們將自家剛研發完成、尚未對外開放的大型語言模型挑戰同組IMO題目,研究團隊強調,這套模型的運作邏輯並非為數學賽事特別設計,而是把重點放在培養AI的通用推理。
比賽過程全程錄影,他們讓多位前IMO金牌和數學家組成的獨立評審團替AI評分,最終也得到與Google Gemini同等的金牌成績,2025年賽事中,全球630位參賽學生僅67人奪金,Google與OpenAI的AI則超過「人類平均」。
Google DeepMind負責人Junehyuk Jung形容,AI未來不會只是純粹「工具」,而是有可能和科學家們並肩合作,OpenAI則一再強調,他們的目標不是「打敗」人類選手,而是讓AI協助解決更複雜的問題。
雖然目前AI仍無法百分百全解最難題目,但成為金牌級「AI數學選手」已經達到新的里程碑。