OpenAI推出「比博士還強」的GPT-5 卻比GPT-4o更冷漠
記者鄧天心/綜合報導
OpenAI於2025年8月推出的GPT-5,已經從單純的對話AI大幅進化為能自主規劃、推理與深度搜尋的「研究型AI」,官方實測顯示,GPT-5不僅在專業知識面(數學、程式、多模態、健康等領域)基準測試大幅刷新紀錄,更在「減少幻覺(事實錯誤)」、「提升指令遵循」、「降低諂媚回答」等關鍵指標上,均有進步。
根據OpenAI官方資料,GPT-5在PhD等級科學問題準確率達89.4%,真實世界程式任務達74.9%,幻覺率比GPT-4o降低45%,比前代o3更降低80%。

GPT-5最大的特色在於內建「思考」功能(Research Goblin模式),能根據任務複雜度自動切換模型深度,針對開放式、複雜問題啟動多層次推理與網路搜尋,並主動交叉比對各類來源,大幅提升回答的深度與可信度,無論是冷門歷史考證、超市品牌比較、AI訓練數據來源,甚至PDF文件解讀,GPT-5都能展現自主調查能力,部分案例甚至能草擬專業郵件、建議聯繫管道,讓AI助手從「內容生成者」升級為「研究合夥人」。
然而,GPT-5的上市並非一帆風順,英國科技媒體TechRadar實測報導指出:「GPT-5雖然在技術指標與專業問題解決能力上大幅領先,但在日常對話、情感支持與創意寫作等『人性化』場景,用戶普遍反映GPT-5語氣偏正式、回答速度較慢,少了GPT-4o那種自然流暢的親切感。」
例如,在摘要電影、辯論技巧、逐步指導、情感支持等實用場景測試中,GPT-4o在五項測試中贏得四項,僅創意寫作與GPT-5打平,TechRadar測試者總結,GPT-4o在情感層面上與我建立了更好的連結,感覺像是你的朋友;而GPT-5更像高中老師,聰明、條理分明,但總覺得有點生疏。
資料來源:OpenAI