OpenAI推出「比博士還強」的GPT-5 卻比GPT-4o更冷漠

2025-09-08

記者鄧天心／綜合報導

OpenAI於2025年8月推出的GPT-5，已經從單純的對話AI大幅進化為能自主規劃、推理與深度搜尋的「研究型AI」，官方實測顯示，GPT-5不僅在專業知識面（數學、程式、多模態、健康等領域）基準測試大幅刷新紀錄，更在「減少幻覺（事實錯誤）」、「提升指令遵循」、「降低諂媚回答」等關鍵指標上，均有進步。

根據OpenAI官方資料，GPT-5在PhD等級科學問題準確率達89.4%，真實世界程式任務達74.9%，幻覺率比GPT-4o降低45%，比前代o3更降低80%。

GPT-5最大的特色在於內建「思考」功能（Research Goblin模式），能根據任務複雜度自動切換模型深度，針對開放式、複雜問題啟動多層次推理與網路搜尋，並主動交叉比對各類來源，大幅提升回答的深度與可信度，無論是冷門歷史考證、超市品牌比較、AI訓練數據來源，甚至PDF文件解讀，GPT-5都能展現自主調查能力，部分案例甚至能草擬專業郵件、建議聯繫管道，讓AI助手從「內容生成者」升級為「研究合夥人」。

然而，GPT-5的上市並非一帆風順，英國科技媒體TechRadar實測報導指出：「GPT-5雖然在技術指標與專業問題解決能力上大幅領先，但在日常對話、情感支持與創意寫作等『人性化』場景，用戶普遍反映GPT-5語氣偏正式、回答速度較慢，少了GPT-4o那種自然流暢的親切感。」

例如，在摘要電影、辯論技巧、逐步指導、情感支持等實用場景測試中，GPT-4o在五項測試中贏得四項，僅創意寫作與GPT-5打平，TechRadar測試者總結，GPT-4o在情感層面上與我建立了更好的連結，感覺像是你的朋友；而GPT-5更像高中老師，聰明、條理分明，但總覺得有點生疏。

資料來源：OpenAI