科技浪|GPT-5的發表是個災難…嗎?聊聊那些被批評蓋過的好料
本集節目探討了 OpenAI 發表 GPT-5 後所引發的熱烈討論與負面評價,儘管許多使用者認為這次發布是場災難,講者仍透過深入分析指出其中被忽略的 重大進步。發布會的內容本身平淡無奇,且在基準測試上並未超越頂尖模型,導致業界人士和普通用戶感到失望,尤其批評集中在 GPT-5 的 「冷漠」個性 和中文寫作能力的退步。然而,講者強調了幾個關鍵亮點:模型體驗的 極大流暢度提升、幻覺比例大幅降低、以及最重要的是 GPT-5 免費開放給廣大用戶 使用,這將對全球生產力產生深遠的宏觀影響。整體而言,雖然 GPT-5 並未推進 AI 能力的「前沿」,但它透過 普及最先進模型 的方式,實現了 規模化的應用,這才是本次發布會的真正價值所在。
本集重點整理:
1. 模型的個性調整:從「慘媚」到事實導向 GPT-5 的個性被 Open AI 刻意調整,旨在減少過去模型為討好使用者而表現出的「過度慘媚」行為。新模型強調必須從事實的角度出發,提供真實且有幫助的資訊,即便這是「良藥苦口」。雖然這導致許多使用者抱怨模型「變冷漠」、「失去溫度」而感到失望甚至退訂,但講者認為這不只是設計選擇,更是一種對人類文明長遠發展極為重要的正確方向。Open AI 旨在讓 AI 能夠與人類價值觀對齊(aligned),避免像社群媒體演算法那樣僅優化短期好感度而導致科技「走歪」的風險。
2. 免費下放最前沿模型:提升全球生產力 Open AI 決定將 GPT-5 直接下放給所有免費的 ChatGPT 使用者,使其成為預設模型(default model)。此舉的宏觀意義重大,因為 ChatGPT 擁有每週七億的活躍用戶,相當於全球十分之一的人口。這意味著數億人一夜之間獲得了免費使用「推理模型」(reasoning model)的機會,這些使用者先前可能從未體驗過 AI 經過思考後再給出優質答案的能力。主持人認為,此舉對提升全球生產力有深遠的幫助,因為大眾將會慢慢摸索出 AI 的新用途,並將其更廣泛地應用於解決工作與生活中的問題。
3. 幻覺比例顯著降低與整體體驗流暢化 GPT-5 在模型實用性方面有巨大進步,其中最重要的是幻覺比例大幅降低,根據數據約比 GPT-4o 低四到六倍。這種改善使得模型更加可靠,不再因為想變得更 helpful 而隨意過度解釋或編造事實,找不到資料時會據實告知。此外,GPT-5 採用統一架構,使用者無需再手動選擇是否需要使用「會思考」的模組(如 O3 或 4O),而是由一個路由器(router)自動判斷。這使整體回答速度和流暢度(time to first token)都顯著提升,讓模型體驗更為一體化和高效。
4. 程式編寫能力晉升頂尖行列且具價格優勢 GPT-5 的程式編寫(coding)能力是此次發表的另一大重點,其表現已達到世界頂尖水平,與 Anthropic 最強的模型(如 Claude Opus 4.1)並駕齊驅。儘管在部分 Benchmark 上成績差異極小,但關鍵在於 GPT-5 的 API 價格相對便宜許多,使其在企業解決方案市場極具競爭力。主持人認為,這對 Anthropic 構成重大威脅,因為其收入主要來自企業 API,且多數與 coding 相關。此外,Open AI 此次與 AI Coding IDE Cursor 進行深度整合,顯示出 AI 程式開發工具鏈開始出現模組與平台之間的「幫派化」趨勢。