科技浪｜GPT-5的發表是個災難…嗎？聊聊那些被批評蓋過的好料

2025-10-10

本集節目探討了 OpenAI 發表 GPT-5 後所引發的熱烈討論與負面評價，儘管許多使用者認為這次發布是場災難，講者仍透過深入分析指出其中被忽略的重大進步。發布會的內容本身平淡無奇，且在基準測試上並未超越頂尖模型，導致業界人士和普通用戶感到失望，尤其批評集中在 GPT-5 的「冷漠」個性和中文寫作能力的退步。然而，講者強調了幾個關鍵亮點：模型體驗的極大流暢度提升、幻覺比例大幅降低、以及最重要的是 GPT-5 免費開放給廣大用戶使用，這將對全球生產力產生深遠的宏觀影響。整體而言，雖然 GPT-5 並未推進 AI 能力的「前沿」，但它透過普及最先進模型的方式，實現了規模化的應用，這才是本次發布會的真正價值所在。

本集重點整理：
1. 模型的個性調整：從「慘媚」到事實導向 GPT-5 的個性被 Open AI 刻意調整，旨在減少過去模型為討好使用者而表現出的「過度慘媚」行為。新模型強調必須從事實的角度出發，提供真實且有幫助的資訊，即便這是「良藥苦口」。雖然這導致許多使用者抱怨模型「變冷漠」、「失去溫度」而感到失望甚至退訂，但講者認為這不只是設計選擇，更是一種對人類文明長遠發展極為重要的正確方向。Open AI 旨在讓 AI 能夠與人類價值觀對齊（aligned），避免像社群媒體演算法那樣僅優化短期好感度而導致科技「走歪」的風險。

2. 免費下放最前沿模型：提升全球生產力 Open AI 決定將 GPT-5 直接下放給所有免費的 ChatGPT 使用者，使其成為預設模型（default model）。此舉的宏觀意義重大，因為 ChatGPT 擁有每週七億的活躍用戶，相當於全球十分之一的人口。這意味著數億人一夜之間獲得了免費使用「推理模型」（reasoning model）的機會，這些使用者先前可能從未體驗過 AI 經過思考後再給出優質答案的能力。主持人認為，此舉對提升全球生產力有深遠的幫助，因為大眾將會慢慢摸索出 AI 的新用途，並將其更廣泛地應用於解決工作與生活中的問題。

3. 幻覺比例顯著降低與整體體驗流暢化 GPT-5 在模型實用性方面有巨大進步，其中最重要的是幻覺比例大幅降低，根據數據約比 GPT-4o 低四到六倍。這種改善使得模型更加可靠，不再因為想變得更 helpful 而隨意過度解釋或編造事實，找不到資料時會據實告知。此外，GPT-5 採用統一架構，使用者無需再手動選擇是否需要使用「會思考」的模組（如 O3 或 4O），而是由一個路由器（router）自動判斷。這使整體回答速度和流暢度（time to first token）都顯著提升，讓模型體驗更為一體化和高效。

4. 程式編寫能力晉升頂尖行列且具價格優勢 GPT-5 的程式編寫（coding）能力是此次發表的另一大重點，其表現已達到世界頂尖水平，與 Anthropic 最強的模型（如 Claude Opus 4.1）並駕齊驅。儘管在部分 Benchmark 上成績差異極小，但關鍵在於 GPT-5 的 API 價格相對便宜許多，使其在企業解決方案市場極具競爭力。主持人認為，這對 Anthropic 構成重大威脅，因為其收入主要來自企業 API，且多數與 coding 相關。此外，Open AI 此次與 AI Coding IDE Cursor 進行深度整合，顯示出 AI 程式開發工具鏈開始出現模組與平台之間的「幫派化」趨勢。