OpenAI再發震撼!GPT-5.5實測效能強到不科學 連演算法都是AI自己寫的!

記者鄧天心/綜合報導

OpenAI近期正式發表傳聞已久的全新旗艦級大語言模型GPT-5.5,先前坊間盛傳該模型內部代號為Spud,但最終定名為GPT-5.5,根據最新數據,GPT-5.5不僅重奪大眾可用模型的效能榜首,在Terminal-Bench 2.0基準測試中,以82.7%的準確率微幅超越Anthropic尚未公開的Claude Mythos Preview(82%),OpenAI研究副總裁阿米莉亞格萊斯指出,無論是內部測試或合作夥伴的回饋,都證明這是目前最強大的程式碼編寫與邏輯推理模型。

OpenAI。(圖/123RF)
史上最貴AI誕生!GPT-5.5 Pro價格翻倍卻讓矽谷搶瘋。(圖/123RF)

OpenAI共同創辦人葛雷格布羅克曼強調,GPT-5.5最大的特色在於其直覺性,能夠在指令模糊的情況下自主判斷後續步驟,擅長處理程式碼開發、科學研究與複雜的電腦自動化操作。相較於前代產品GPT-5.4,新模型在處理繁瑣的多階段任務時,不再需要用戶頻繁給予引導式提示即可獨立完成任務,例如在不受人為干預的情況下跨文件進行數據除錯。此外,為了應對不同層級的需求,OpenAI同時推出了GPT-5.5 Pro版本,專為法律研究與高級業務分析等高風險領域設計,提供更高精準度的邏輯架構。

更多科技工作請上科技專區:https://techplus.1111.com.tw/

科技社群討論區:https://pei.com.tw/feed/c/tech-plus

GPT-5.5部署在NVIDIA最新的GB200與GB300 NVL72系統上,並運用由AI自行撰寫的啟發式演算法來平衡GPU運算資源,成功讓Token生成速度提升超過20%。雖然在純學術知識的測試中,GPT-5.5 Pro仍微幅落後於Anthropic的Opus 4.7,但其在14項主流測試指標中的表現,足以證明OpenAI在電腦使用與代理效能方面的領先優勢。然而,這種技術躍進也伴隨著API使用成本的翻倍成長,且開發者目前尚無法透過API存取,必須等待OpenAI完成更嚴格的安全防護部署。

目前GPT-5.5僅開放給ChatGPT Plus、Pro、Business及Enterprise等付費訂閱用戶。早期測試者對這款模型的評價極高,甚至有工程師形容失去存取權限就像「被截肢」般失落,傑克遜實驗室與Axiom Bio等專業機構的研究人員也紛紛指出,GPT-5.5能將過去耗時數月的研究工作縮短至數分鐘內完成,OpenAI首席科學家雅各布帕喬基表示,雖然GPT-5.5效能驚人,但目前的Scaling能力尚未見底,未來仍有空間訓練出更聰明、更具智慧的模型。

延伸閱讀:

還在手打Excel?微軟產品正式上線「氛圍式工作」 傳統辦公軟體將走入歷史

資料來源:venture beat

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button