OpenAI 推出 GPT-4 考試所向無敵 脾氣仍很暴躁

編譯/莊閔棻

OpenAI宣布了其主要大型語言模型GPT-4的最新版本,並表示,其在許多專業測試中表現出「人類水準的性能」。

OpenAI 推出 GPT-4 考試所向無敵 脾氣仍很暴躁。示意圖/123RF

根據外電綜合報導, ChatGPT-4比以前的版本「更大」,這代表了,其在更多的數據上進行了訓練,並模型文件中有更多的權重(Weight)。OpenAI聲稱該模型「比以前更有創造性和協作性」,並「可以更準確的解決困難的問題」。

OpenAI表示,新模型將產生更少事實錯誤答案,更少陷入走火入魔的狀況和談論禁忌話題,甚至在許多標準化測試中表現得比人類更好。OpenAI強調,該系統已經經過了6個月的安全培訓,且在內部測試中,它「與GPT-3.5相比,對不允許的內容請求的回應減少了82%,產生事實性回應的可能性增加了40%。」該公司還聲稱,GPT-4在模擬的律師考試中贏過了90%的人類,在SAT閱讀考試中則是贏過93%的人,而在SAT數學考試中也贏過了89%。

不過,OpenAI警告也說,此新系統仍然有和許多早期語言模型相同的問題,包括編造資訊或有「幻覺」傾向,並仍然容易在錯誤的時候堅持認為自己是正確的,又或是可能會發生「脾氣暴躁」和「走火入魔」等狀況。該公司表示:「GPT-4仍有許多已知的局限性,我們正在努力解決。」

據稱,GPT-4還能對圖像做出反應。只要提供其一張照片或圖表,該機器人就可以對其提供詳細的、長達數段的文字描述,並回答有關其內容的問題。不過,令人失望的是,目前,OpenAI高層表示,該公司還沒有打算立即發布技術中的圖像描述部分,因為他們不確定它會不會被誤用。

OpenAI表示,他們已經開始與一些公司合作,要將GPT-4整合到他們的產品中,包括Duolingo、Stripe和Khan Academy。新模型將提供給ChatGPT的付費用戶,並也會作為API的一部分,以允許工程師將人工智慧整合到他們的應用程式中。 OpenAI將對約750字的提示收取約3美分,對約750字的回應收取6美分。

在一篇文章中,OpenAI表示,GPT-4與其前身GPT-3.5之間的區別在聊天中是「微小的」。OpenAI首席執行官Sam Altman在推特上說,GPT-4 「仍然有缺陷,仍然有局限性」,但用戶將在第一次使用時對其印象深刻。

參考資料:The New York TimesCNBCThe Verge

瀏覽 1,062 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button