OpenAI 推出 GPT-4　考試所向無敵　脾氣仍很暴躁

2023-03-15

編譯／莊閔棻

OpenAI宣布了其主要大型語言模型GPT-4的最新版本，並表示，其在許多專業測試中表現出「人類水準的性能」。

196787250 fb link — OpenAI 推出 GPT-4　考試所向無敵　脾氣仍很暴躁。示意圖／123RF

根據外電綜合報導， ChatGPT-4比以前的版本「更大」，這代表了，其在更多的數據上進行了訓練，並模型文件中有更多的權重（Weight）。OpenAI聲稱該模型「比以前更有創造性和協作性」，並「可以更準確的解決困難的問題」。

OpenAI表示，新模型將產生更少事實錯誤答案，更少陷入走火入魔的狀況和談論禁忌話題，甚至在許多標準化測試中表現得比人類更好。OpenAI強調，該系統已經經過了6個月的安全培訓，且在內部測試中，它「與GPT-3.5相比，對不允許的內容請求的回應減少了82%，產生事實性回應的可能性增加了40%。」該公司還聲稱，GPT-4在模擬的律師考試中贏過了90%的人類，在SAT閱讀考試中則是贏過93%的人，而在SAT數學考試中也贏過了89%。

不過，OpenAI警告也說，此新系統仍然有和許多早期語言模型相同的問題，包括編造資訊或有「幻覺」傾向，並仍然容易在錯誤的時候堅持認為自己是正確的，又或是可能會發生「脾氣暴躁」和「走火入魔」等狀況。該公司表示：「GPT-4仍有許多已知的局限性，我們正在努力解決。」

據稱，GPT-4還能對圖像做出反應。只要提供其一張照片或圖表，該機器人就可以對其提供詳細的、長達數段的文字描述，並回答有關其內容的問題。不過，令人失望的是，目前，OpenAI高層表示，該公司還沒有打算立即發布技術中的圖像描述部分，因為他們不確定它會不會被誤用。

OpenAI表示，他們已經開始與一些公司合作，要將GPT-4整合到他們的產品中，包括Duolingo、Stripe和Khan Academy。新模型將提供給ChatGPT的付費用戶，並也會作為API的一部分，以允許工程師將人工智慧整合到他們的應用程式中。 OpenAI將對約750字的提示收取約3美分，對約750字的回應收取6美分。

在一篇文章中，OpenAI表示，GPT-4與其前身GPT-3.5之間的區別在聊天中是「微小的」。OpenAI首席執行官Sam Altman在推特上說，GPT-4 「仍然有缺陷，仍然有局限性」，但用戶將在第一次使用時對其印象深刻。

參考資料：The New York Times、CNBC、The Verge

標籤

2023-03-15

OpenAI 推出 GPT-4　考試所向無敵　脾氣仍很暴躁

推薦工作

發佈留言取消回覆

日本熊本現規模7.1強震台積電：以人員安全優先

收納解謎遊戲《貓咪又把藥水打翻了！》逾兩千瓶魔藥等你收拾善後

千萬下載神作擴大版圖！西瓜遊戲登陸PC及PS5跨平台發售

別急著找新功能！兩招手動強制升級次世代系統、更新watchOS 26.6

茶、莓果、橄欖油都上榜！研究揭多酚助腦部「健康老化」

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

香蕉、酪梨、奇異果都上榜！4大水果「好吃還助控血壓」

中原大學張慶瑞講座教授榮獲2026「AUMS Award」 量子與磁學研究成就獲國際肯定

奧特曼法庭大爆料 馬斯克曾想把OpenAI「傳位子女」

【AI工具】Google I/O前夕大動作！最強影片AI「Gemini Omni」將問世？

台達電營收受惠AI資料中心熱潮 觀音新廠要攻燃料電池

輝達DLSS 5過度美化遊戲畫面 為什麼被批評「走火入魔」？

發佈留言 取消回覆

中原大學張慶瑞講座教授榮獲2026「AUMS Award」量子與磁學研究成就獲國際肯定

奧特曼法庭大爆料馬斯克曾想把OpenAI「傳位子女」

台達電營收受惠AI資料中心熱潮觀音新廠要攻燃料電池

輝達DLSS 5過度美化遊戲畫面為什麼被批評「走火入魔」？

發佈留言取消回覆