Llama 3後勢看好和GPT-4 比較結果令人驚喜

2024-04-29

編譯／黃竣凱

Meta 的新大型語言模型 Llama 3 有8B（80億參數）和70B（700億參數）可供選擇，並已作為開源提供給 AI 社群。儘管與 GPT-4 相比，Llama 3 較小、只有700 億參數，但它也已被證明是一個引人注目的模型。

Meta 的新大型語言模型Llama 3後勢看好和GPT-4 比較結果令人驚喜。圖取自Meta

贏過GPT-4

在進行邏輯推理能力測試的magic lift測試中，Llama 3就給出了正確答案，而GPT-4模型則未能提供正確答案。考慮到兩個模型之間訓練參數數量的顯著差異，這一結果尤其令人驚訝，Llama 3 只接受了 7萬個參數的訓練，而 GPT-4則接受了 170萬個參數的訓練。

更多新聞：最好的開放式模型之一 Meta 強勢發布 Llama 3

Llama 3 回答完美

在另一個針對簡單邏輯問題的測試中，Llama 3 和 GPT-4 則都表現出了準確性。然而，最突出的是 Llama 3 能夠嚴格遵循使用者指南生成句子，如當要求系統提示產生 10 個以「mango」結尾的句子時，Llama 3 成功產生了全部 10 個句子，超過了 GPT-4 的表現，後者則少生成了兩個句子。

不輸GPT-4

雖然Llama 3 目前不支援長上下文視窗，只支援8,000 單詞的上下文長度，但它在檢索能力 NIAH 測試中表現良好。例如當要求將一個隨機語句插入8,000 單詞長的內文中，並要求模型定位資訊時，Llama 3就在短時間內找到了文字，但GPT-4也以同樣的方式找到了。

Llama 3的挑戰

雖然 Llama 3 已經在大量測試中證明了自己的能力，但與 GPT-4 相比，它在解決數學問題任務上面臨挑戰。然而Meta 強調，Llama 3 經過大量程式碼示例的訓練，因此它在程式設計方面也應該表現良好，因此可能還需要更進一步的測試。

參考資料：Analytics Insight

瀏覽 2,168 次

標籤

2024-04-29

Llama 3後勢看好和GPT-4 比較結果令人驚喜

贏過GPT-4

Llama 3 回答完美

不輸GPT-4

Llama 3的挑戰

推薦工作

發佈留言取消回覆

廣達林百里次子林宇輝打造MESH聚達投創 10周年成就4贏局面

Facebook廣告服務系統性缺失數發部再度依法重罰1500萬元

癱瘓老鼠重新行走！超薄植入物刺激脊髓神經修復為患者帶來希望

《Minecraft》玩家太神啦！200小時還原霍格華茲城堡與魁地奇場景

《魔物獵人：荒野》重大更新6/30上線終局內容深度不足引爭議

最新科技新聞快訊不錯過!!

最新科技新聞快訊不錯過!!

贏過GPT-4

Llama 3 回答完美

不輸GPT-4

Llama 3的挑戰

推薦工作

延伸閱讀

廣達林百里次子林宇輝打造MESH聚達投創 10周年成就4贏局面

Facebook廣告服務系統性缺失 數發部再度依法重罰1500萬元

癱瘓老鼠重新行走！超薄植入物刺激脊髓神經修復 為患者帶來希望

鼻子藏有「飢餓開關」！嗅覺可命令大腦停止進食 成肥胖治療新曙光

Apple Watch銷售慘遇瓶頸 外媒籲：蘋果該推出「這款」新品了

三星2奈米GAA製程再進化 SF2P力拼明年量產重振代工競爭力

發佈留言 取消回覆

Facebook廣告服務系統性缺失數發部再度依法重罰1500萬元

癱瘓老鼠重新行走！超薄植入物刺激脊髓神經修復為患者帶來希望

鼻子藏有「飢餓開關」！嗅覺可命令大腦停止進食成肥胖治療新曙光

Apple Watch銷售慘遇瓶頸外媒籲：蘋果該推出「這款」新品了

發佈留言取消回覆