最好的開放式模型之一 Meta 強勢發布 Llama 3

2024-04-19

編譯／黃竣凱

人工智慧（AI）巨頭Meta近日推出了Llama系列最新力作Llama 3，為該公司在開放式生成AI模型領域又立下一里程碑，雖然Llama 3全系列尚未完整問世，但Meta也已率先發布兩款新模型，性能相較前代有顯著進步。

最強生成式AI 模型

Meta表示，新發布的Llama 3 8B（80億參數）和Llama 3 70B（700億參數）模型，在各項基準測試上呈現「重大飛躍」，從對應參數規模而言，都已名列當今最頂尖的生成AI模型之列。這款模型是在兩個在定制的 24,000 個 GPU 集群上進行了訓練，是當今表現最佳的生成式AI 模型。

更多新聞：不讓Google和英特爾專美於前 Meta推新款AI晶片

基準測試

為證實這說詞，Meta也引用了Llama 3系列在眾多知名AI基準測試項目上的優異表現，包括測量知識等級的MMLU、測試技能獲取的ARC，及檢測推理能力的DROP。雖然這些基準測試的實用性和有效性仍待商榷，但仍是Meta等AI公司評估模型實力的標準作法。

超越Google、OpenAI、Claude

Meta稱，80億參數的Llama 3 8B在至少9項測試中，都超越了其他開放模型如Mistral 7B和Google的Gemma 7B，而更大型的700億參數Llama 3 70B，不僅在多項測試上力壓Google最新Gemini 1.5 Pro模型，有些成績甚至優於Anthropic公司的第二強模型Claude 3 Sonnet。在自家測試集評比中，Llama 3 70B也勝過Mistral Medium、OpenAI GPT-3.5和Claude Sonnet等對手。

Llama 3其他優勢

除基準分數優勢，Llama 3系列還展現出更強的「控制力」、較低拒答機率，及在一般常識、歷史、科學工程等題材回答的正確性。此外，Llama 3也有高達15萬億字元（約75億字）的龐大訓練數據集，比前代Llama 2多7倍之多，並包含更多程式碼和非英語數據，賦予新模型更多跨語言、跨領域適用力。

Meta訓練400億參數模型

展望未來，Meta也正在訓練超過400億參數的Llama 3超大型模型，並將引入多語種、多模態功能，讓對話、理解影像等能力與生成文字實力同等超凡，向頂級生成AI模型發起更猛烈的挑戰。

更多新聞：Reuters、Tech Crunch

標籤

2024-04-19

最好的開放式模型之一 Meta 強勢發布 Llama 3

最強生成式AI 模型

基準測試

超越Google、OpenAI、Claude

Llama 3其他優勢

Meta訓練400億參數模型

推薦工作

發佈留言取消回覆

AI求職供需落差怎解？產業人才認定指引搭起企業與人才橋樑

美國再砸8.74億美元扶植半導體研發聚焦AI晶片、先進封裝與光學互連

AWS營收創逾四年最快成長亞馬遜再加碼AI投資至2200億美元

歐洲熱浪頻襲代價高野火與高溫衝擊整體經濟

Claude模型測試意外越界 Anthropic發現3起未授權存取

最新科技新聞快訊不錯過!!

最強生成式AI 模型

基準測試

超越Google、OpenAI、Claude

Llama 3其他優勢

Meta訓練400億參數模型

推薦工作

延伸閱讀

AI求職供需落差怎解？產業人才認定指引搭起企業與人才橋樑

美國再砸8.74億美元扶植半導體研發 聚焦AI晶片、先進封裝與光學互連

AWS營收創逾四年最快成長 亞馬遜再加碼AI投資至2200億美元

歐洲熱浪頻襲代價高 野火與高溫衝擊整體經濟

Claude模型測試意外越界 Anthropic發現3起未授權存取

Sea攜手OpenAI在台舉辦AI黑客松 培育AI人才接軌全球技術生態

發佈留言 取消回覆

美國再砸8.74億美元扶植半導體研發聚焦AI晶片、先進封裝與光學互連

AWS營收創逾四年最快成長亞馬遜再加碼AI投資至2200億美元

歐洲熱浪頻襲代價高野火與高溫衝擊整體經濟

Sea攜手OpenAI在台舉辦AI黑客松培育AI人才接軌全球技術生態

發佈留言取消回覆