Claude 3是什麼？深入解析Anthropic 的新AI模型

2024-03-06

編譯／莊閔棻

隨著人工智慧（AI）不斷發展，日前由 OpenAI 幾位前員工創立的人工智慧（AI）公司Anthropic，宣布推出至今為止最快、最強大的AI模型 Claude 3。據Anthropic稱，該模型效能能媲美Google 和 OpenAI 的模型，甚至更好，且其還「在廣泛的認知任務中樹立了新的行業基準」。

Claude 3

Claude 是 Anthropic 開發的一組大型語言模型（LLM），該聊天機器人能夠處理文字、語音訊息和文件。據稱，與同類聊天機器人相比，該聊天機器人能夠產生更快的上下文回應。Claude 3 包含三個版本，其中Claude 3 Opus 為最強大的模型、Claude 3 Sonnet 是功能強大且價格具有競爭力的中間模型，而Claude 3 Haiku 則專為企業設計，適合任何需要即時回應的用例。

對於不想額外付費的用戶，Claude Sonnet 目前免費在 Claude.ai 聊天機器人中提供，用戶只需進入Anthropic官網，點擊「和Claude對話」（Talk to Claude），並透過電子郵件登入即可使用；然而，目前高級版本Opus 則只透過，每月收費 20 美元的 Claude Pro 服務提供；而Claude 3最小的版本Haiku仍尚未發布。

Claude 3的表現

根據與同行的比較，Claude 3似乎已經趕上了 OpenAI。據悉，Claude 3 在推理、專業知識、數學和語言流利性等認知任務上都有先進的表現，與現有型號相比，在基準測試中，Opus 展示卓越的性能，表現出比 OpenAI 的 GPT-4 更好的推理能力，在研究生程度的推理測驗中，Opus更是取得 50.4分的成績，顯著超過GPT-4 的 35.7分，而Sonnet也以40.4分的分數打敗GPT-4。該公司表示，Opus 模型表現出「接近人類層面的理解力和對複雜任務的流暢性」。

此外，Claude 3 比前身 Claude 2.1 也有顯著改進，具良好的數學、程式設計和理解推理的能力，其中間模型 Sonnet的速度比 Claude 2 和 Claude 2.1 快兩倍，特別適合需要快速回應的任務，而雖然Haiku 是 Claude 3最小的版本，但也是目前市場上最快的，最具成本效益的模型，能在不到三秒的時間內，分析複雜的文件。

Claude 3 vs GPT-4

Claude 3 Opus 在多達 10 個AI基準測試上超越了 GPT-4，包括結合數學、物理、醫學、歷史、法律、倫理等57 個領域測試的MMLU資料集、評估程式設計能力的HumanEval、常識測試HellaSwag，和小學數學測試 GSM8K。在基準分數上，Claude 3 以些微優勢擊敗了同行。如，在五次 MMLU 試驗中，Claude 3 就獲得 86.8分的成績，而 GPT-4 則是 86.4分。另一方面，在MGSM測試上兩者則有顯著差距，Claude 3 得分為 90.7分，而 GPT-4 則只有74.5分。

Claude 3 的限制

根據那些早期接觸過該模型的人，Claude 3 在回答事實問題，和從圖像中提取文字的光學字元辨識（OCR）等任務中表現良好，並擅長遵循指示，完成包括寫莎士比亞十四行詩等任務。然而，它有時也會無法複雜的推理和數學問題，並表現出偏見傾向，如偏好某個種族群體。

參考資料：Indian Express、tech.co

標籤

2024-03-06

Claude 3是什麼？深入解析Anthropic 的新AI模型

Claude 3

Claude 3的表現

Claude 3 vs GPT-4

Claude 3 的限制

推薦工作

發佈留言取消回覆

體驗刺激黑市交易！《監獄商店模擬器》究竟該討好囚犯還是巴結獄警

哥布林女僕來了！合作清潔遊戲《Goblin Cleanup》2027 年登陸家機及 Switch 2

「新應材」再度投資臺灣！砸45億元擴大產能3類人才就業機會增

中興大學14組生技團隊進軍亞洲生技大展 AI醫療、抗癌新藥成亮點

AI科技結合鏡片升級！依視路發表2026系列新品打造全新視覺體驗

最新科技新聞快訊不錯過!!

Claude 3

Claude 3的表現

Claude 3 vs GPT-4

Claude 3 的限制

推薦工作

延伸閱讀

「新應材」再度投資臺灣！砸45億元擴大產能3類人才就業機會增

AI科技結合鏡片升級！依視路發表2026系列新品 打造全新視覺體驗

2028年全球半導體設備銷售額預估達2295億美元新高 設備市場可望連續5年成長

聊天機器人成治療新助手！AI打造全天候心理支持 仍難取代真人

增肌不必狂吃！間歇性斷食「同樣長肌肉」還減少脂肪增加

輝達聯手日政府與 Noetra 打造首座「物理 AI」國家級工廠 再造產業革命

發佈留言 取消回覆

AI科技結合鏡片升級！依視路發表2026系列新品打造全新視覺體驗

2028年全球半導體設備銷售額預估達2295億美元新高設備市場可望連續5年成長

聊天機器人成治療新助手！AI打造全天候心理支持仍難取代真人

輝達聯手日政府與 Noetra 打造首座「物理 AI」國家級工廠再造產業革命

發佈留言取消回覆