Claude 3 VS. ChatGPT VS. Gemini 誰更勝一籌？

2024-03-06

編譯／黃竣凱

一直以來，ChatGPT 和 Gemini都是人工智慧（AI）領域的領先者，然而隨著由 OpenAI前員工創立的AI公司Anthropic，推出至今為止最快、最強大的AI模型 Claude 3，這種局勢似乎正在被打破。Claude 3 在AI各個領域展示了卓越的優勢，引起了專家和愛好者的極大興趣和爭論。

15 3 — 聊天機器人大比拚，Claude 3 VS. ChatGPT VS. Gemini 誰才是最強AI模型。科技島合成圖

Claude 3 VS. ChatGPT VS. Gemini

Claude 3相對於其競爭對手有重大進步，並在光學字元辨識（OCR）、對複雜查詢的細緻理解，及基準測試性能上都打敗ChatGPT 和 Gemini。Claude 3具有卓越的視覺能力和上下文理解能力，包括可以準確地識別圖像中的車牌號碼和理髮店。

相較之下，雖然ChatGPT（GPT-4）也提供強大的對話功能和廣泛的知識庫，但它在 OCR 任務上，可能不如 Claude 3 ，並特定技術基準上落後。而雖然Gemini 1.0 Ultra和尚未發布的Gemini 1.5，在視覺任務和通用AI能力方面表現強勁，但在與 Claude 3 的高級推理和 OCR 功能競爭時，仍面臨挑戰。

基準測試

雖然在一些比較中，Claude 3 只以微弱優勢獲勝，但總體來說，在所有指標上，Claude 3 的旗艦模型 Opus，都優於 ChatGPT 和 Gemini。此外，即使是較低階的Claude 3 Sonnet 和 Haiku 模型，也都比 GPT-3.5 和 Gemini 1.0 Pro 表現出更優越的性能。

根據 Anthropic 提供的基準測試統計數據，與 Gemini 和 ChatGPT相比，Claude 3在各項標準上都領先。在小學數學中，Claude 3 的 Opus 模型達到 95分的驚人準確率，超過了 OpenAI 的 GPT-4 的92分和 Gemini 1.0 Pro的94.4分；在文本推理方面，Claude 3 則以 83.1分的成績，打敗GPT-4 和Gemini 1.0 Pro的 80.9分及 82.4分；而在常識推理上，Claude 3也取得95.4的高分，勝過GPT-4的95.3分和Gemini 1.0 Pro的87.8分。

處理大量文字

值得注意的是，Claude 3 能夠總結多達 150,000 個單詞，與 ChatGPT 的 3,000 個單詞的限制相比，有顯著飛躍，進而證明 Claude 3 在處理大量文字資料上的熟練程度，使其在同類產品中脫穎而出。

參考資料：geeky-gadgets、The National News

標籤

2024-03-06

Claude 3 VS. ChatGPT VS. Gemini 誰更勝一籌？

Claude 3 VS. ChatGPT VS. Gemini

基準測試

處理大量文字

推薦工作

發佈留言取消回覆

AI晶片熱！矽品精密火力全開徵才3,500人南科、二林廠急尋新血

臺師大攜手南洋理工大學辦AIoT國際工作坊深化AI人才培育合作

AI時代的產能外溢與台積電的造王者防禦戰｜專家論點【劉佩真】

《KPop獵魔女團》聯名樂高細節誠意滿滿 8月全球開賣

比亞迪董座王傳福喊話5年內登全球車王挑戰豐田11.3萬輛銷量霸主地位

最新科技新聞快訊不錯過!!

Claude 3 VS. ChatGPT VS. Gemini

基準測試

處理大量文字

推薦工作

延伸閱讀

數發部免費AI算力服務開放申請 新增Gemma 4等多種最新模型

地表最強內顯要來了？！英特爾聯手輝達打造最強晶片傳2028強勢登場

不想天天吃雞蛋！七種高蛋白早餐「營養又有飽足感」

Siri AI升級恐加劇記憶體吃緊 三星、SK海力士可望成最大受惠者

氣候危機衝擊！18億兒童遭受乾旱威脅 2.42億學童因天災中斷教育

傳華為Mate 90將搭載新一代麒麟晶片 晶體密度有望接近台積電3奈米

發佈留言 取消回覆

數發部免費AI算力服務開放申請新增Gemma 4等多種最新模型

Siri AI升級恐加劇記憶體吃緊三星、SK海力士可望成最大受惠者

傳華為Mate 90將搭載新一代麒麟晶片晶體密度有望接近台積電3奈米

發佈留言取消回覆