馬斯克發表Grok-1.5 Vision 表現優於GPT-4及Gemini

2024-04-18

記者／竹二

由馬斯克(Elon Musk)成立的xAI公司近日發表了多模語言模型Grok-1.5 Vision，能夠理解文件、圖表、示意圖、螢幕擷圖、相片等視覺資訊，預告很快將提供預覽版供研究及開發人員測試。

xAI發表Grok-1.5 Vison多模語言模型

xAI公司是馬斯克在2023年7月12日所創辦的人工智慧初創企業，由OpenAI、Google DeepMind、Google研究院、微軟研究院、特斯拉、X（前Twitter）以及多倫多大學前雇員所組成，將會與X和特斯拉緊密合作，其中一個目標是打造能進行高階邏輯推理的人工智慧模型。

更多新聞：聯發科再推BreeXe大型語言模型　搭配「達哥」AI平台

Grok-1.5 Vision是xAI公司繼3月間開源Grok的基礎LLM Grok-1、4月初的Grok-1.5後最新AI研發成果發表。據了解，Grok-1.5 Vison是xAI第一代多模語言模型，除了具有文字理解能力之外，Grok聊天機器人現在還能處理多種視覺資訊，像是文件、圖表、示意圖、螢幕截圖、相片等。

Grok-1.5 Vison表現優於GPT-4

若是按照之前的常態規律，Grok-1.5 Vison很可能在幾周之內就會開放早期測試人員，或是現有Grok用戶所使用。根據xAI公司的說法，Grok-1.5 Vison從跨學科推論到理解文件、科學示意圖、圖表、截圖和相片等多方面都不輸現有多模語言模型。

xAI所列出標竿測試數據顯示，在數學、文字理解、真實世界圖片理解能力上，Grok-1.5 Vison確實超越OpenAI GPT-4、Google Gemini Pro 1.5，以及Anthropic的Claude 3系列，而示意圖理解能力只落後Claude 3 Sonnet模型。

xAI表示，他們正持續提升Grok-1.5 Vison的多模理解及生成能力，預計未來幾個月內圖片、影片和聲音等模態資訊的理解與生成能力都會再進一步精進。

瀏覽 830 次

標籤

2024-04-18

馬斯克發表Grok-1.5 Vision 表現優於GPT-4及Gemini

xAI發表Grok-1.5 Vison多模語言模型

Grok-1.5 Vison表現優於GPT-4

推薦工作

發佈留言取消回覆

PAPAYA 電腦教室 |只有老人才用 PPT 做簡報？新世代 AI 簡報神器 Gamma 讓你告別石器時代邁向新世紀！

【懶人包】盤點5大數位心靈伴侶從低成本沙盤演練到無負擔戀愛體驗

比特幣破歷史新高彭云嫻揭三大動能：聯準會、鏈上結構、台幣匯率成關鍵

前進《Hello Kitty Island Adventure》！快上Steam和三麗鷗小夥伴們體驗陽光慶典

《蛋仔派對》×《海綿寶寶》重現美味蟹堡！再拿免費蟹老闆套裝

最新科技新聞快訊不錯過!!

最新科技新聞快訊不錯過!!

xAI發表Grok-1.5 Vison多模語言模型

Grok-1.5 Vison表現優於GPT-4

推薦工作

延伸閱讀

【懶人包】盤點5大數位心靈伴侶 從低成本沙盤演練到無負擔戀愛體驗

比特幣破歷史新高 彭云嫻揭三大動能：聯準會、鏈上結構、台幣匯率成關鍵

AI WAVE SHOW月底登場！3天看懂300項AI產品如何改變生活

高齡科技產業拚今年產值3000億 吳誠文：組臺灣隊、AI應用落地

馬斯克親自宣布：特斯拉AI助理Grok下週上線

杜拜推AI主廚 從菜單設計、用餐環境都出自他的想法

發佈留言 取消回覆

【懶人包】盤點5大數位心靈伴侶從低成本沙盤演練到無負擔戀愛體驗

比特幣破歷史新高彭云嫻揭三大動能：聯準會、鏈上結構、台幣匯率成關鍵

高齡科技產業拚今年產值3000億吳誠文：組臺灣隊、AI應用落地

杜拜推AI主廚從菜單設計、用餐環境都出自他的想法

發佈留言取消回覆