剛體驗Google Gemini企業版 唯一心得:希望公司快點導入

記者鄧天心/台北報導

走進Google Cloud展示會前,我原本預期大概又是一場看起來很炫的AI展覽,結果這次體驗讓我覺得更認識Gemini實際應用,這回主角Gemini 2.5 Pro表現幾乎無可挑剔,體驗不僅多元,產出的靜態圖像、動態影像沒有卡頓,逛了4-5個攤位都沒遇到尷尬的bug問題。

S 86237241 0
(圖/科技島拍攝)

近年不少人在討論企業實際應用AI的普及率不如預期高,但Google的Gemini在辦公、企業方面的應用也許真的可以期待。

延伸閱讀:

餐飲AI元年!iCHEF推5大AI功能與資料管理中台「春嬌」助攻餐飲業

我的體驗從一個有趣的小測試開始,先在體驗區用手機拍了一張草莓果醬與棉花糖的照片,幾秒鐘內,Gemini就分析出食材內容,並生成幾份完整的草莓三明治食譜。

S 86237244
(圖/科技島拍攝)

一般AI大多只能理解文字,但Gemini能同時看懂圖片、聽音訊、分析影片,甚至解讀程式碼,Google官方資料指出,Gemini 2.5 Pro一次能處理高達100萬個tokens的資訊(未來將可擴至200萬),等於一次吸收整本書的內容。

不同於多數AI單次生成的邏輯,Gemini在回答前會先「思考」,Google官方資料提到這是「鏈式思維(Chain-of-Thought)」機制,它會先提出多種可能,再自己檢查邏輯、修正結果後才輸出。

加上新的「Deep Think Mode」功能,Gemini甚至能進行更深層的程式除錯、邏輯推理與數學分析,這一切都運作在Google的TPU晶片與雲端基礎架構上,使生成過程又快又精確,幾乎無延遲。此刻的它,的確更像「會思考的AI」,而不僅是「會說話的AI」。

接著我體驗了Gemini搭配Veo 3的功能,先是拍下一張自己的照片,Gemini不到5分鐘生成了一張AI版肖像圖,看起來像是以動畫版本的我,然後,Veo 3再接力生成一段短影片,畫面中那個AI版的我正在打籃球投籃,從靜態影像到動態影片,大概不到10分鐘,卻是很流暢的成品。

S 86237242 0
(圖/科技島拍攝)

透過Gemini for Workspace,AI能自動從郵件裡找出會議時間,幫你擬邀請信,甚至直接寄出,更令人驚艷的是企業版的Gemini Enterprise,它讓公司能打造自己的AI「員工」,不需要寫程式。

Google今年推行的「多代理生態(Multi-Agent Ecosystem)」也相當關鍵,讓不同功能的AI能彼此協作,會議助手、設計工具、專案管理AI都能共享資訊、一起完成任務。開發者能透過Vertex AI與ADK(Agent Development Kit)快速部署這些代理。

甚至,他們還設計了「Agent2Agent(A2A)」與「Agent Payments Protocol(AP2)」,讓AI之間也能在雲端安全交易任務、交換資訊。

老實說,第一次看到Gemini企業版,我很想了解他們跟ChatGPT最大的差異在哪裡,看過現場人員操作展示後,我覺得ChatGPT像會講故事的行銷,擅長創意表達,而這次體驗完Gemini後我自己認為他很像善於分析的顧問,後者則能整合不同型態的資料,文字、圖片、甚至能協助決策。

另外日前有新聞爆出駭客透過Gemini漏洞發現,也是大家最關心的資安問題,不過根據官方資料可以看到,Gemini內建防止提示攻擊(Prompt Injection)的安全機制,並具備「Reasoning Budget」系統,會根據問題複雜程度自動分配運算資源,在處理長篇資料時表現也比一般的AI更穩定、更專業。

Gemini的穩定不是巧合,而是Google的雲端底層早已為它鋪好路,從專屬TPU晶片、Vertex AI平台到全球性資料安全防護,Google打造了一座能讓AI運算、開發、安全共構的系統,我想這也是為何全球已有超過200個國家與地區的企業採用Google Cloud,從銀行、媒體到電商,都能放心讓AI幫忙處理日常工作與資料分析。

AI的競爭已經不再是「誰功能多」,而是「誰更可靠」,當AI不再出錯、不用重跑、不再讓人等上幾十秒,它就不再是天馬行空的想像,而是真正走進每一個人的生活和工作。

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button