Google提前釋出Gemini 2.5 Pro I/O 一鍵即可生成網頁應用

記者孫敬/台北報導

在開發者社群高度期待下,Google於6日搶先釋出大型語言模型Gemini 2.5 Pro Preview(I/O 版),其最大特色在於「單一指令生成互動式應用」能力,只需輸入一段提示詞,便能快速生成完整網頁應用。

目前Gemini 2.5 Pro I/O,已透過Gemini API於Google AI Studio釋出,企業用戶可藉Vertex AI來使用,價格方面,若是使用03-25版,無需額外升級即可自動使用新版本,價格則維持不變。

延伸閱讀:Google Gemini藉自主決策成為寶可夢大師 再創AI推理新境界

Gemini 2.5 Pro全新I/O版上線。(圖/Google)

模型升級亮點:多模態處理與前端能力大幅躍進

Gemini 2.5 Pro I/O在程式處理能力擁有出色的表現,不僅強化程式轉換、程式碼編輯到複雜的代理工作流程,還可支援響應式設計與CSS,並根據現有視設計風格給予一致性內容,也能藉由在IDE中使用Gemini 2.5 Pro,進一步生成如影音播放器功能。

根據大型語言模型測試組織LMSYS旗下WebDev Arena評測結果,Gemini 2.5 Pro I/O獲得高達1419.95分,領先GPT-4.1的1261.35分,以及Claude 3.7的1357.10。此次更新不僅強化了語言模型在UI建構、程式碼轉換與邏輯流程規劃等任務的靈活性,更針對CSS樣式調整與視覺一致性給予更細緻的處理,協助開發者建構高水準、響應式網頁應用。

影片理解方面,Gemini 2.5 Pro於VideoMME評測中獲得 84.8% 高分,證實其視覺與語言整合能力領先業界。透過Video to Learning App流程,Google示範了如何將YouTube影片轉化為互動式學習應用,具體呈現其視覺理解和前端邏輯建構能力。此外,Gemini 2.5 Pro I/O在函式呼叫準確度、成功率進行最佳話,使模型在在多步驟執行任務時穩定性更佳,適用於複雜的程式建構與應用場景。

同時,Google在iOS版Google推出「簡化」功能(Simplify),利用AI將網頁中的複雜技術文本轉為易懂內容,只要選取文筆並點擊「簡化」即可獲得內容說明。

隨著這次預覽版的提前釋出,Google不僅展現了其在多模態AI領域的技術進展,也透露了將生成式AI技術更廣泛嵌入產品流程的長遠企圖。

瀏覽 199 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button