Google升級AI生成圖像 支援橫幅繪圖、角色一致性

記者鄧天心/綜合報導

Google宣布旗下最先進的影像生成與編輯模型「Gemini 2.5 Flash Image」正式進入生產(production)環境,並支援高達10種全新影像長寬比,將AI內容創作推向全新高度。

此次更新最大亮點,就是開放10種影像長寬比選項,讓生成影像從電影級寬螢幕到直式社群格式一應俱全,極大擴充內容製作彈性,無論是橫幅廣告、IG限動還是教材圖卡,都能一鍵完成最佳尺寸適配。

1759457192327
Google宣布旗下最先進的影像生成與編輯模型「Gemini 2.5 Flash Image」正式進入生產(production)環境,並支援高達10種全新影像長寬比,將AI內容創作推向全新高度。(圖/Google for Developers

延伸閱讀:

OpenAI Sora 2自由生成皮卡丘、海綿寶寶 遭批根本「AI侵權大軍」

Gemini 2.5 Flash Image以強大的多圖融合、多角色一致性維持及目標式自然語言編輯聞名,例如遊戲開發商Volley已用於即時生成角色頭像、動態場景甚至多角色合成,讓玩家直接以語音或聊天快速修改美術內容,實現遊戲即時內容生成新體驗。

Gemini 2.5 Flash Image現已同步上線於Google AI Studio和Vertex AI,可直接透過Gemini API體驗、部署,並針對開發者提供完整文件與範例Cookbook,建立AI應用只需簡單幾行程式,支援即時測試、自由調整輸出長寬比例,同步迎合企業後台實戰應用。

Google Gemini 2.5 Flash Image每張影像僅收0.039美元,100萬output tokens僅30美元,定價沿用Gemini 2.5 Flash標準方案,讓創意、科技與商業無縫鏈接。官方也強調歡迎開發者透過Kaggle、Cerebral Valley等黑客松持續創作,投入教育、AR、行銷等跨界應用。

這次Gemini 2.5 Flash Image商用化,不僅讓AI影像生成更貼合真實工作流需求,更徹底打開內容產業的自動化、客製化與創新大門。開放API、自由指定長寬比、角色維持一致等突破性功能,預示AI影像走向產業實戰、專業級應用正加速發酵,值得各界持續關注。

資料來源:Gemini 2.5 

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button