Google宣布Gemini迎來「超瘋狂」級更新 對決OpenAI、Anthropic
記者鄧天心/綜合報導
Google近日宣布,旗下多模態平台Gemini的AI影像模型全面升級,內部甚至形容這是一個「bananas(超級瘋狂)」級別的突破,Google在影像真實度、安全策略與合規性上都有提升,希望在這場AI競賽中重奪優勢。
新版Gemini的核心亮點在於影像生成有優化,與過往相比,它能更細緻地還原光影變化、材質質感以及場景細節,生成效果幾可亂真,用戶僅需輸入自然語言的描述,就能得到符合要求的圖像,無論是複雜場景的構圖,還是人物與動作的指定,都比上一代模型更加準確。

延伸閱讀:
除了技術突破之外,Google此次特別強調「安全性」與「合規性」,在生成式AI市場逐漸擴大的過程中,誤用常常成為爭議焦點,Gemini的新系統設計加入了更嚴謹的防護措施,避免使用者透過提示詞產出敏感或扭曲的影像內容。
對品牌端與教育、媒體等需要更高合規標準的產業來說,這項改進代表著平台使用風險的大幅降低,也讓Gemini在商業市場上的採用率更有優勢。
近年來,OpenAI、Anthropic以及Stability AI等公司在影像與多模態生成的領域上快速推進,頻頻推出引發討論的新工具,Google的Gemini進化到「bananas級」,意圖在全球AI競賽中鞏固自身多模態整合的領先地位,而隨著AI生成影像走向廣告設計、娛樂製作、媒體內容甚至企業訓練等應用場景,能同時兼顧創意發揮與安全規範的模型,將成為企業導入決策的核心指標。
對台灣市場而言,Gemini的升級所帶來的影響已不僅止於技術層面,而是逐漸滲入產業流程。廣告與行銷業者可利用影像生成縮短製作週期,快速完成Campaign提案;內容工作者與媒體則能以AI生成影像作為新聞插圖或影音素材,進一步增加產出效率;甚至在新創領域,也可能透過在地語言與文化的結合,創造符合本土市場需求的差異化應用。
資料來源:TechCrunch 、Business Insider