生圖片更神了!ChatGPT Images2.0會思考 支援多圖生成、文字渲染更流暢

記者許若茵/綜合報導

OpenAI正式推出全新圖片生成模型ChatGPT Images2.0,不僅具備更高精準度,也強化多語言能力、視覺理解與細節處理能力,並支援多圖生成,提升AI圖片創作的實用性。

OpenAI正式推出全新圖片生成模型ChatGPT Images2.0,不僅具備更高精準度,也強化多語言能力、視覺理解與細節處理能力,並支援多圖生成。(圖 /OpenAI)
OpenAI正式推出全新圖片生成模型ChatGPT Images2.0,不僅具備更高精準度,也強化多語言能力、視覺理解與細節處理能力,並支援多圖生成。(圖 /OpenAI)

OpenAI表示,一年前發布了ChatGPT Images,顯示人工智慧創建的圖像既美麗又有用,Images2.0是下一階段,這是一個最先進的模型,能處理更複雜的視覺任務,並產出精確、可立即使用的圖片。

OpenAI說明,Images2.0是旗下第一個具有思考能力的影像模型,當在ChatGPT中選擇有思想或專業的模型時,Images2.0可以在網路上搜尋即時訊息,從一個提示建立多個不同的圖像,並仔細檢查輸出,透過思考,模型可以承擔想法和圖像之間的更多繁重工作,讓使用者更容易將腦中的概念完整呈現,知識也延伸更新到了2025年12月。

更多科技工作請上科技專區:https://techplus.1111.com.tw/

OpenAI指出,Images2.0為影像創作帶來了前所未有的特異性和保真度。它不僅可以概念化更複雜的圖像,也能更精準地將需求轉化為實際成果,完整保留使用者要求的細節,並支援最高2K解析度輸出,讓使用者不會得到與指令大致相符的東西,而是會得到一些真正可以使用的東西。

過往ChatGPT Images圖像在生成非英語和拉丁文字時,常出現不夠精確的問題,在Images2.0中,增強了多語言理解能力,並在非拉丁文本渲染方面取得了顯著進步,特別是在日語、韓語、中文、印地語和孟加拉語中,它可以產生具有非英語文字的圖像,這些圖像不僅渲染正確,而且語言流暢。

科技社群討論區:https://pei.com.tw/feed/c/tech-plus

此外,Images2.0也能更忠實反映所需風格的輸出,而不只是風格相似,更支援3:1和1:3的長寬比,可產生適合所需格式的輸出,只要在提示中詢問,或從預設選項中選擇以新尺寸,無論是寬幅橫幅、簡報投影片、海報、手機螢幕或書籤等不同需求,都能快速生成合適格式的圖片。

ChatGPT Images2.0從今天開始向所有ChatGPT和Codex用戶開放。有進階思考功能的部分,則僅提供給ChatGPT Plus、Pro 和Business使用者。

資料來源:OpenAI

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button