YouTube Shorts推出超好用AI功能!只有字幕、圖片都可自動變影片
記者鄧天心/綜合報導
全球短影音競爭持續升溫,YouTube週二在「Made on YouTube」年度發表會上宣布,將推出一系列全新生成式AI工具,協助Shorts創作者加速內容製作,此次亮相的工具包括專屬版本的文字轉影片生成模型Veo 3 Fast、全新Speech to Song混音功能,以及可自動生成影片初稿的Edit with AI。
YouTube表示,已將Google最新的文字轉影片模型Veo 3導入Shorts,並特別為短影音體驗推出「Veo 3 Fast」,該版本主打低延遲輸出,能生成480p畫質影片,且首次支援聲音,讓創作者更快速生成帶音效的短片,此功能已率先在美國、英國、加拿大、澳洲與紐西蘭上線,後續將擴展至更多市場。
除了影片生成,Veo技術還解鎖更多玩法,例如,將影片中的動作「移植」到靜態圖片上,讓照片中的人物能跟著跳舞;或是替短片套入不同藝術風格(如波普藝術、摺紙風),甚至可透過文字描述增加角色或道具。

延伸閱讀:
TikTok美國業務暫逃封殺!能否續命就看川普、習近平週五怎麼說
另一亮點是新推出的Speech to Song混音工具,讓創作者能將影片中的對話轉換成音樂音軌,用於其他Shorts。YouTube產品總監Dina Berrada形容,這能把一句有趣對白或難忘台詞,快速轉換成短影音的全新創意元素。
背後的技術來自Google的AI音樂生成模型Lyria 2。創作者可以依需求讓音樂帶有不同氛圍,像「chill」、「danceable」、「fun」等。此功能將先於美國展開測試,並逐步推廣至更多創作者。
針對頻繁拍攝但缺乏剪輯時間的創作者,YouTube也推出「Edit with AI」。該功能能從相機膠卷中自動挑選精華片段,加入轉場、音樂、旁白(支援英文與印地語),快速生成影片初稿,讓創作者能在此基礎上進一步編輯。
目前,Edit with AI正於Shorts與YouTube Create應用程式中測試,並預計於未來數週擴展至更多市場。
從短影音自動生成到AI音樂混音,YouTube此次推出的功能,明顯對標TikTok、Instagram Reels等同類平台。隨著Veo與Lyria等生成式模型融入創作流程,短影音的生產門檻將被大幅降低,也可能加速新一波「全球短影音內容爆量」潮流。