Meta新AI項目輸入文字就能生成影片

2022-09-30

透過 DALL-E 2 和 Stable Diffusion 等可用的公開AI影像生成器，人工智慧（AI）在由少數單詞生成的影像方面越來越進步。而現在，Meta 研究人員將更進一步，他們正使用AI將文字描述做成影片。

178542405 fb link — Meta新AI項目輸入文字就能生成影片（示意圖：123RF）

Meta的首席執行長馬克·祖克柏，在臉書上發布了一段 20 秒的影片，公開了關於這項名為 Make-A-Video的技術。這影片包含了Meta 研究人員輸入「一隻泰迪熊在畫自畫像」、「一隻戴著針織帽的樹懶寶寶試圖找出一台筆記本電腦」、「一艘登陸火星的宇宙飛船」，以及「機器人在海浪中衝浪」等文字後，由AI所做出的影片。

雖然每個影片解析度低、不精緻，還只有幾秒鐘長，但隨著AI系統越來越擅長從文字生成影像，這個影片展示了AI研究正在採取的新方向。

但是，這技術也令人擔憂。研究人員指出，與從文字生成圖片的人工智慧系統一樣，他們的文字到圖片人工智慧模型是在網路數據上進行訓練的，這代表了AI學會，而且還可能會「誇大社會偏見，包括有害的偏見」。Meta研究人員注意到，雖然AI確實過濾了「工作場所不宜」的內容和有害詞的數據，但由於數據集包含了數百萬張圖片和文字，因此還是無法刪除所有此類內容。

在臉書貼文中，祖克柏也指出從幾個單詞生成影片是多麼棘手。他提到，生成影片要比生成照片困難得多。除了正確生成每個像素之外，系統還必須預測它們會如何隨時間變化。

祖克柏表示，Meta 計劃在未來分享 Make-A-Video 項目作為此領域的示範。（記者／莊閔棻）

參考資料：祖克柏Make-A-Video貼文、CNN