AI只需15秒語音就能生成複製！「語音引擎」技術打開潘朵拉盒子｜專家論點【朱楚文】

2024-04-17

作者：朱楚文（IC之音竹科廣播《科技領航家》主持人）

你有想過只需短短 15 秒，你的聲音就能被 AI 複製出來嗎？OpenAI最近公布全新技術「語音引擎」(voice engine)，居然只要任何人短短 15 秒的語音，就能被 AI 模仿聲音特徵、複製生成各種聲音文本，讓一般人根本難以分辨真假，再度引發討論！

Open AI在官網直接秀出生成範例，將一位男子的15秒語音，生成一模一樣講不同文本的聲音，甚至還將一位女子的聲音，生成各種不同語言，像是西班牙文、中文、德文。Open AI指出，這項技術除了可以協助語音朗讀，幫助無法閱讀或不想閱讀的人「唸」書吸取知識，還可以幫助短期因生病或各種原因失聲，卻又需要演講的人。甚至是聾啞人士，也可以透過這項技術選擇適合自己的聲音，以進行溝通。創作者也可以運用這項技術，把自己的創作生成各種語言版本。

不過想當然爾，這項技術雖然帶來突破和便利，卻也讓不少人擔心潛在危機。例如，如果被惡意使用，可能導致語音偽造、詐騙等問題，知名科技媒體 Wired 就指出，AI 生成的語音甚至逼真到可以通過銀行的語音認證系統，想想如果被詐騙集團盜用，真的蠻可怕的。

另外，隱私權問題也可能引起擔憂，我們的聲音資料會被濫用嗎？如果一旦被人冒充身分參與不法活動，我們該如何證明自己的清白？這問題可能政治人物、公眾人物等，可能會更加擔心，畢竟不久前就已經出現詐騙集團運用 AI 生成歌手影像，騙走歌迷數十萬元。而接下來，若在選舉中運用生成聲音進行抹黑造謠，這又該如何是好？

Open AI 在官網也坦白說，他們知道語音生成一旦遭到濫用，後果會不堪設想，所以他們目前沒有開放這樣的技術給大眾，只跟一小部分合作夥伴進行私下測試，包括教育科技公司 Age of Learning、AI 影片創作平台 HeyGen、醫療軟體開發商 Dimagi 等。

不過潘朵拉的盒子已經被打開了，這項厲害的技術，具備巨大的能量與潛力，卻也充滿殺傷性，接下來我們可能都需要預先想想，如果未來有一天，我們的聲音被 AI 複製，在網路上散佈謠言或進行詐騙，該怎麼處理？我們如何保護自己的聲音資料？這或許也需要政府出馬，來設立應有的規範了。

科技總是如此，為人類帶來便利，卻也產生風險與問題，如何平衡技術發展與個人隱私安全，將是我們這AI新工業革命時代的挑戰了。

瀏覽 1,223 次

標籤

2024-04-17

AI只需15秒語音就能生成複製！「語音引擎」技術打開潘朵拉盒子｜專家論點【朱楚文】

推薦工作

發佈留言取消回覆

iOS 26將為AirPods帶來5大新功能搭載H2晶片可獨享3功能

打破界線！Replit進駐微軟Azure生態系瞄準非開發人員市場

南韓遊戲大廠Krafton與Nvidia合作用AI讓NPC跟人一樣

iPhone 17e傳將於明年春季登場螢幕規格恐無驚喜

培育AI與電資領導人才台大攜6企業組「AI電資大聯盟」

最新科技新聞快訊不錯過!!

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

AI醫療輔助應用的困難｜專家論點【張瑞雄】

超越高教場域：以科技倫理視角探討生命與法律的跨域實作與人才培育｜專家論點【郭啟全】

文化創意產業的AI革命：當人工智慧遇見藝文創作｜專家論點【鄭緯筌Vista】

台灣限制華為、中芯出口 科技國安戰升級｜專家論點【劉佩真】

AI搜尋的信任危機｜專家論點【張瑞雄】

AI行銷革命：掌握核心素養、解鎖成功祕訣｜專家論點【鄭緯筌Vista】

發佈留言 取消回覆

台灣限制華為、中芯出口科技國安戰升級｜專家論點【劉佩真】

發佈留言取消回覆