ChatGPT語音功能重大革新!預示新一代Siri互動模式

記者孟圓琦/編譯

OpenAI 近期針對旗下 ChatGPT 語音功能進行的更新,大幅提升了使用者與聊天機器人的互動彈性。業界普遍認為,此一變革不僅徹底轉變了 ChatGPT 的使用體驗,更為 Apple 正在開發中的新一代 Siri 樹立了關鍵的參考典範。

Gemini Generated Image z9ugbyz9ugbyz9ug
ChatGPT的語音更新,讓聊天機器人的互動比以前靈活得多,這可以在新的Siri中期待的關鍵功能之一。(圖/AI生成)

語音與文字深度融合,告別模式切換困擾

本次 ChatGPT 的核心更新在於整合了語音與文字互動。過去,使用者若想從語音模式切換到要求生成圖像等視覺化任務時,往往需要切換模式,造成體驗上的割裂感,猶如與兩個獨立的 ChatGPT 模型互動。

然而,透過最新的更新,使用者現在可以直接在聊天介面中使用 ChatGPT 語音功能,無需進入獨立模式。這意味著使用者可以同時進行語音交談、即時查看文字回應、回顧舊訊息,並即時檢視圖像或地圖等視覺內容。這種無縫的互動體驗被視為提升可用性的重要里程碑。

延伸閱讀:
OpenAI與Perplexity助推「AI對話式商務」電商版圖恐遭重塑
Google Gemini 3優勢大增!外媒:已對ChatGPT造成生存性威脅

Apple 面臨整合挑戰,Siri 應對未來需求

相較之下,Apple 的發展路徑恰好相反。Siri 最初是以純語音服務推出,而 Apple Intelligence 才開始加入如摘要電子郵件等文字能力。業界分析人士推測,Apple 耗時較長的原因,可能正是因為在努力實現類似 ChatGPT 這種跨模式的深度整合。

評論指出,未來 Siri 若要兌現 Apple 承諾的各項功能,就必須具備這種能力:使用者透過語音指令,不僅獲得語音回應,還能同時操縱文字和圖像。此外,Siri 也必須進化為智慧代理人,能夠與使用者手機上的應用程式深度互動,例如執行「預訂明天早上從希思路飛往拉斯維加斯的第一班飛機」等複雜指令。

隱私與時效性考量,外包 AI 能力成可能選項

面對 AI 聊天機器人技術的飛速發展,Apple 是否能以自家技術迎頭趕上仍是未知數。若要確保新版 Siri 能在「明年」這個最後期限前問世,與第三方 AI 廠商如 OpenAI Google Gemini 進行合作,以客製化方式外包 AI 能力的可能性極高。

關鍵在於兩點:首先是隱私保護。Apple 必須像目前與 ChatGPT 的合作模式一樣,確保所有透過第三方聊天機器人處理的互動內容,都不會被用於訓練模型。其次是時效性。為了跟上市場對 AI 智慧化的期待,無論底層技術是自主研發或客製化的外部 AIApple 都必須盡快將這項智慧帶給使用者。

資料來源:9to5macScripting News 

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button