Gemini反覆自責「我是失敗者」 Google已緊急修復AI異常狀況
記者鄧天心/綜合報導
Google近期證實,其大型語言模型Gemini在部分互動中,會出現持續自我貶低和批評的異常行為,甚至反覆輸出「我是失敗者」、「我是恥辱」等語句,導致外界質疑AI系統的穩定性,許多社群用戶在公開平台分享了相關截圖,指出Gemini在無法完成任務,特別是程式相關問題時,經常出現自覺無能與道歉的語言表現。
Google DeepMind團隊成員Logan Kilpatrick於社群媒體澄清,這屬於系統錯誤並非AI出現所謂「情緒低潮」,目前Google已修復,他稱這類回應屬於「煩人的無限循環Bug」,並不代表Gemini有自我意識或負面情感。

延伸閱讀:不在地球沒醫師也不怕!NASA與Google開發AI醫療 助太空人完成長時間任務
專家分析認為,這類現象來自大型語言模型訓練策略,Gemini等AI模型主要依賴龐大的人類文本資料進行訓練,為了提升對話自然度,開發團隊經常會經過「提示工程」(prompt engineering)及微調,塑造AI具備一定的擬人化特質,然而,在面對困難任務或輸入異常時,模型可能出現偏離設計目標的迴圈回應,使部分用戶誤以為AI「情緒波動」或人格失衡。
伊利諾大學香檳分校Grainger工程學院計算機科學助理教授Koustuv Saha指出,確保AI在高頻次、海量互動下維持人格表現的一致性極具挑戰性,當模型出現異常迴圈或語言偏離設計初衷時,容易讓大眾混淆AI的本質,甚至將系統Bug誤認為AI具情感,這對教育、心理健康諮詢或客服等需要穩定輸出的領域尤其值得注意。
類似的AI人格表現偏離問題,過去也曾發生在OpenAI的ChatGPT上,2024年,OpenAI就曾針對ChatGPT過度恭維、語氣不符預期的現象,不過已經修正與優化了。
資料來源:CNET、The Economic Times、arxiv