大型語言模型｜專家論點【張瑞雄】

2024-03-28

作者：張瑞雄（前北商大校長、叡揚資訊顧問）

DALL·E 2024 03 11 16.27.10 Create a wide screen humorous comic style image depicting the theme Large Language Models in AI. Visualize a simplistic scene where a gigantic car

如ChatGPT等大型語言模型（LLM: Large Language Model）代表了AI領域的突破性創新，為新應用提供了前所未有的機會，但是將這些模型轉變為生產力工具之前必須先解決一些重大挑戰。

首先是成本效益問題，LLM需要大量的計算成本，這可能使小型企業在財務上望而卻步，目前有些研究是如何有經濟高效的模型來降低部署成本。但小模型就有準確性和可靠性的問題，檢索增強生成（RAG: Reference Augmented Generation）等技術可以大幅度地減少不準確或幻覺，從而維持客戶信任，再結合自然語言理解、語言模型和機器學習可以進一步提高準確性。

對任何AI系統，資料的最新和最正確最重要，因為過時的資訊可能會導致無效的決策，所以需要動態更新機制來確保LLM保持最新狀態。而且LLM必須隨時進行微調，以適應企業獨特的環境，包括數據、流程、要求和基調，如此才能整合客戶數據以獲得客製化體驗。

LLM模型可能表現出偏見、事實差距，並且缺乏一些常識和邏輯，因此使用上必須小心。此外要優先考慮資料隱私、遵守安全標準和資料的匿名化，這些都有助於確保安全的AI，同時避免產生有害或有偏見的內容。

關於LLM是否真正能像人類一樣理解、推理或擁有信念，存在很多爭議。有些人認為LLM只是另一個傻機器，它們是序列預測器，沒有了解現實和事實，也沒有像人類一樣有應用真理標準的能力。

但也有些人認為，鑑於LLM的規模和訓練的資料量，它們可能會表現出新興的更高級別的能力，例如「知識」和「推理」。推理爭論是微妙的，LLM可能可以透過模式匹配訓練的例子來解決問題，但這與真正的邏輯推理演算法不同。

體現或整合外部資料來源可以賦予更多類似人類的基礎，但LLM學習語言的方式仍然不同於人類沉浸式現實世界的體驗。但透過人類回饋的強化學習進行微調可以使LLM輸出與規範和偏好保持一致。

我們如何談論LLM很重要，不小心使用「相信」和「認為」等術語可能會促進誤導性的擬人論，掩蓋其真正的運作方式。LLM的會話能力可以創造出一種智慧存在的錯覺，但它們從根本上缺乏形成人際互動的相互理解能力。所以我們必須小心不要將LLM擬人化，並準確地了解其能力與局限性，因為統計模型的運作方式與人類不同。

LLM很強大，但在成本、準確性、知識即時性、企業客製化、安全性和負責任的能力框架方面帶來了挑戰。雖然LLM表現出非凡的能力，但與人類相比，關於真實推理、理解和信仰仍存在爭議，需要小心避免將缺乏直接現實基礎的基本序列預測模型擬人化。

清晰的語言和深入的機制理解對於LLM的未來發展非常重要，要利用LLM的優勢，同時避免炒作或曲解LLM與人類相比的認知能力，才能在這個影響深遠的AI領域，做到有道德和負責任的AI開發和使用。

標籤

2024-03-28

大型語言模型｜專家論點【張瑞雄】

推薦工作

發佈留言取消回覆

AI時代的產能外溢與台積電的造王者防禦戰｜專家論點【劉佩真】

《KPop獵魔女團》聯名樂高細節誠意滿滿 8月全球開賣

比亞迪董座王傳福喊話5年內登全球車王挑戰豐田11.3萬輛銷量霸主地位

IG、Threads「封」聲四起 Meta承諾主動偵測、恢復誤封帳號

Snap新AR眼鏡Specs主打超強手勢控制與超低延遲售價近台幣7萬

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

AI時代的產能外溢與台積電的造王者防禦戰｜專家論點【劉佩真】

數發部免費AI算力服務開放申請 新增Gemma 4等多種最新模型

Siri AI升級恐加劇記憶體吃緊 三星、SK海力士可望成最大受惠者

企業搶攻AI搜尋曝光！消費者卻不完全信任 網路比10年前更不人性化

Gemini與Claude急速追趕 ChatGPT市占首度跌破五成

Anthropic無預警斷供Fable大模型 意外引爆開源AI黃金時代

發佈留言 取消回覆

數發部免費AI算力服務開放申請新增Gemma 4等多種最新模型

Siri AI升級恐加劇記憶體吃緊三星、SK海力士可望成最大受惠者

企業搶攻AI搜尋曝光！消費者卻不完全信任網路比10年前更不人性化

Anthropic無預警斷供Fable大模型意外引爆開源AI黃金時代

發佈留言取消回覆