【課堂筆記】通往 AI 詠唱者之路 – 語言模型的極限與盲點|張維元 (8/9)

講師:張維元

粉專【資料科學家的工作日常】及【資料科學家的 12 堂心法課】發起人

擅長網站開發與資料科學的雙棲工程師,斜槓於程式社群 【JSDC】核心成員及 【資料科學家的工作日常】社群經營。同時在新創企業擔任資料工程師,同時也在中華電信、工研院與多所學校等單位持續開課。擁有多次國內大型技術會議講者與競賽獲獎經驗,曾獲得 2018 台灣總統盃黑客松 冠軍隊伍與 2016 微軟 Imagine Cup 台灣區冠軍,持續在不同的平台發表對 #資料科學、 #網頁開發 或 #軟體職涯 相關的分享。

一、資料科學與AI人工智慧

資料科學簡單來說就是從資料中找關係的方法,而這裡所指的「關係」就包含了統計學、機器學習、人工智慧等。所謂的「現代資料科學」指的是,在目前大數據的資料量的情況下,我們透過機器學習的模型與方法,找出過去在比較大量的資料當中難以發現的關鍵與內容。目前的人工智慧以及生成式AI就是由資料科學而來的,所以我們必須先了解什麼是資料科學。

  1. 資料時代的興起與AI

回顧科技發展的歷史,人類已經經歷過了四次的工業革命,而我們目前的時代正式工業4.0的時代。我們大約在十年前進入此階段,而工業4.0的特點就是雲端的出現,且各式各樣的裝置都可以連上網路並串接起來,於是乎出現了物聯網、大數據、機器學習,以及目前熱門的人工智慧,而人工智慧就是將工業4.0發展出的雲端、物聯網、大數據與機器學習技術濃縮起來,型成火力展示,讓我們了解過去的技術演進已經可以做到什麼事情。

所謂的人工智慧,就是利用程式、電腦或數學模型去模仿人類的行為。雖然許多人在近期因為ChatGPT的出現才開始討論AI,但其實AI技術早在三、四十年前就已經開始發展,只是礙於當時的技術尚未成熟,所以發展一波三折,也較無進展。不過AI技術已在近年有許多重大的突破,最著名的案例即為2016年AlphaGo機器人利用人工智慧打敗世界棋王。然而,當初雖然造成一片轟動,但這股注意力很快又消失,AI仍離我們有一段距離。一直到2022年OpenAI推出ChatGPT後,人們才逐漸發現AI離我們愈來愈近,甚至可以將AI做為我們生活或工作上的小幫手。也就是說,AI從以往專注於特定領域也只有更程師相關的人員才會經常接觸,但如今不管我們從事何種行業,都已經可以輕易地使用AI了。不過,從人工智慧發展的三個階段,即具備感知智慧,可以做很多事情,但無法自己思考且不具自主意識的弱人工智慧、具備認知智慧,可以思考與判斷的強人工智慧,以及具備計算智慧,可以超越人類思考極限的超級人工智慧,ChatGPT仍只達到弱人工智慧的天花板。

  1. 人工智慧的學派

了解了AI的發展史後,我們要介紹大家AI的五種學派。目前AI理論可概分為五種學派:符號理論學派、演化論學派、貝式定理學派、類比推理學派、類神經網路學派。生成式AI就是類神經網路學派的其中一個分支。類神經網路其實不是憑空出現,從歷史模型的演進看來,其實早就於30-40年前出現。類神經網路就是利用數學模型模仿大腦的結構,希望讓電腦的行為能夠愈來愈像人類。在腦神經科學中,我們知道大腦是由許多神經元串連而成,負責在受到外界刺激後傳遞訊號讓人體做出相應動作。而內神經網路想做到的事即利用許多不同的數學公式來代表人類大腦的神經元,透過這些數學公式的串接模仿大腦當中的結構。多年以來,經過許多專家學者不斷的嘗試,深度學習 (deep learning)的技術終於被成功開發。深度學習是將許多節點串聯,並透過多種數學模型與公式模擬大腦結構進行維度轉換(Kernel Method)讓電腦可以將讀取後的原始資料的數據透過一層層的轉換,將原本難以使用的資料轉換至較複雜的維度裡,使電腦本身可以更容易地分別資料的特性,將這些原本難用的資料變得好用。

二、ChatGPT的崛起

ChatGPT是由OpenAI於2022年11月推出的人工智慧聊天機器人,而其中GPT指的是「生成式語言模型」。生程式語言模型是一種深度學習的模型,深度學習模型除了前述基礎模擬大腦的模型外,還有如卷積神經網路(Convolutional Neural Network)、循環神經網路(Recurrent Neural Network)與Transformer轉換器等,而GPT就是Transformer模型的改良。它可以根據我們輸入的一連串內容,透過Transformer模型處理後回傳給我們一連串的結果,所以ChatGPT就是將生成式語言模型用於聊天情境上的AI軟體。

ChatGPT納入了各式各樣的技術,包含Prompt Engineering(照樣照句)。ChatGPT之所以知道要如何回覆我們,就是透過讀取大量文本後知道,當我們說「您好」時,大部分的人會如何回覆,進而產生適當的答案給我們。但是,生成式語言模型不只可以運用於「文字生文字」的情境,它也可以用於「文字生圖片」、「音檔生文字」等不同情境。目前OpenAI也已開發出需付費購買的GPT-4,它不只相較GPT-3.5有更大的資料庫,它還有所謂的「多模態模型」(multimodel)。多模態模型可以接收各種不同型態的資料,像是能夠在同一個模型中,同時接收文字或音檔,並產生不同的結果。多模態模組織所以讓大家對AI有更多的想像,是因為它如果可以吸收多樣態的資料,例如光的資料、溫度的資料,那麼套用多模態模型的機器就可能能夠有更好的感知能力,像是接收到聲音檔案,就可以產生火車的圖片;感受到溫度上升,就可以預判是否發生火災,讓機器擁有與人類同樣的感官體驗。

目前各大公司開發LLM大型語言模型就猶如一場軍備競賽。當我們想要發展一個大型語言模型時,首先就是需要大量資料與運算機器,這導致只有擁有足夠資源的大公司才能發展自己的語言模型,這些大公司則不斷地開發比對手更優秀的語言模型。在這樣的情況下,當這些大公司都將模型準備好了,而中小企業又沒有足夠資源參與開發語言模型的軍備競賽,且由於AI的快速發展,許多專家學者已經示警,所有的產業都可能因為AI而變化得更快,因此如何善用這些模型就是我們必須思考的關鍵問題。

三、ChatGPT對產業的影響

前文提到,發展AI的目標就是透過許多的數學模組或公式來模仿人類行為,於是隨著AI時代的來臨,我們就需思考,AI真的超越人類了嗎?目前已有分析指出,ChatGPT的能力在大多數工作上都已經達到能夠與人類比擬的階段,唯有如數學、儀器操作、監督機械操作,與品管分析等層面仍較不及人類,表示在需要實際操作的領域上,AI仍舊無法與人類相當。

從產業面向來看,我們也發現大部分的產業都或多或少受到AI發展的影響,而文書、文本、行政處理等較制式化的產業受到影響的比例則較其他產業大。可見AI對於各項產業的影響都相當可觀,因此不管我們從事何種工作都應該加以警惕。我們應該積極了解AI對我們所從事的產業會有什麼影響?又應該如何改善我們的求職策略?以資料產業為例,過去資料團隊基本上可以分成三種角色:負責整理資料的資料工程師、負責探索資料的資料分析師,以及負責挖掘資料的資料科學家。而當AI出現後,我們發現三個高風險工作者特徵,即只會利用工具但無法解讀分析結果的資料分析師、只會徒手自幹但無法善用開源工具的資料工程師,與只會模型理論但無法選擇應用場景的資料科學家。也就是,過去我們對於資料分析師的期待是希望他們能夠解釋電腦產生的資料結果,因此他們就必須具備分析和解讀能力。而AI對於資料分析師的影響是,AI知道如何分析,但其解讀的能力仍有待加強。因此,若未來我們欲從事資料分析師的職位,那麼我們就必須加強解讀數據的能力。

從上揭例子中,我們可以瞭解,身處AI時代的我們不管從事何種產業,首先都必須思考AI對產業的影響,並思考我們如何與AI協作,以及工作之餘我們又應該如何分配資源精進自己的能力。另外,若大家正在求職,也不妨思考AI科技的發展,在取代某些職業時,是否也產生了以往所沒有的職業。就像在汽車發明之後,馬伕與逐漸被計程車司機所取代,而AI在取代某些職業時,是否也會有相應的新職業產生呢?

四、結論:ChatGPT的極限與天花板

從今天的課程中我們知道,AI雖然在近幾年才受到大眾關注,但其實科學家其實早在幾十年前就不斷嘗試開發AI技術,只是礙於當初的技術限制而無法成功發展。然而,雖然AI技術可以帶給我們許多便利,我們也必須知道它能與不能做什麼。已ChatGPT為例,我們不應對它抱有不正確的期待。因為ChatGPT是沒有連線的,且它的回答只限制在其資料庫更新的最後日期,也就是2021年的9月,所以如果我們問了ChatGPT此時間點前的問題,那麼它可能會產生幻覺而出現一本正經講幹化的狀況。如果我們一面倒地接受它提供給我們的結果,就很有可能導致負面的結果。另外,使用ChatGPT時也可能會有資安問題,所以我們在使用時也必須注意不要將具有機敏訊息的資料餵給ChatGPT。最後,雖然AI帶給我們許多便利,但我們也必須了解它的極限,並妥善運用AI,如此一來才能讓它變成我們生活與工作上的好幫手!

【若想回顧完整版課程影音,請點選連結;有任何問題或分享,也歡迎在本文底下留言。】

瀏覽 1,652 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button