語言模型 – 科技島-掌握科技新聞、科技職場最新資訊

地表最快語言模型？蘋果新模型FS-DFM 實現長文本生成速度提升128倍

Mily — Wed, 15 Oct 2025 02:37:07 +0000

蘋果公司（Apple）研究人員在與俄亥俄州立大學的合作研究中，發表了一款名為「少步驟離散流匹配」（Few-Step Discrete Flow-Matching, FS-DFM）的新型語言模型。該模型在長文本生成方面展現出革命性進展，其寫作速度最高可比同類模型快上128倍，同時維持極高品質。記者孟圓琦／編譯

蘋果公司（Apple）研究人員在與俄亥俄州立大學的合作研究中，發表了一款名為「少步驟離散流匹配」（Few-Step Discrete Flow-Matching, FS-DFM）的新型語言模型。該模型在長文本生成方面展現出革命性進展，其寫作速度最高可比同類模型快上128倍，同時維持極高品質。

[caption id="attachment_195325" align="alignnone" width="693"] “ FS-DFM：使用少步擴散語言模型快速準確地生成長文本”的研究中，來自蘋果公司和俄亥俄州立大學的研究人員提出了一種名為少步離散流匹配（FS-DFM）的新模型，執行更大、更準確的更新，而不會「超出」預期文字。（圖／AI生成）[/caption]

傳統的語言模型（如 ChatGPT 所使用的 LLM）屬於自迴歸模型（Autoregressive Models），必須依序一個詞元（token）一個詞元地生成文本。與之相對的擴散模型（Diffusion Models）雖然能夠平行生成多個詞元，但往往需要數百甚至上千次的疊代修正才能產生最終結果。

延伸閱讀：
年底換機潮來襲！蘋果副總推文藏彩蛋、預告「怪獸級」MacBook Pro
告別 Plus！蘋果串流服務正式更名「Apple TV」解決名稱混亂

核心技術與優勢

這項名為《FS-DFM：使用少步驟擴散語言模型實現快速準確的長文本生成》的研究指出，FS-DFM 模型僅需八次快速修正，便能生成與需要超過一千個步驟的擴散模型品質相當的完整長篇段落。研究人員採用了精巧的三步驟方法來達成此一突破：

訓練模型：

使其能夠適應不同次數的修正預算。
引入指導：

使用一個引導性的「教師模型」（Teacher Model），幫助 FS-DFM 在每次迭代時進行更大、更精確的更新，同時避免文本「過度修正」。
迭代優化：

調整每次迭代的工作方式，使模型能以更少且更穩定的步驟達到最終結果。

卓越的效能表現

在兩個關鍵的文本品質衡量指標上，FS-DFM 的表現優於現有大型擴散模型。困惑度（Perplexity）是用於衡量文本自然度和準確度的標準指標，分數越低代表文本越流暢自然；熵（Entropy）則衡量模型選擇每個詞的信心，適度的熵值能確保文本既不重複單調，也不隨機 incoherence。

與參數高達 70 億的 Dream 擴散模型和 80 億的 LLaDA 擴散模型相比，參數規模僅有 17 億、13 億甚至 1.7 億的 FS-DFM 變體，在所有迭代次數下，均能持續達到更低的困惑度，並保持更穩定的熵值。

研究人員表示，鑑於這項方法所展現的卓越成果，以及目前類似模型研究的缺乏，他們計畫「發布程式碼和模型檢查點，以促進重現性與進一步的研究」。業界預期，這項技術的開源將加速高效能長文本生成領域的發展。相關實施細節與技術探討，可參閱發表於 arXiv 上的完整論文。

資料來源：9to5mac、完整論文

AI思考的迷霧：語言模型的推理幻覺與知識誤導｜專家論點【張瑞雄】

林育如 — Fri, 06 Jun 2025 01:00:15 +0000

AI正以令人眼花撩亂的速度滲透進知識傳播與推理判斷的領域，大型語言模型（LLM）已從單純的文字生成工具，晉升為能夠進行多步推理、回答複雜問題、甚至總結科學研究的「智慧夥伴」。但隨著這些模型愈來愈擬人化地「思考」與「說話」，我們也正面臨一項日益嚴重的風險：我們是否過度相信這些模型，卻忽略了它們背後邏輯的虛假與知識的扭曲？作者：張瑞雄台北商業大學前校長/叡揚資訊顧問

[caption id="attachment_175421" align="alignnone" width="812"] AI不是在「推理」，而是在「模仿推理的語氣」。（圖／123RF）[/caption]

事實上，目前多數語言模型的推理過程並不如表面所見般「合理」。這些模型在回答問題時，常會先生成一段類似人類思考歷程的文字，如「因為A，所以B，因此結論是C」。這種語言上的「思考草稿」看起來像是在步步為營地推導結論，實際上卻可能只是語言拼接的產物，而非真正的邏輯演繹。換句話說，AI不是在「推理」，而是在「模仿推理的語氣」。

這帶來一個本質性的危機，如果AI在「思考的過程」中未能真正處理因果關係與邏輯依賴，那麼它所生成的結論，即使字面正確，也無法確保過程可信。人類往往透過觀察推理步驟來判斷說話者的可信度，但若AI的步驟只是裝飾，那麼所有的外部監督、糾錯與控制機制將無從著力。

此外另一個值得警惕的現象是，在AI被用來簡化科學內容、撰寫摘要時，經常會將研究結果過度泛化。例如一項針對特定族群、特定條件下的臨床實驗結果，AI可能在摘要時將其表述為「對所有人都有幫助」；或是將研究者謹慎使用過去式所描述的發現，改寫為肯定性的現在式斷語。這樣的處理雖能提升語句的流暢度與說服力，但卻大幅扭曲了科學原意。

這不僅是語言問題，更是科學倫理的問題。當AI被運用於醫療、教育或政策領域，其生成的內容如果缺乏對研究限制的認識，甚至直接跳躍為行動建議，便可能誤導使用者做出錯誤的決策。若一位醫師根據AI摘要得出過度樂觀的療效認知，或一位政策制定者因為AI結論忽略了抽樣侷限，將錯誤的研究結果擴及整體人群，後果將不堪設想。

更具諷刺意味的是，越新穎的模型，越有可能出現這種「語言過度自信」的傾向。這反映出AI發展的一個盲點：工程導向的模型訓練過度強調「輸出品質」與「人類喜好」，而忽略了內在邏輯與事實一致性。語言模型變得更像「擅於說故事」的高手，卻未必是「說實話」的智者。

為了避免這場信任危機擴大，我們亟需採取多層次的因應策略。首先技術設計者應重新思考語言模型的訓練目標。若目標僅為生成高品質語句，則模型將持續傾向說出「好聽的話」；若能導入更強的因果推理監控機制，強化推理過程與結論的一致性，則或許能朝真正的「可信AI」邁進。

其次，AI應用平台在推播由模型生成的內容時，應負起揭露風險的責任。例如，標示「此摘要由AI生成，可能不含原研究的全部限制條件」，或者提供原始資料的快速鏈接，讓使用者自行查證。這類設計看似繁瑣，實則是維護知識透明與誠信的基本義務。

使用者教育也不可或缺，從學生到醫師、從公務員到媒體人，都必須理解AI並非萬能，它生成的推理與摘要需要被檢驗、被質疑。建立一種「懷疑的素養」與「交叉查證」的文化，將是資訊時代最重要的防線。

最後，監管機構與科學社群亦應正視這項挑戰。針對AI生成的科學摘要、醫療建議等高風險內容，應設立審查標準與信度評估機制。這不代表否定AI的價值，而是確保其角色與影響受到合理規範，避免誤導公眾與侵蝕科學信任。

AI並非惡意的說謊者，它只是反映我們給予的訓練與目標。如果我們只要求它「說得像人類」，卻不要求它「像人類一樣思考、謹慎、誠實」，那麼最終，它將成為一個有說服力卻無邏輯根基的知識幻覺製造者。

倒數Computex 2025 黃仁勳AI主題演講有望展示新語言模型超越GPT-4o

Mily — Wed, 30 Apr 2025 02:22:38 +0000

台北國際電腦展(Computex)一直以來致力於展現臺灣科技生態，並躍升為擴展全球人工智慧尖端系統的關鍵平台。在今年5月份，即將再次迎來年度盛事、集結來自全球162國的科技巨擘，共同交流前瞻科技的洞察與新品發布，打造更多技術革新的火花。在5月19日這天，將由輝達(NVIDIA)執行長黃仁勳親自前往發表主題演講，除了分享AI與加速運算的最新進展與突破，亦有望說明近期發表的全新AI模型Describe Anything Model（DAM）。記者孟圓琦／台北報導

[caption id="attachment_171371" align="alignnone" width="1024"] 台北國際電腦展(Computex)將於5月20日至23日在台北南港展覽館展開，5月19日則會首先迎來黃仁勳的主題演講。(示意圖/AI生成)[/caption]

COMPUTEX 2025今年的主題定位為「AI Next」，將聚焦「智慧運算 & 機器人 (AI & Robotics)」、「次世代科技 (Next-Gen Tech)」、「未來移動(Future Mobility)」，活動期間也將迎來全球知名科技巨頭共襄盛舉，包含聯發科執行長蔡力行、高通總裁暨執行長Cristiano Amon、鴻海劉揚偉與恩智浦半導體執行副總裁Jens Hinrichsen等。除此之外，輝達創辦人黃仁勳的主題演講，也同樣是這次的一大亮點，除了發表持續在加速運算、實體AI與代理AI中發展的創新突破，近期輝達所推出的全新多模態語言模型「Describe Anything Model（DAM）」也有機會在Computex上正式亮相。

延伸閱讀：
COMPUTEX 2025又一大咖！恩智浦半導體執行副總裁來台演講
 COMPUTEX又一大咖登場！高通執行長親自來台講為何押寶「邊緣AI」？
繼黃仁勳後！COMPUTEX 2025又一大咖聯發科蔡力行接力演講

Describe Anything Model（DAM）做為一個強大的多模態大型語言模型，可以為圖像或影片中的特定區域生成詳細的描述。使用者可以使用點擊、框選或指定區域，讓DAM針對這些特定區域產生豐富的描述，比方說，一位少女和一隻貴賓狗在花叢中散步的照片，DAM可以針對女孩的外觀、體型、貴賓狗的毛色與動作等，在多項細節上進行完整敘述。其中，針對可下載內容(downloadable content，簡稱DLC)則會更深入探討使用者在指定區域的細節，除了說明畫面上的物品名稱與類別，還會更細膩地說明詳細屬性、紋理、顏色圖案、形狀與視覺上的特徵。

[caption id="attachment_171373" align="alignnone" width="1536"] DAM可以針對畫面上的指定區域進行詳實的描述，包含少女的體態、衣著，連同小狗的毛色和動作等。(示意圖/AI生成)[/caption]

DAM亦可被引導生成不同細節與風格描述，無論是簡短摘要還是豐富詳實的敘述都可因應不同需求生成，而這樣彈性的靈活度，有益於不同任務的快速標記及專家的深入分析。除了外觀描述，DAM也能回答關於指定區域裡的問題，且無需額外的訓練資料。即便目前僅有3B參數，然而在經過PACO、HC-STVG等Video Grounding主流測試中，DAM-3B的表現相較 GPT-4o及類似視覺語言模型都更略勝一籌。

工研院打造台灣首座AI測試實驗室提供語言模型可信任評測

李琦瑋 — Tue, 29 Oct 2024 08:36:17 +0000

隨著生成式AI應用範圍日益拓展，語言模型作為其重要核心，相關資安、準確性等問題，也是產業關心的重要議題。為確保AI人工智慧更安全的發展，提升人民對AI的信賴，工研院29日宣布，打造台灣首座AI測試實驗室，提供語言模型可信任評測服務，確保產業客戶的語言模型能安全可靠的在各個領域穩定運行。

記者／李琦瑋

工研院打造台灣首座AI測試實驗室，提供產業語言模型可信任評測。（圖／工研院提供）

工研院指出，語言模型是自然語言處理（Natural Language Processing；NLP）不可或缺的關鍵，也是AI理解文本、生成內容、語音辨識、情感分析等重要依據，經由大規模文本學習來掌握語法、語意、上下文關聯性等語言特徵，進而產生類似人類的自然語言。然而，模型也可能因為數據偏差或失真，導致產生錯誤或不當資訊，甚至在處理敏感數據時更有資安風險存在，因此，儘管生成式AI當紅，但語言模型的開發和部署還是得小心謹慎，以確保輸出結果準確、穩定且可靠。

延伸閱讀：台灣發展AI面臨4大痛點！工研院籲善用軟硬體整合

在數發部數產署支持下，工研院成立台灣首座AI測試實驗室，參考國際可信賴AI的相關框架及標準，透過AI產品與系統評測中心（Artificial Intelligence Evaluation Center；AIEC）專家以及技術委員會開發可信任語言模型評測工具，提供包括準確性、公平性、可靠性、隱私及資安等自動化語言模型測試方案，協助國內廠商評估及改善語言模型，以確保語言模型及AI應用能在不同場景下保持穩定及可靠，並滿足企業和使用者需求。

工研院量測技術發展中心執行長藍玉屏表示，隨著生成式AI滲透到各個領域，對AI模型進行可信任性的測試與評估至關重要，因此工研院打造針對語言模型提供評測工具開發和導入的AI測試實驗室，透過參考國際以及國內專家審議的測試題庫，來評估生成內容的可信任性，促進企業在應用AI技術時更具信心。

藍玉屏說，工研院將持續加強對AI技術的測試和把關，並探索新興技術應用的測試與評估，確保台灣在全球AI技術競爭中的發展，此外，為了強化國際合作，工研院也同時與法國國家計量院（LNE）簽署合作協議，針對AI進行國際合作與技術交流，助力台灣AI評測技術接軌國際。

※探索職場，透視薪資行情，請參考【科技類-職缺百科】幫助你找到最適合的舞台！

擁數據者得天下！中研院士孔祥重點出台灣轉型AI島2大關鍵

李琦瑋 — Wed, 03 Jul 2024 01:38:44 +0000

中央研究院第35次院士會議2日邀請中研院院士、美國哈佛大學比爾蓋茲講座教授孔祥重發表主題演講，他點出台灣在轉型成為「AI島」之前，必須解決數據資料管理和人才培育2大關鍵，並建議發展繁中大型語言模型，將台灣打造為AI民主文化中心。

記者／李琦瑋

中研院士孔祥重點出台灣轉型AI島2大關鍵。（圖／中研院提供）

中研院第35次院士會議於6月30日至7月4日召開，2日的會議邀請英國國家學術院（The British Academy）院士理查柏克（Richard Bourke），以及中研院院士孔祥重發表主題演講。

延伸閱讀：院士會議開幕！中研院成立AI推動辦公室　賴清德：打造人工智慧之島

孔祥重以「擁抱生成式人工智慧」（Embracing Generative AI）為題，點出台灣在轉型成為「AI島」之前，必須正面解決數據資料管理和人才培育2大關鍵。生成式AI已成商業模式技術應用的新藍海，他認為政府除需要透過制定政策，讓民間AI研發團隊能以公平、公開且安全的方式來運用政府資料，亦需特別留意AI技術發展過程中可能產生的資安風險，這些都有助於提升AI技術的信任度。

孔祥重指出，「擁數據者得天下」，但如何有效管理數據是政府首當其衝的挑戰；AI發展始終離不開人性，如何讓AI模型在人類指導下學習、適應在地化的文化，是台灣因應AI科技地緣政治潛在風險的重要方向。

他建議，要將台灣打造為AI民主文化中心，必須發展一套符合台灣民主價值的繁體中文大型語言模型，並指出，百工百業領域都應探索生成式AI帶來的潛在產業優勢，但同時也要了解隨之而來的挑戰，最主要在2方面，一是如何讓AI智慧運算更節省能源消耗，二是如何控制AI模型對齊（align output）。

他強調，AI要與人類建立強而有力的關係，需要將AI技術與人類偏好及社會價值觀保持一致性。

英國國家學術院（The British Academy）院士理查柏克（Richard Bourke）呼籲大眾包容多元知識體系。（圖／中研院提供）

理查柏克則以「『東方主義』與西方：知識體系僅是權力的表達？」（'Orientalism' and the West: Are Knowledge Systems Merely an Expression of Power?）為題，探討20世紀早期至中期在歐洲哲學中出現對普遍真理可能性的深刻懷疑，並強調社會發展的背後，仍有許多顯性和隱性的文化價值，大眾應包容多元知識體系。

蘋果計劃透過小型語言模型推進未來AI策略｜專家論點【Abby Lin】

孫敬 — Thu, 27 Jun 2024 00:30:00 +0000

蘋果最新版本「OpenELM」是小型語言模型（SLM），用於在記憶體受限的裝置上運行，蘋果尚未透露其生成式人工智慧策略，但一切都表明它試圖主導尚未蓬勃發展的設備上人工智慧市場。

作者：Abby Lin（科技業產業研究員）

開放式、小型模型正受到矚目

蘋果以其軟體和硬體的整合而聞名，該公司最近一直在分享有關其機器學習模型的資訊和程式碼，其最新版本「OpenELM」是小型語言模型（SLM），用於在記憶體受限的裝置上運行，蘋果尚未透露其生成式人工智慧策略，但一切都表明它試圖主導尚未蓬勃發展的設備上人工智慧市場，而且該市場潛力可能大到足以讓蘋果擺脫一貫的保密文化，雖然Apple並不是唯一一發展SLM的公司，但它有也許有幾個因素可以發揮其優勢。

事實上，在過去的一年裡，開放模型取得了令人矚目的進步。運行它們的成本只是私有模型的一小部分，而且它們的性能正在迅速趕上，但更重要的是，開放模型使研究界能夠將其重新用於新的應用和環境，例如在發布後的幾天內，Meta的Llama 3已經進行數千種和修改。

蘋果策略發展方向。（資料來源／canalys）

什麼是 OpenELM？

OpenELM是一系列在公開資料集上進行預先訓練和微調的語言模型，模型有四種大小，參數範圍從2.7億到30億不等，能夠輕鬆在筆記型電腦和手機上運行。

實測指出，OpenELM模型的性能明顯優於其他類似規模的SLM，OpenELM的一個突出特點是其非均勻結構，Transformer模型被設計為跨層和區塊具有相同的配置。雖然這使得架構更易於管理，但它導致模型無法有效地分配參數，與這些模型不同，OpenELM中的每個Transformer層都有不同的配置，例如注意力頭的數量和前饋網路的維度，這使得架構更加複雜，但使OpenELM能夠更好地利用可用的參數預算來獲得更高的精度。

OpenELM的主要特點是其資源效率，其原理原則是在給定有限的資源（例如記憶體和計算）的情況下獲得性能最佳的模型。

蘋果的設備端人工智慧策略

雖然蘋果不具備微軟或Google等超大規模企業的優勢，但在設備端推理方面，它確實具有優勢，蘋果對其設備的軟體和硬體擁有完全的控制權，因此，它可以為其處理器優化其模型，也可以為其模型優化下一代處理器，這就是為什麼Apple發布的每款型號都包含針對Apple優化的版本。

同時，開放這些模型將刺激研究人員的活動，這可以產生網路效應，使Apple設備在設備上AI方面具有優勢，吸引更多開發者為Apple生態系統創建SLM應用程式，並使Apple能夠更好地了解如何優化其下一代硬體和軟體。

但蘋果也將面臨其他公司的競爭，其中包括微軟，微軟在小語言模型上投入大量資金，並正在建立一個在設備和雲端無縫運行的人工智慧副駕駛生態系統，誰將成為生成式人工智慧市場的最終贏家，是否會出現與許多主導企業平行的市場，還有待觀察。

語言模型蔚為風潮 OECD打算端出什麼政策因應？｜專家論點【Howie Su】

Howie Su — Tue, 18 Jul 2023 01:00:00 +0000

作者：Howie Su（產業分析師）一場針對AI的監管風暴正鋪天蓋地而來 ChatGPT因其明顯的優勢而成為 …

作者：Howie Su（產業分析師）

一場針對AI的監管風暴正鋪天蓋地而來

ChatGPT因其明顯的優勢而成為琅琅上口的名字，與此同時，政府和其他監管機構正在採取措施來遏制潛在風險，由於人工智慧語言模型(LM) 是 ChatGPT 等廣泛使用的語言應用程序的核心，因此值得仔細探討該技術及其對社會的影響。從本質上來說，語言模型的應用相當多樣，包括文本生成、文本到語音轉換、語言翻譯、聊天機器人、虛擬助理和語音辨識等，它們讓電腦能夠處理並生成人類語言，同時使用從基於規則的方法到統計模型和深度學習等技術對大量數據進行訓練，不過問題在於，它們的內部如何運作對多數人而言是不透明的：社會對於它們如何在廣泛的工作中的運作模式、如何輸入到輸出的流程依舊是一頭霧水，這種「黑盒子」的做法引起不小騷動，「如何解釋其運作，以及會造成什麼潛在危害」就變成了當前管理人工智慧的重點，而OECD近期發布相關觀點，似乎能看出一些端倪。

人工智慧政策的正確制定有賴於完整框架支援。（資料來源：OECD）

政策制定者陷入良好政策環境將低科技風險的兩難

隨著個人和企業將語言模型整合到其日常營運中，社會大眾開始希望政策制定者需要確保這些變革能夠創新同時又確保安全性，OECD 在2019 年發布人工智慧原則時就指出，「AI在整個生命週期中應保持穩健、可靠和安全，以便在正常使用、可預見使用或誤用或其他不利條件下能夠正常運行，不會造成不合理的風險」。然而，三年後的現在，持續成長的的語言模型卻帶來相關的重大政策挑戰，許多語言模型使用不透明且複雜的神經網路，即使開發者對其內部運作原理以及如何達到特定產出有所了解，在持續的使用下卻也可能造成無法預測與約束的情況，政策制定者必須促使開發人員制定更嚴格風險控制方法和系統標準，以符合應用環境的安全。此外，由於語言模型是「生成式人工智慧」的一種形式，模型根據訓練數據的提示建立新內容，但訓練數據本身可以包括偏見、個人機密資訊與侵犯他人智財權的可能性，使得產出內容的真實性有所疑慮，甚至透過大規模生成假內容來造成真假難辨的「人工智慧幻覺」（AI Illusion）。

人工智慧的價值與原則必須被明確規範。（資料來源：OECD）

持續的研究有助於降低複雜語言模型風險

開發人員持續的研究與模型調整有助於理解這些複雜的模型並找到風險緩解危機的解決方案，對於許多語言來說，用於訓練模型的可讀文本的可用性依舊有限，最先進的特定語言模型僅使用主要語言，例如英文、中文、法語和西班牙語，少數民族語言國家則遭到遺忘，政策制定者正在促進多語言模型的開發，來促進包容性並避免未來造成文化霸凌。同時，包括政策制定者在內的利益相關者需開始透過合作來探討相關的新型的社會影響與科技風險，合作的形式是在區域和國際論壇上分享最佳實務與危害案例，並製定多語言數據和模型方面的聯合倡議。然而，企業與政府仍然需要製定可行的政策和技術解決方案，以有效降低語言模型和其他類型的生成人工智慧的風險，同時促進其有益的開發和採用，使人工智慧生態系統中的所有參與者都能夠在預防科技災害上扮演關鍵角色。

Meta新AI模型語音文字互轉範圍　涵蓋千種以上語言

進化者 — Tue, 23 May 2023 07:42:44 +0000

記者／陳士勳為了防止不少語言因語音辨識和語音生成技術局限而失傳的風險，Meta已宣稱開發出能擴展文字轉語音、 …

記者／陳士勳

為了防止不少語言因語音辨識和語音生成技術局限而失傳的風險，Meta已宣稱開發出能擴展文字轉語音、語音轉文字等技術應用範圍的大規模多語言語音模型（MSS），對比最初的100種語言，如今可轉換1100種以上語言，超越過往的10倍，同時還能辨識超過4000種口語語言，為過去40倍，成長幅度相當驚人。

Meta宣布推出能互轉千種以上語言的AI模型。示意圖：123RF

Meta表示，大型語音資料庫以往最多僅涵蓋100種語言，若想有所突破，得先蒐集數千種語言的語音訓練資料，並借助已翻譯成多種語言、譯文，且擁有多種語言公開錄音檔的「聖經」，為語言文字訓練資料。

Meta指出，藉由上述方法創造出累積超過1100種語言「新約聖經」的有聲讀物資料集，平均可為每種語言提供32小時的語音訓練資料，後續加入其他未標註的基督教有聲讀物後，可用的語言訓練資料，甚至涵蓋超過4000種語言，雖然資料集收錄聲音以男性居多，但測試成果顯示，無論男性或女性的聲音，該語音模型皆能準確地辨識。

Meta強調，所採用語言訓練資料大多雖為宗教相關內容，但分析結果評估模型不會傾向生成更多的宗教性質語言，何況現階段如VR（虛擬實境）、AR（擴增實境），或訊息服務，都能看見該技術的應用實例，因此，未來將持續擴大語音模型涵蓋語言範圍，藉此支援更多語言的轉換及辨識。

OpenAI為ChatGPT和其Whisper提供API

科技新知 — Fri, 03 Mar 2023 01:15:48 +0000

編譯／施毓萱 OpenAI現在允許第三方開發者透過API將ChatGPT整合到他們的應用程式或服務中，其優勢在 …

編譯／施毓萱

OpenAI現在允許第三方開發者透過API將ChatGPT整合到他們的應用程式或服務中，其優勢在於可以比使用其他語言模型還要便宜。除此之外，OpenAI正在開發人工智慧所驅動的語音到文本模型Whisper，並對其服務條款進行了一些重要修改。

雖然目前有幾家公司運用目的為聊天介面的建立，但ChatGPT API實際上不只有這個用途。OpenAI新的模型系列名為gpt-3.5-turbo，而這被認為是許多非聊天用例的最佳模型。微軟將這個模型稱為新的下一代OpenAI大型語言模型，而這個模型很可能不是Bing現在所使用的模型。據說新模型比ChatGPT和GPT-3.5更快狠準。

OpenAI新的模型系列名為gpt-3.5-turbo，而這被認為是許多非聊天用例的最佳模型。微軟將這個模型稱為新的下一代OpenAI大型語言模型，而這個模型很可能不是Bing現在所使用的模型。示意圖:RF123

接下來，OpenAI所推出的Whisper的新API語音到文本模型，可以用來轉錄或翻譯音頻。Whisper模型是開源的，所以用戶可以在自己的硬體上免費運作它。OpenAI基於開發者的回饋還宣布了一些政策變化。其中一個重要的變化是，除非客戶明確同意，否則它不會再使用API所提供的數據來訓練其模型。

這一變化將有助於減少用戶對輸入特定資訊的擔憂，目前已經有一些公司完全禁止員工使用這一技術。因為假設它從用戶的輸入的資訊中學習，那麼商業機密將會有很大的風險被透漏給其他人。

資料來源：The Verge

讓AI自主學習　Meta新訓練方法Toolformer解決痛點

科技新知 — Tue, 21 Feb 2023 06:36:27 +0000

記者／竹二在ChatGPT成為目前最熱門的科技話題後，AI模型的局限性，像是沒有最新的資料、會對事實產生「訊 …

記者／竹二

在ChatGPT成為目前最熱門的科技話題後，AI模型的局限性，像是沒有最新的資料、會對事實產生「訊息幻覺」、缺乏進行精確計算數學等問題，也開始令人注意，ChatGPT還在嘗試克服這些缺點，Meta卻已經用一篇新論文解套這些問題，這個方法被稱為「Toolformer」。

AI模型有局限性，Meta以Toolformer方法解套這些問題。（圖／示意圖：123RF）

根據Meta的說法，要解決AI模型的局限性，就是讓AI自己使用外部工具，意思就是，如果AI沒有最新資訊，那就讓它自己搜尋最新的資料，如果不會算術，就去找計算機。Toolformer這個方法也克服了先前讓AI使用外部工具的障礙，在產生文字的過程中，遇到特定字詞或是特殊需求，就會直接呼叫工具的API，叫出搜尋引擎或是計算機。

Toolformer在經過優化後，可以自主決定要使用哪些API，或是使用哪些參數來運算或是查詢，這個的學習過程被稱為「自我監督」，研究人員只要讓語言模型學習少量人工編寫的API呼叫範例，再讓語言模型去生成更多包含這些範例的資料庫。

訓練的過程分成三個步驟，首先是取樣，把輸入到語言模型的文字當中可能會需要哪些工具，直接把要呼叫API的指令插入句子。再來是執行API指令，並把產生的答案插入對應的部分。最後是過濾，若是第二步所生成的文字對整句話的意義不大的話，就直接剔除，只保留整句話原本所需要的資訊。

研究人員指出，使用API可以得到更精準的輸出結果，語言模型自身使用外部工具的能力也可以解決常有的問題。雖說Toolformer所展現出「自學」能力還是個雛形，但也顯示出語言模型發展的下一步，就是要訓練它們知道在什麼時間、要用什麼工具。

語言模型 – 科技島-掌握科技新聞、科技職場最新資訊

地表最快語言模型？蘋果新模型FS-DFM 實現長文本生成速度提升128倍

核心技術與優勢

訓練模型：

引入指導：

迭代優化：

卓越的效能表現

AI思考的迷霧：語言模型的推理幻覺與知識誤導｜專家論點【張瑞雄】

倒數Computex 2025 黃仁勳AI主題演講有望展示新語言模型超越GPT-4o

工研院打造台灣首座AI測試實驗室提供語言模型可信任評測

擁數據者得天下！中研院士孔祥重點出台灣轉型AI島2大關鍵

蘋果計劃透過小型語言模型推進未來AI策略｜專家論點【Abby Lin】

開放式、小型模型正受到矚目

什麼是 OpenELM？

蘋果的設備端人工智慧策略

語言模型蔚為風潮 OECD打算端出什麼政策因應？｜專家論點【Howie Su】

Meta新AI模型語音文字互轉範圍　涵蓋千種以上語言

OpenAI為ChatGPT和其Whisper提供API

讓AI自主學習　Meta新訓練方法Toolformer解決痛點

語言模型 – 科技島-掌握科技新聞、科技職場最新資訊

地表最快語言模型？蘋果新模型FS-DFM 實現長文本生成速度提升128倍

核心技術與優勢

訓練模型：

引入指導：

迭代優化：

卓越的效能表現

AI思考的迷霧：語言模型的推理幻覺與知識誤導｜專家論點【張瑞雄】

倒數Computex 2025 黃仁勳AI主題演講有望展示新語言模型超越GPT-4o

工研院打造台灣首座AI測試實驗室 提供語言模型可信任評測

擁數據者得天下！中研院士孔祥重點出台灣轉型AI島2大關鍵

蘋果計劃透過小型語言模型推進未來AI策略｜專家論點【Abby Lin】

開放式、小型模型正受到矚目

什麼是 OpenELM？

蘋果的設備端人工智慧策略

語言模型蔚為風潮 OECD打算端出什麼政策因應？｜專家論點【Howie Su】

Meta新AI模型語音文字互轉範圍 涵蓋千種以上語言

OpenAI為ChatGPT和其Whisper提供API

讓AI自主學習 Meta新訓練方法Toolformer解決痛點

工研院打造台灣首座AI測試實驗室提供語言模型可信任評測

Meta新AI模型語音文字互轉範圍　涵蓋千種以上語言

讓AI自主學習　Meta新訓練方法Toolformer解決痛點