微軟首次公開自家AI雙模型 支援Copilot生態挑戰OpenAI
記者鄧天心/綜合報導
微軟於2025年8月28日正式發佈了兩款自家設計的AI模型,MAI-Voice-1語音生成模型與MAI-1-preview文字生成模型。MAI-Voice-1是微軟首度推出的自然語音生成模型,可於單張GPU上在1秒內生成1分鐘的音訊,該模型已整合於Copilot Daily與Podcast功能,用於AI語音播報新聞及產生podcast內容,用戶也可於Copilot Labs實驗性體驗此語音模型,並調整聲音和語調。
MAI-1-preview則是微軟首個真正由頭到尾自主訓練的基礎大語言模型,主打高效率與運算資源最佳化,其訓練約使用了15,000顆Nvidia H100 GPU,遠低於xAI的Grok等同類模型所需的晶片數(GroK超過10萬顆),MAI-1-preview採用Mixture-of-Experts(專家混合)架構,在特定情境下啟動部分參數,能有效降低運算負載,目前該模型已開放於LMArena作為公開評測平台,未來幾週中將陸續整合進Copilot,新增更多文字相關的智慧功能。

延伸閱讀:
史丹佛研究:這3個職業最受到AI影響 年輕人就業率下降13%
在CNBC和The Verge等來源中亦提到,這次的發佈為微軟AI部門(由Mustafa Suleyman領導)展現出強烈減少對OpenAI依賴、建立自有AI技術生態系的意圖,Suleyman本人亦曾強調模型訓練關鍵在於精準資料挑選和效能極大化,而不只是單純堆疊算力。
多方報導均指出,微軟將繼續維持與OpenAI的合作,但目前正積極推動自主模型開發,未來將於Azure、Bing、Windows和Office等自家產品系統上部署這些AI能力。這些動作反映出全球AI產業由單一通用模型,逐步轉向針對多元場景開發專用型模型的產業趨勢,勢必加劇產業間的競爭格局。