OpenAI推出兩種「開放」AI 推理模型 gpt-oss 迎戰中國對手

記者鄧天心/綜合報導

OpenAI宣布推出兩款全新開源AI模型gpt-oss-120b及gpt-oss-20b,自五年前OpenAI發表GPT-2以來,該公司首度重返開放語言模型領域,這兩款模型已在Hugging Face上免費開放下載。

這次發布的兩個新模型,分別針對不同的應用需求,規模較大的gpt-oss-120b,擁有1,170億個參數,只需要一張Nvidia顯示卡即可執行;而輕量的gpt-oss-20b,則可以在一般配備16GB記憶體的筆記型電腦上運作,降低了使用門檻。

8c0537bf 41ef 4547 9952 c0a86e9717da
OpenAI時隔五年再釋出開放AI推理模型,挑戰中國對手。(圖/AI生成)

延伸閱讀:微軟最大對手來了!AWS開賣OpenAI AI模型 挑戰AI雲端龍頭

過往OpenAI開發策略較封閉,透過API向企業收費,如今再度開放,外界認為近年來中國的AI公司像DeepSeek、阿里巴巴等在開放AI領域發展很快,甚至領先Meta,面對競爭壓力,OpenAI執行長Sam Altman坦言,過去對於開放原始碼的策略「站錯了隊」,現在希望開放模型,加強與開發者和美國政府的合作。

在性能方面,OpenAI強調gpt-oss系列模型即便是開放版本,也已成為同類型中領先者,不過,這兩款開源模型在答題時出現「幻覺」的比例較高,在部分測試甚至高達五成,明顯高於OpenAI最新的商業模型。

在訓練技術上,OpenAI採用「專家混合」架構,配合強化學習,讓模型在效率和推理能力上有所升級。這些新模型很適合用於AI代理人,可連結工具搜尋資料或執行程式。不過,和OpenAI較新的商業模型不同,目前只支援文字,不可直接處理圖片或聲音。

為鼓勵廣泛應用,這兩款模型採用Apache 2.0開源授權,允許企業或個人在不需額外獲准的情況下商用,但與部分完全開放的對手相比,OpenAI並未公開完整訓練數據,以避免涉及版權爭議。

OpenAI曾因安全考量,多次延後模型釋出,內部和外部審查後認為,gpt-oss雖在某些生物領域的風險略有增加,但仍在可控範圍。

目前,AI產業競爭激烈,中國DeepSeek即將發表新一代AI推理模型,Meta的Superintelligence Lab也準備推出新開放權重模型,OpenAI此次回歸開放模式,無疑將再掀起一波AI產業競賽熱潮。

資料來源:cnbcTechCrunch

Loading

發佈留言

Back to top button