科技浪|Grok 3真的是地表最强AI?微軟重磅發表首個拓撲量子晶片!量子電腦時間軸真的大幅提前了嗎?
在本集的科技浪中,將會先和各位分享一起價值14億美元的加密貨幣交易所駭客事件,儘管金額巨大,但受影響的交易所成功處理了大量的提款請求,展現了其穩健性。接著,節目聚焦於兩個主要的科技新聞:Elon Musk的xAI公司發布了Grok 3模型,主持人分析了其在基準測試和實際應用中的表現,並對其相對較少的人類反饋強化學習(RLHF)導致其較為「口無遮攔」的特性進行了討論。
最後,節目深入介紹了微軟最新發表的拓撲量子晶片Mariana One,解釋了拓撲量子電腦的原理及其潛在優勢,但也對微軟的一些說法提出了質疑,同時表達了對量子電腦未來發展的樂觀展望。
本集節目亮點整理:
- Grok 3 Base Model (基礎模型):
這項xAI 位於田納西州的Cossus資料中心訓練的基礎模型,使用了比 Grok 2多10到15倍的算力,其基準測試在數學、科學 (GPQA) 和程式設計相關 (如 AIM-124、GPQA、coding tests) 中,Grok 3 Base model 的分數是目前所有 Base model 中最高的。
- Grok 3 Reasoning Model (推理模型):
這類模型在回答問題前會先花時間思考,且具備不同的思考模式,例如一般的 “thinking” 和思考時間較長的 “big Brain”。主持人的個人測試經驗認為,Grok 3 mini reasoning 的實際表現與 O3mini-high 屬於同等級,有時可能更強,且兩者都比 Claude 3.5 Sonnet 稍強
- Grok 3 Deep Search (Agent 功能):
是個類似於 OpenAI Deep Research、Google 和 Perplexity 的研究代理功能,使用者給定一個研究主題,它能上網查找相關資料、閱讀、深入挖掘並分析,最終提供一份研究報告
瀏覽 226 次