微軟Copilot 程式設計實測   大輸ChatGPT

編譯/黃竣凱

外媒在根據四項嚴格評估標準對微軟的Copilot 進行了重新測試後,發現結果令人失望。 總體而言,儘管取得了所謂的進步,但它未能通過任何評估,相較之下,ChatGPT、Meta AI、Meta Llama 和 Google Gemini Advanced 等其他AI模型則取得了一些成功。

外沒進行實測發現,微軟Copilot 程式設計實測大輸ChatGPT。圖取自微軟

編寫 WordPress 外掛程式

當外媒要求 Copilot 編寫 WordPress 外掛程式時,相較於提供更全面輸出的 ChatGPT,Copilot 的程式碼包含嚴重缺陷,顯示缺乏對 WordPress 程式碼標準的了解。

  • 微軟Copilot:介面:足夠/功能:失敗
  • ChatGPT:介面:良好/功能:良好
  • Google Gemini Advanced:介面:良好/功能:失敗
  • Meta AI:介面:足夠/功能:失敗
  • Meta Llama:徹底失敗

更多新聞:比ChatGPT更強   使用微軟Copilot的7大理由

重寫字串函數

在此測試中,Copilot 嘗試重寫字串函數,並展示了一些錯誤檢查功能,但缺乏徹底的驗證,可能會導致未來的程式設計問題。相較之下,ChatGPT 的解決方案在確保嚴格的資料完整性方面表現更好。

  • 微軟Copilot:失敗
  • ChatGPT:成功
  • Google Gemini Advanced:失敗
  • Meta AI:失敗
  • Meta Llama:成功

發現惱人的錯誤

Copilot 未能識別出細微的程式碼問題,凸顯了其在複雜問題解決方面的局限性,甚至還叫外媒,「考慮向外掛程式開發人員或社群論壇尋求支援」,與 ChatGPT 對問題的敏銳把握形成鮮明對比。

  • 微軟Copilot:失敗
  • ChatGPT:成功
  • Google Gemini Advanced:失敗
  • Meta AI:成功
  • Meta Llama:失敗

編寫腳本

Copilot 無法產生涉及 Keyboard Maestro、AppleScript 和 Chrome API 的腳本,這凸顯了其在處理複雜、專業任務方面的缺陷令人失望。

  • 微軟Copilot:失敗
  • ChatGPT:成功
  • Google Gemini Advanced:成功
  • Meta AI:失敗
  • Meta Llama:失敗

4項測試的整體結果

  • 微軟Copilot:4 次中 0 次成功
  • Meta AI:4 次中有 1 次成功
  • Meta Llama:4 次中有 1 次成功
  • Google Gemini Advanced:4 次中有 1 次成功
  • ChatGPT:4 次成功

參考資料:zdnet

瀏覽 320 次

覺得不錯的話就分享出去吧!

發佈留言

Back to top button