人類輸了？哈佛研究「AI急診判斷」準確度竟比醫師高

2026-05-04

記者許若茵／編譯

一項哈佛大學最新研究顯示，AI人工智慧模型在診斷急診患者時，準確度竟優於人類醫師。不過有醫師認為，AI診斷仍缺乏責任歸屬。

35684165 — 一項哈佛大學最新研究顯示，AI人工智慧模型在診斷急診患者時，準確度竟優於人類醫師。（圖／AI生成）

一項新研究探討大型語言模型在多種醫療情境下的表現，包括真實急診案例，其中至少有一個模型在診斷準確度上優於人類醫師。該研究本週發表於Science，由哈佛醫學院與Beth Israel Deaconess Medical Center的醫師與電腦科學家組成的團隊主導。研究人員表示，他們進行多項實驗，比較Open AI模型與人類醫師的表現。

在其中一項實驗中，研究人員聚焦76名進入Beth Israel急診室的患者，將兩名內科主治醫師的診斷結果，與Open AI的o1與4o模型所生成的診斷進行比較。這些診斷再由另外兩名主治醫師評估，且評估者並不知道診斷來源是人類或AI。

更多科技工作請上科技專區：https://techplus.1111.com.tw/

研究指出，在每個診斷節點中，o1的表現與兩名主治醫師及4o模型相比，要麼略優，要麼相當。差異在初始急診分診階段最為明顯，此時可用資訊最少，且需要迅速做出正確判斷。

哈佛醫學院的新聞稿強調，研究並未對資料進行任何預處理，AI模型接收的資訊與當時電子病歷中的內容完全相同。在這樣的條件下，o1模型在67%的分診案例中提供「完全或非常接近的診斷」，而兩名醫師的準確率分別為55%與50%。

研究共同作者之一、哈佛醫學院AI實驗室負責人Arjun Manrai表示，他們幾乎以所有基準測試該AI模型，其表現超越過去模型與醫師基準。不過研究並未主張AI已準備好在急診室做出生死決策，而是指出這些結果顯示，有迫切需要進行前瞻性試驗，以評估這些技術在真實醫療環境中的應用。

科技社群討論區：https://pei.com.tw/feed/c/tech-plus

研究人員也指出，本研究僅分析模型在文字資訊下的表現，而現有研究顯示，當涉及非文字輸入時，現有模型的推理能力仍有限。Beth Israel醫師、研究共同作者Adam Rodman接受媒體訪問時表示，目前對AI診斷仍缺乏正式的責任歸屬框架，且病患仍希望由人類引導其面對生死與複雜治療決策。

急診醫師Kristen Panthagani則指出，這是一項有趣但被過度誇大的研究，因為比較對象是內科醫師，而非急診專科醫師。她表示，如果要比較AI與醫師的臨床能力，應該與實際從事該專科的醫師進行比較。她也強調，急診醫師在初次接觸病患時，主要目標並非立即猜出最終診斷，而是判斷是否存在可能致命的狀況。

資料來源：techcrunch

標籤

2026-05-04

人類輸了？哈佛研究「AI急診判斷」準確度竟比醫師高

推薦工作

發佈留言取消回覆

數發部免費AI算力服務開放申請新增Gemma 4等多種最新模型

地表最強內顯要來了？！英特爾聯手輝達打造最強晶片傳2028強勢登場

不想天天吃雞蛋！七種高蛋白早餐「營養又有飽足感」

Siri AI升級恐加劇記憶體吃緊三星、SK海力士可望成最大受惠者

氣候危機衝擊！18億兒童遭受乾旱威脅 2.42億學童因天災中斷教育

最新科技新聞快訊不錯過!!

推薦工作

延伸閱讀

數發部免費AI算力服務開放申請 新增Gemma 4等多種最新模型

不想天天吃雞蛋！七種高蛋白早餐「營養又有飽足感」

Siri AI升級恐加劇記憶體吃緊 三星、SK海力士可望成最大受惠者

氣候危機衝擊！18億兒童遭受乾旱威脅 2.42億學童因天災中斷教育

傳華為Mate 90將搭載新一代麒麟晶片 晶體密度有望接近台積電3奈米

企業搶攻AI搜尋曝光！消費者卻不完全信任 網路比10年前更不人性化

發佈留言 取消回覆

數發部免費AI算力服務開放申請新增Gemma 4等多種最新模型

Siri AI升級恐加劇記憶體吃緊三星、SK海力士可望成最大受惠者

傳華為Mate 90將搭載新一代麒麟晶片晶體密度有望接近台積電3奈米

企業搶攻AI搜尋曝光！消費者卻不完全信任網路比10年前更不人性化

發佈留言取消回覆