人類輸了?哈佛研究「AI急診判斷」準確度竟比醫師高

記者許若茵/編譯

一項哈佛大學最新研究顯示,AI人工智慧模型在診斷急診患者時,準確度竟優於人類醫師。不過有醫師認為,AI診斷仍缺乏責任歸屬。

35684165
一項哈佛大學最新研究顯示,AI人工智慧模型在診斷急診患者時,準確度竟優於人類醫師。(圖/AI生成)

一項新研究探討大型語言模型在多種醫療情境下的表現,包括真實急診案例,其中至少有一個模型在診斷準確度上優於人類醫師。該研究本週發表於Science,由哈佛醫學院與Beth Israel Deaconess Medical Center的醫師與電腦科學家組成的團隊主導。研究人員表示,他們進行多項實驗,比較Open AI模型與人類醫師的表現。

在其中一項實驗中,研究人員聚焦76名進入Beth Israel急診室的患者,將兩名內科主治醫師的診斷結果,與Open AI的o1與4o模型所生成的診斷進行比較。這些診斷再由另外兩名主治醫師評估,且評估者並不知道診斷來源是人類或AI。

更多科技工作請上科技專區:https://techplus.1111.com.tw/

研究指出,在每個診斷節點中,o1的表現與兩名主治醫師及4o模型相比,要麼略優,要麼相當。差異在初始急診分診階段最為明顯,此時可用資訊最少,且需要迅速做出正確判斷。

哈佛醫學院的新聞稿強調,研究並未對資料進行任何預處理,AI模型接收的資訊與當時電子病歷中的內容完全相同。在這樣的條件下,o1模型在67%的分診案例中提供「完全或非常接近的診斷」,而兩名醫師的準確率分別為55%與50%。

研究共同作者之一、哈佛醫學院AI實驗室負責人Arjun Manrai表示,他們幾乎以所有基準測試該AI模型,其表現超越過去模型與醫師基準。不過研究並未主張AI已準備好在急診室做出生死決策,而是指出這些結果顯示,有迫切需要進行前瞻性試驗,以評估這些技術在真實醫療環境中的應用。

科技社群討論區:https://pei.com.tw/feed/c/tech-plus

研究人員也指出,本研究僅分析模型在文字資訊下的表現,而現有研究顯示,當涉及非文字輸入時,現有模型的推理能力仍有限。Beth Israel醫師、研究共同作者Adam Rodman接受媒體訪問時表示,目前對AI診斷仍缺乏正式的責任歸屬框架,且病患仍希望由人類引導其面對生死與複雜治療決策。

急診醫師Kristen Panthagani則指出,這是一項有趣但被過度誇大的研究,因為比較對象是內科醫師,而非急診專科醫師。她表示,如果要比較AI與醫師的臨床能力,應該與實際從事該專科的醫師進行比較。她也強調,急診醫師在初次接觸病患時,主要目標並非立即猜出最終診斷,而是判斷是否存在可能致命的狀況。

資料來源:techcrunch

Loading

在 Google News 上追蹤我們

發佈留言

Back to top button