AI革命來了!NASA 推出智慧標籤系統 助科學資料更快搜尋

記者林育如/編譯

美國太空總署(NASA)近日宣布,成功開發出一套先進的人工智慧系統,能自動為科學數據標註精準且標準化的關鍵詞,大幅提升科學資料的搜尋與管理效率。這項技術由NASA馬歇爾太空飛行中心資料科學與資訊辦公室(ODSI)研發,名為「全球變遷主目錄關鍵詞推薦系統」(GCMD Keyword Recommender,簡稱GKR),專門協助資料提供者與管理者自動分配合適的描述標籤。

2 8
NASA成功開發出一套先進的人工智慧系統,大幅提升科學資料的搜尋與管理效率。(圖/AI生成)

過去,科學資料因缺乏統一的描述語言,常讓研究人員在浩瀚資料中難以快速找到所需數據。NASA早在多年以前便建立了「全球變遷主目錄」(GCMD)標準詞彙,協助科學家以一致且可搜尋的方式標記資料。然而,隨著科學領域不斷演進,資料種類與數量激增,維持元資料的組織與可發現性成為更大挑戰。

為此,GKR運用最新的人工智慧技術,結合INDUS大型語言模型,能理解科學文本上下文,從超過3200個標準關鍵詞中,為每筆資料精準推薦多重標籤。INDUS模型訓練涵蓋超過660億字的跨領域科學文獻,涵蓋地球科學、生物科學、天文學等,讓GKR不僅依賴字面相似度,而是深入理解詞彙在不同科學領域中的專業意義。

延伸閱讀:
天文學家疑似發現第三個星際天體 進入太陽系內部軌道
中國兩衛星高軌「合體」 再利用太空技術領先美國
機場雷達信號外洩或成外星智慧生命尋找地球的線索
NASA火星樣本返回任務面臨挑戰 私企提出30億美元替代方案

此外,GKR採用先進的「焦點損失」技術,有效解決關鍵詞出現頻率不均的問題,使系統在標註罕見且專業的詞彙時表現更佳,滿足專家尋找利基資料的需求。新版GKR的訓練資料量也大幅提升,從早期的約2000筆元資料增加至超過43000筆,讓推薦結果更準確可靠。

這套系統已成為NASA地球資料搜尋服務的核心技術之一,確保來自全球衛星與儀器的龐大觀測資料不會淹沒於資訊海洋中,而是能被研究人員、學生及公眾迅速找到並加以利用。未來,INDUS語言模型也將支援更多NASA科學任務,推動資料科學、人工智慧在太空探索及地球觀測領域的創新應用。

NASA科學任務總署科學資料長辦公室資助此項技術,持續推動科學資料的創新管理與智慧應用,助力全球科學社群加速發現與突破。

資料來源:NASA

瀏覽 299 次

發佈留言

Back to top button