日前宣佈的 Open Health Natural Language Processing Consortium,將以大規模資料彙總 (data aggregation) 技術為重點,希望能協助醫生從自身專業的醫療記錄中進行探勘,在面對難以診斷之案例或決定療法時,有類似的案例可供參考。
IBM 與 Mayo 表示,醫生雖然可以瀏覽其他醫師對其他類似案例的記錄,不過資料庫中不會出現可資辨識的患者個人資訊。
根據 IBM 的說法,該聯盟希望 NLP 的發展能加速電子病例 (electronic medical records,EMR) 在全球醫療系統的普及化。在 IBM 與 Mayo 推出的新網站 www.ohnlp.org 上,開放源碼開發者將可存取該聯盟提供的工具。
隨著該聯盟的成立,IBM 與 Mayo 以開放源碼授權釋出兩項專案,分別以臨床記錄 (clinical note) 與病理報告 (pathology report) 為重點。該聯盟採用的開放源碼授權為 Apache License 2.0 版。
兩大組織也邀請各方加入開發 NLP 工具。Mayo Clinic 生物資訊專家也是該專案的資深顧問 Christopher Chute 博士表示,藉由發起開放源碼計畫,他們希望這些 NLP 工具的廣泛運用,能進一步加速醫療發展。
NLP 是電腦科學中一項專業領域,能夠用來搜尋並檢索患者與臨床醫師的互動資訊。藉由成熟實現的 NLP 技術,醫生可以在 EMR 中輸入搜尋字詞,取得協助診斷病患症狀所需的確切資訊,而無須翻查大量紙本記錄或難以處理的電腦檔案。
這兩大組織表示,當越來越多醫療提供者採用 EMR,如何搜尋這些病例將越來越重要。Mayo 與 IBM 已發展出可從 2 千 5 百萬份臨床文字記錄中擷取資訊的系統,該系統以 IBM 的開放源碼 UIMA (Unstructured Information Management Architecture) 為基礎。
IBM 表示,主要的想法是醫生不用僅仰賴自己的臨床經驗就下判斷。他們可以參考患者病例、病例研究與最新資訊,換句話說,他們可以跟其他醫師交換意見,好做出更適當的診斷。
醫療資訊專家也是該專案的 Mayo 領導人 Guergana Savova 指出,從臨床文件中進行大規模資訊擷取,乃是推動轉譯研究 (translational research) 與病患照護的關鍵元件。此一技術能解放存在巨型倉儲中的臨床文字資料,達成大規模資料彙總、分析與應用,想像一下數百萬病患資料帶來的力量。
IBM 與 Mayo 表示,Seattle Group Health 與美國退伍軍人事務部 (U.S. Department of Veterans Affairs) Boston Healthcare System 兩大醫療組織,計畫參與此一聯盟,他們也歡迎其他各方加入。
IBM 全球醫療與生活事業群總經理 Dan Pelino 指出,病患資料隱私的安全風險一直是 EMR 全面互通性的一大阻礙。他認為,標準有助我們建構安全、保障隱私的架構。當你建構基於標準的資訊交換協定,就能發展實務技能以確保一定程度的隱私性。Pelino 表示,IBM 與 Mayo 對開放源碼發展的推動,希望有助 IT 社群正視開放源碼在醫療軟體開發中的角色。
相關網址:
1.IBM、Mayo Clinic 向開放源碼開發者公開醫療資料計畫
2.IBM、Mayo 成立開放源碼醫療 IT 聯盟
3.Mayo、IBM 冀望開放源碼推動 EMR 擷取計畫