第18屆 CHITEC大會 | 醫(yī)渡科技聯(lián)合申報的數(shù)字醫(yī)療健康創(chuàng)新服務典型案例分享
2024-06-03
2024(18th) 中國衛(wèi)生信息技術/健康醫(yī)療大數(shù)據(jù)應用交流大會(2024 CHITEC)將于2024年7月5-7日在重慶舉辦。大會組織平行專題交流及成果與應用技術主題展,全面展示我國衛(wèi)生健康信息領域卓越實力和水平。
本屆大會上將發(fā)布第三屆CHITEC數(shù)字醫(yī)療健康創(chuàng)新服務典型案例征集結果。自案例征集活動啟動以來,得到全國各醫(yī)療衛(wèi)生機構、高等院校、科研院所的積極響應。
由煙臺毓璜頂醫(yī)院申報,醫(yī)渡科技旗下醫(yī)渡云聯(lián)合申報的“醫(yī)療大數(shù)據(jù)驅動的科研平臺建設及應用”案例入選數(shù)字醫(yī)療健康創(chuàng)新服務典型案例?,F(xiàn)與大家進行分享,促進交流合作。
案例名稱:
醫(yī)療大數(shù)據(jù)驅動的科研平臺建設及應用
主體申報單位:
煙臺毓璜頂醫(yī)院
聯(lián)合申報單位:
醫(yī)渡云(北京)技術有限公司
本文內容主要分成以下7個部分:
1、單位簡介
2、針對問題/應用場景
3、創(chuàng)新點
4、關鍵技術及其先進性
5、應用效果
6、社會效益(推廣性)
7、問題與展望
單位簡介
煙臺毓璜頂醫(yī)院始建于1890年,其前身是美國長老會創(chuàng)辦的教會醫(yī)院。經過130多年的發(fā)展,現(xiàn)已發(fā)展成為煙臺市最大的綜合性醫(yī)療保健中心、三級甲等綜合醫(yī)院、山東省區(qū)域醫(yī)療中心。
醫(yī)院設有50個臨床科室、18個醫(yī)技科室,其中有國家級重點學科1個,國家臨床重點???個,山東省臨床醫(yī)學研究中心1個,山東省臨床精品特色???個,山東省醫(yī)藥衛(wèi)生重點學科5個,省重點實驗室5個,山東省臨床重點???0個,山東省中醫(yī)藥重點???個。
2018年以來,獲國家自然科學基金38項,省級課題96項,發(fā)表SCI收錄論文1710篇,最高影響因子168.9分,醫(yī)院的整體科研實力和學術水平居國內地市級醫(yī)院前列。
醫(yī)院網(wǎng)絡信息管理處共33人,其中,博士生1人、研究生13人,本科生19人。分設系統(tǒng)運維組、網(wǎng)絡運維組、安全運維組、維修組。網(wǎng)絡信息管理處全面負責醫(yī)院信息化規(guī)劃、建設、管理維護工作,全面負責網(wǎng)絡安全建設及管理維護工作。
針對問題/應用場景
醫(yī)院經過長期的信息化建設,構建了相對完備的信息化系統(tǒng)。在各平臺的使用過程中,產生了大量的數(shù)據(jù),這些數(shù)據(jù)分散在幾十個甚至上百個臨床系統(tǒng)中。這些來自不同系統(tǒng)的數(shù)據(jù)之間是完全割裂的,或者只達到了部分聯(lián)通。
這些數(shù)據(jù)除了一些簡單的已經被結構化錄入的數(shù)據(jù)(如患者性別、檢查種類)外,還有大量數(shù)據(jù)在錄入系統(tǒng)時,采用的是非結構化方式輸入,如一訴五史、病程記錄、影像檢查報告等。這些非結構化信息往往是更具有臨床價值的信息。
如何能夠充分挖掘利用醫(yī)院積累的千百萬份病歷數(shù)據(jù)?
如何讓數(shù)據(jù)提供科研靈感?
如何把數(shù)據(jù)轉化為有價值、促學科發(fā)展的資產?
如何快速利用這些數(shù)據(jù),進行成果轉化,支持未來實現(xiàn)精準醫(yī)療?
“科研構思難、數(shù)據(jù)獲取難、想法驗證難、數(shù)據(jù)處理難”的傳統(tǒng)科研模式已無法實現(xiàn)以上問題,為推進信息標準化工作,促進標準的規(guī)范和實用,實現(xiàn)分散數(shù)據(jù)資源的集成和利用,實現(xiàn)醫(yī)院的大數(shù)據(jù)挖掘和利用,以及真正的知識庫和高級決策支持,基于大數(shù)據(jù)及人工智能技術進行臨床研究的新模式應運而生。
創(chuàng)新點
1. 層次醫(yī)療術語抽取技術
基于對病歷數(shù)據(jù)的理解,特別設計了一種基于多層次醫(yī)療術語抽取技術的醫(yī)學自然語言處理方法,以實現(xiàn)對病歷自由文本的語義分詞。通過機器學習技術與語義分詞的結合,可以持續(xù)完善分詞的準確度和精細度。這種模式可以替代傳統(tǒng)的數(shù)據(jù)摘抄模式,在提高數(shù)據(jù)獲取效率的同時,為科研提供了更廣泛的數(shù)據(jù)資源。
2. 在線統(tǒng)計建模
實現(xiàn)醫(yī)學統(tǒng)計算法的集成與嵌入,數(shù)據(jù)無需導出即可進行線上實時統(tǒng)計分析,結果快速可靠。除覆蓋比較均值分析、回歸分析、相關分析等基本統(tǒng)計分析算法外,還引入了高級挖掘算法,如:決策樹和主成分分析等。降低了科研統(tǒng)計專業(yè)的門檻,方便醫(yī)生隨時驗證研究想法,快速生成統(tǒng)計結果。
關鍵技術及其先進性
基于云計算及大數(shù)據(jù)技術,整體采用Hadoop 2.0技術框架及Spark并行計算框架,采用了應用與計算能力的架構設計,并采用了Docker封裝技術。 完成整個大數(shù)據(jù)平臺的數(shù)據(jù)處理工作,其具備的基礎功能有:OGG / CDC / ETL等技術、結構化、清洗歸一、數(shù)據(jù)挖掘、索引構建、機器學習等。
大數(shù)據(jù)平臺需要解決數(shù)據(jù)獲取、數(shù)據(jù)清洗等方面的工作,將醫(yī)院的醫(yī)療信息子系統(tǒng)的數(shù)據(jù)進行抽取、同步、匯集、結構化、映射到兼容國際國內醫(yī)療數(shù)據(jù)規(guī)范標準的全局標準、統(tǒng)一的數(shù)據(jù)結構平臺中,對字段信息清洗和語義歸一,為上層應用服務提供準確的基礎數(shù)據(jù)支撐和業(yè)務模型訓練。
將醫(yī)院各相關應用系統(tǒng)的數(shù)據(jù)庫作為數(shù)據(jù)源,通過ETL等工具進行數(shù)據(jù)的抽取同步清洗轉化,在此過程中,著重對患者的敏感信息進行處理,然后加載到醫(yī)院標準數(shù)據(jù)的Schema數(shù)據(jù)倉庫中,先做數(shù)據(jù)集中,然后進行清洗和關聯(lián)操作,這個過程參考HL7相關標準,建立臨床數(shù)據(jù)標準的數(shù)據(jù)集,數(shù)據(jù)加工的過程做“數(shù)據(jù)歸一處理”,形成面向應用的標準數(shù)據(jù)集。
另外,醫(yī)生在臨床工作中會記錄大量自然語言信息,非結構化數(shù)據(jù),這部分數(shù)據(jù)在既往是無法挖掘的。通過自然語義處理技術,結合醫(yī)療專業(yè)術語的語義結構,按照臨床專家的醫(yī)學邏輯,進行數(shù)據(jù)處理,將原始的自然語言表達分析處理為結構化的可用數(shù)據(jù),為后續(xù)的應用、挖掘、機器學習提供基礎數(shù)據(jù)支持。通過醫(yī)用術語的歸一和結構化處理后,再進行檢索時,一并獲取檢索結果。
應用效果
截至2024年03月,已入庫治理6大廠商,12個信息系統(tǒng)的臨床數(shù)據(jù)8000余萬條,包括800多萬份病人和超過600萬份病歷數(shù)據(jù)。形成數(shù)據(jù)治理規(guī)則3000余條,結構化數(shù)據(jù)指標2857個,數(shù)據(jù)質量核查規(guī)則1240個,基于此建立多病種疾病數(shù)據(jù)模型。
已支撐面向冠心病、耳鼻喉疾病、甲狀腺腫瘤、生殖遺傳病、乳腺疾病、泌尿系腫瘤、哮喘7個科研科室建立了專病數(shù)據(jù)庫,已有20余個研究模型成果轉化反哺臨床。
1. 建立醫(yī)院高質量數(shù)據(jù)資產
以疾病為單元,構建覆蓋患者全病程數(shù)據(jù)的科研數(shù)據(jù)庫,通過自然語言處理、機器學習等技術使多源異構的臨床數(shù)據(jù)變成滿足臨床研究細粒度要求、可直接用于臨床研究統(tǒng)計分析使用的結構化、標準化的高質量數(shù)據(jù),為醫(yī)院實現(xiàn)數(shù)據(jù)應用奠定堅實的研究級數(shù)據(jù)基礎。
2. 構建智能化臨床研究分析平臺
臨床研究平臺融合人工智能技術,實現(xiàn)復雜的患者檢索、靈活的項目管理、全面的數(shù)據(jù)質量管控、自動化數(shù)據(jù)清洗、高效的數(shù)據(jù)分析挖掘等功能,輔助醫(yī)生提高科研效率,降低臨床研究門檻,提升科研積極性。
3. 助力醫(yī)院成為數(shù)據(jù)驅動型醫(yī)院
通過歷史電子醫(yī)療數(shù)據(jù)和實時醫(yī)療數(shù)據(jù)的集成與治理,建設醫(yī)院特色的高質量專病數(shù)據(jù)資產庫,依托大數(shù)據(jù)平臺,充分挖掘醫(yī)院醫(yī)療大數(shù)據(jù),構建“臨床行為產生數(shù)據(jù),洞察數(shù)據(jù)輔助決策,反饋臨床行為”的數(shù)據(jù)驅動閉環(huán)流程,從而以數(shù)據(jù)的角度提高醫(yī)院臨床治療效果與臨床質量。
社會效益(推廣性)
通過建立科研專病數(shù)據(jù)庫,整合、加工院內符合標準的患者診療信息,實現(xiàn)臨床醫(yī)生對精準患者臨床全量數(shù)據(jù)的結構化存儲和管理,實現(xiàn)數(shù)據(jù)快速更新,高效復雜檢索,多項目管理等需求,確保數(shù)據(jù)質量,提高科研效率。
科研專病數(shù)據(jù)庫的建立對相關病種數(shù)據(jù)進行標準化描述、深度分析應用,為實現(xiàn)醫(yī)學大數(shù)據(jù)精準科研工作應用提供重要工具。
科研信息平臺應用的意義在于,科研課題與成果由以數(shù)量取勝逐漸轉變?yōu)閿?shù)量穩(wěn)定, 層次不斷攀升,高水平成果、論文、學術研究等大幅度提升, 體現(xiàn)出科技是第一生產力和“科技興醫(yī)、質量興院”的強大世態(tài), “數(shù)字化醫(yī)院管理、人性化醫(yī)療流程、高水平科技創(chuàng)新、低成本高效經營”的戰(zhàn)略目標逐步實現(xiàn)。
問題與展望
基于人工智能技術的科研專病數(shù)據(jù)庫建設,實現(xiàn)了數(shù)據(jù)的重復利用和價值提升,??萍膊£犃薪ㄔO的意義在于為疾病的早期預防和干預提供數(shù)據(jù)依據(jù),優(yōu)化個體化醫(yī)療決策和治療策略,推動臨床轉化和新療法研發(fā)。
因此,建立和維護一個全面、準確、實時更新的專病數(shù)據(jù)庫對于科研和臨床實踐非常重要。
通過整合和共享專病相關數(shù)據(jù),促進專病研究的進展,并為臨床醫(yī)生提供更好的決策支持。在技術的推動下,我們期待科研專病數(shù)據(jù)庫能夠更加全面、準確和智能,對我國疾病的預防、治療和管理產生深遠影響,為人類健康做出更大的貢獻。
本文為原創(chuàng)內容,僅供知識分享之目的,若存在侵權行為或疏漏,請與本平臺聯(lián)系,我們將及時處理。如需轉載請后臺留言,需征得本平臺同意且注明來源轉載。