書名: 醫療健康人工智能應用案例集作者名: 張學高 胡建平本章字數: 2389字更新時間: 2021-12-17 23:13:44
(二)利用人工智能和多源數據進行傳染病預測和慢性病危險因素篩查
應用單位:重慶市衛生健康統計信息中心、重慶市疾病預防控制中心
涉及科室:呼吸內科、傳染科
疾病種類:流感、手足口病、慢性阻塞性肺疾病
案例簡介:本申報案例應用于城市高發傳染病提前防控及慢性病及時預防,涉及的主要病種為流感、手足口病、慢性阻塞性肺疾病,涉及的醫療科室為呼吸內科、傳染科。本案例打造的疾病預測防控體系,利用“互聯網+醫療健康”大數據前沿技術,提出“宏觀+微觀”的深度智能疾病預測方法。預測模型的基本原理可以分為三個部分:一是篩選、收集流感疫情相關的宏觀和微觀數據。二是開發人工智能融合模型,該模型不僅融合了傳染病預測的經典方法——時間序列模型,而且融合了多種人工智能方法,如隨機森林模型和循環神經網絡模型。三是運用模型得到傳染病相關指標。流感預測模型自2018年起上線應用,與傳統流感監測模型相比,該模型可以提前一周預測流感指標,準確率達90%以上,成為國內首個上線的實測傳染病預測模型。本案例在實施前積累了超過2 000萬份城市級健康檔案數據以及2012年至今的天氣、百度指數、哨點醫院監測的ILI%(流感樣病例百分比)、流感病歷以及微博輿情等數據;案例實施后持續積累天氣、百度指數、哨點醫院監測的ILI%、流感病歷等數據。同時,本案例根據疾病防控的實際業務需求研發傳染病預測系統,支撐傳染病預測的落地應用,可指導民眾進行疾病預防,對重慶市衛生健康相關部門和公眾起到預警的作用,助力政府部門在相關的疾病防控工作中提升效率,從而降低疾病預防和控制成本。
1.案例背景
目前機構實際采用的傳染病疫情預防預警系統,包括流感預防預警系統,主要依賴傳統監測手段。本案例通過與各級醫療機構、疾病預防控制中心和傳染病監測哨點醫院協作,由醫療機構診斷并報告臨床診斷病例和確診病例,研究人員基于該系統報告的信息及自行獲取的氣象等數據,建立疾病預測模型。這種“定時抽樣,每周匯總”的數據獲取方式,存在數據結果相對滯后、人力物力耗費量大、監測與上報過程煩瑣、數據來源單一、無其他來源數據比對修正的問題。
在慢性病預防上,目前對于重大慢性疾病的控制工作仍主要集中在發病后的長期隨訪、干預,較缺少事先的預防機制。在篩查中,由于面向的人群有一定局限性,可能存在很大一部分患者不知曉患病的情況,因而缺乏及時有效的防控措施。隨著我國人口老齡化進程加快,諸如惡性腫瘤、糖尿病等慢性病多發,加大了政府衛生費用支出和醫療財政負擔。
因此,精準、高效的疾病預測防控體系可顯著提高政府疾病控制水平,大幅減少醫療財政負擔(圖3-3)。

圖3-3 案例背景
2.案例亮點
本案例利用“互聯網+醫療健康”大數據前沿技術,提出“宏觀+微觀”的疾病預測方法,基于全面的影響因子收集、多種維度的模型建立,將一系列互聯網機器學習算法應用于疾病預測。不僅應用宏觀層面的數據學習歷史經驗,還從微觀層面精確評估個體風險,再匯總到宏觀層面,使疾病預測能夠達到時效性更強、精度更高、范圍更廣、輸出更穩定、可擴展性更強的要求(圖3-4)。

圖3-4 案例亮點
通過整合全國上百個城市的環境氣象因子(環境、天氣、季節),人口信息(人口、流動、結構),產業結構,經濟教育發展,地區生活行為,醫療習慣,就診行為等一系列宏觀因子,嘗試對歷史數據進行挖掘,進行時間序列分析。
在個人層面,通過整合全方位、多維度的預測因子和信息來預測疾病發生風險。這些信息包括信息高度相關,但頻度較低、分布較稀疏的醫療健康因子(體檢、就診、告知等),也包括信息間接相關,但信息頻度和深度較高的個人行為因子(財務、職業、生活等)和互聯網數據因子(輿情、行為、LBS等)等。通過精準評估個人層面風險并匯總到宏觀層面,能夠深入挖掘宏觀層面無法統計的細顆粒度的信息,從而提升預測精度。
本案例的算法融合了多種人工智能方法,如時間序列模型、循環神經網絡、梯度提升決策樹、隨機森林等,提高了預測準確度。
除模型研發外,本案例基于疾病防控的實際業務需求研發了傳染病預測系統。自2018年3月在重慶地區上線使用,該系統實現了對下周流感ILI%的預測。疾病預測系統的問題修復及反饋機制包含兩部分:數據質量自查與人工反饋。在使用多維度海量數據進行預測時,考慮到可能出現的數據質量參差不齊的情況,醫院引入了數據異常檢測模型。通過對導入的數據進行自動檢測、異常數據點自動識別與標注,再交由疾控專家進行判定。其檢測結果能夠持續優化模型,保證海量數據的質量和真實性。疾控工作人員上傳哨點醫院數據后,系統可調用異常檢測模型對數據進行異常判斷(如數據維持在定值,異常高/低等)。
此外,疾病預測系統中還有用戶反饋收集入口,預測完成后,疾控中心專家可將專家經驗或解讀上傳至系統,專家意見將反饋至模型進行學習和迭代。通過不斷收集反饋、融合疾控專家經驗,模型也在不斷進行優化。
3.應用成效
本項目為業內先進的“AI+”大數據流感/手足口病預測模型及慢阻肺危險因素篩查模型,流感/手足口病模型準確率達90%以上;慢阻肺篩查模型準確率達92%。同時本項目根據疾病防控業務需求,完成疾病預測系統(PC端+移動端)開發并順利上線,支撐疾病預測項目落地應用。項目病預測論文《自適應AI模型與多源數據在重慶流感預測中的應用》( Forecasting Influenza Activity Using Self- Adaptive AI Model and Multi- Source Data in Chongqing, China) 2019 年 9 月刊登在頂級醫學雜志《柳葉刀》( The Lancet)子刊 EBioMedicine上。
4.專家點評
重慶市疾病預測項目專家指出:“在數據層面,本次模型的建立應用了城市級數據,使用超過2 000萬份健康檔案及電子病歷數據,在國際范圍內尚屬首次;在方法層面,整合上萬維度數據因子進行建模,應用先進的人工智能和大數據技術,同時結合本地疾病防控實際業務經驗和專家知識,更貼近重慶現狀,精確度也顯著高于傳統方法。專家一致認為,本次疾病預測項目目前取得的研究成果在全國乃至國際范圍內都具有實用性和開創性,可助力更多城市在相關疾病的防控工作中提升效率,降低預防和控制成本。”