日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习能诊断病情,还能预测患者出院后的情况?

發布時間:2023/12/31 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习能诊断病情,还能预测患者出院后的情况? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
摘要: 機器學習正逐漸改變著各行各業,醫療行業也處于變革之中。想不到機器學習不光能診斷患者病情,還能預測患者出院后的情況呢,這個研究方向有點意思,感興趣的讀者快來瞅瞅吧!
隨著數據量以及計算機性能的不斷提升,機器學習技術正逐漸滲透于各行各業中。計算機視覺、自然語言處理、機器人等領域基本上已經被機器學習算法壟斷,正逐步向教育、銀行、醫療等傳統行業擴張。關于機器學習如何改變傳統教育模式,可以參見博主的這篇文章《使用AR、AI以及大數據改革教育體系——為每位學生打造自己的私人定制學習路線》。銀行業目前對人工智能炒作成分居多,大多數銀行持觀望態度,短時間不會利用人工智能取代大部分銀行職員工作。醫療行業應用AI也比較火熱,比如利用AI檢測癌癥、驅動新藥發現引擎、基因檢測等。而膿毒癥(Sepsis)是一種醫療行業常見的并發癥,本文將使用機器學習預測膿毒癥患者的出院后情況。
膿毒癥是指因感染因素引起的全身炎癥反應綜合征,嚴重時可導致器官功能障礙或循環障礙,是嚴重創傷、燒傷、休克、感染和外科大手術等常見的并發癥,因為其癥狀和發燒、低血壓等其它常見疾病非常相像,很難被早期發現,如果不及時治療,可進一步發展為感染性休克,其住院死亡率超過40%,相當危險。
了解膿毒癥患者的最高死亡風險對臨床醫生的優先護理是有幫助的。團隊與Geisinger健康護理系統的研究人員合作,使用歷史電子健康記錄數據(EHR)建立模型來預測膿毒癥住院患者在住院期間或出院后90天的全因死亡率(all-cause mortality)。該模型可以指導醫療團隊為那些預測為高概率死亡的患者進行仔細監測,并采取有效預防措施。
數據科學環境
使用IBM數據科學經驗為數據科學家提供編程環境(三種流行編程語言:Python、Scala和R,兩種編程分析工具:Jupyter和Zeppelin),此外,IBM數據科學經驗通過業務應用程序實時或批量計分來操作模型,為連續模型檢測和再訓練集成反饋回路。
收集和預處理數據
Geisinger在2006年~2016年獲得了超過10000名確診為敗血癥的患者數據,這些數據包含人口統計學、住院和門診、外科手術、醫療史、藥物、醫院單位之間轉移以及實驗室結果等記錄。
對于每名患者,選擇最近的醫院和最相關的住院數據,包括住院期間具體的信息,比如手術類型、培養位置(細菌)等。此外,還導出了入院前的總結信息,比如住院前30天的外科手術次數等,沒有使用出院后的數據。圖1給出了這些基于時間數據的決策:
圖1 基于時間序列數據做預測
合并所提供的數據集后,得到的數據集包括10599行,其中每名患者有199個屬性(特征)。
預測模型
在數據清洗和特征選擇完成后,將任務目標定義為二分類問題:預測膿毒癥患者出院后90天內是否死亡。
選擇的算法為梯度提升樹(Gradient boosted trees, GBT),并通過XGBoost數據包實現。由于愛算法的良好的執行速度和魯棒性,一直是機器學習競賽中流行使用的算法。使用XGBoots另一個動機是微調超參數以提升模型性能的能力。在訓練數據中,使用十折交叉驗證(ten-fold cross-validation)和網格搜索(GridSearchCV)以迭代的方式選擇參數,以最大化ROC曲線下的面積(AUC)。IBM數據科學經驗中的一個實例在此可見。
將數據集分為訓練集和測試集,其中訓練集占60%,測試集占40%。使用訓練集訓練模型,將訓練好的模型參數應用于測試集上,模型性能如圖2所示:
圖2 XGBoost模型的性能
圖2中的一些數據是性能評價指標,比如AUC得分,這個數字越接近于1,則表示模型的能力越能正確的分類正預測(TP),從而減少假陽性。測試結果AUC數據為0.8561,表明模型能夠識別出絕大多數膿毒癥患者90天內是否死亡,如果預測為死亡,則這些患者可以進行適當的靶向治療。
對于精確率(precision)和召回率(recall),數字越接近于1,表明模型越精確。圖2中顯示的數據為接近于0.80,即贊成高召回率——目的是盡量減少該模型遺漏最終可能因膿毒癥死亡的患者數量。
對于另外的一個評價指標準確度(Accuracy),使用bootstrap對訓練和測試數據生成1000個變體,然后在這些數據上運行XGBoost模型,并獲得每次運行的模型準確率,1000次運行結果的準確度分布為0.77~0.79之間的概率為95%,這意味著建立的模型能夠識別出超過四分之三的真實結果。
除了以上評價指標外,模型的混淆矩陣(confusion matrix)如圖3所示。從圖中可以看到,對于測試數據,模型確定了1190例患者為真陽性(預測為死亡的膿毒癥患者死亡)和2087例患者為真陰性(預測為生存的膿毒癥患者存活)。
圖3 陰陽性預測
XGBoost還具有確定特征的能力,這種能力并不告知選擇的特征是否為死亡或生存的預測因子,但XGBoost生成的信息仍然非常有用,因為可以了解到哪些特征是用于預測死亡的。如圖4所示,29.5%的患者都使用“入院年齡”特征來預測死亡。
圖4 模型最重要的20個特征
對特征進一步的探索分析,以測試特征如何與死亡結果相對應。雖然上圖有助于可視化特征與結果的關系,更重要的是要了解XGBoost訓練多個決策樹的機制。因此,在探索過程中,XGBoost模型中的重要特征可能與這些結果變量沒有明顯關系。
如圖5所示,諸如“入院年齡”的特征可能表明老年患者相較于年輕患者而言具有更高的死亡比例,另一個例子“血管升壓藥使用時間”特征可能表明服用升壓藥的患者死亡率較高,但這些死亡也可能是由于其不好的健康狀況導致。
圖5 與患者死亡有關的一些重要特征
XGBoost輸出的決策樹規則可以幫助醫生進一步了解如何針對患者制定治療方案。比如,由于老年患者較高的死亡風險,醫療團隊可以特別關注老年患者,檢測所服用的血管升壓藥的持續時間、盡量減少患者在各科室之間轉移的次數以減少對易感染患者的影響等。
結論
預測膿毒癥患者的全因死亡可指導健康提供者主動監測并采取預防措施以提升患者的存活率。在本文模型中,選擇了那些被認為與膿毒癥患者死亡有關的重要特征,即機器學習模型可以幫助識別與膿毒癥死亡相關聯的變量。后續隨著數據量的增加,將添加一些更關鍵特征來改進模型,也可以將該方法應用于其它病癥的預測之中,希望產生一個更具可操作的模型,以改善醫療水平。
原文鏈接干貨好文,請關注掃描以下二維碼:


總結

以上是生活随笔為你收集整理的机器学习能诊断病情,还能预测患者出院后的情况?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。