如何分析临床大数据
隨著行政數據庫和患者登記注冊數據庫的有如雨后春筍般地出現,研究人員越來越容易獲得大數據。這些數據集的大樣本量使對罕見結果的研究更加容易,并提供了確定國家估算值和地區差異的潛力。因此,JAMA外科編輯和審稿人已經收到使用大數據去試圖回答臨床和政策相關問題的稿件。但是,沒有數據庫完全沒有偏倚和測量誤差的。對于更大的數據,一些隨機現象也可能產生統計學差異的結果,并且由于窄的置信區間,統計推斷也可能產生一個精確但是不準確的結果。上述問題在所有臨床研究都會遇到,但是在大樣本、復雜數據庫中,這些方法學的問題將被放大。
關于研究人群的注意事項
對讀者而言,重要的是要了解研究者是如何得到研究人群。通常,它根據納入標準從一個非常龐大的源來源人群篩選得到。統計報告時,應當清楚地描述納入和排除參與者的流程圖,其中要寫出包括排除的人數和排除原因。同樣,如果研究是縱向研究,應報告失訪現象和失訪人數,這樣有助于讀者理解該研究可能存在著選擇偏倚。
關于研究方法和樣本量注意事項
研究的目的和結局指標應在數據收集和分析之前確定。如果作者正在尋找兩組人群之間某些變量的差異,則該差異及其置信區間的統計分析也應預先計劃。除了統計結果(例如回歸系數,P值)外,效應值的差異應報告以患者為中心、具有臨床意義且可解釋的差異。不幸的是,在沒有預先計劃的情況下挖掘大型數據集會導致無意的、常常是錯誤的結論。統計學差異(P值)與樣本量有關,并且如果樣本量足夠大,則各組之間的即使差異很小,也會顯示統計學上的差異來(P<0.05),然而這些差異很可能在臨床上沒有意義。
文章剩余內容<<<<
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
- 上一篇: 为何ChatGPT的计算能力有限制?
- 下一篇: 一文搞懂临床研究常见类型