日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

语言nomogram校准曲线图_R语言实现Cox模型校准度曲线绘制

發(fā)布時(shí)間:2023/12/10 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 语言nomogram校准曲线图_R语言实现Cox模型校准度曲线绘制 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

01

研究背景

? ? ? ?這是關(guān)于cox模型的第二篇文章,上一篇文章分享了運(yùn)用Lasso回歸如何篩選變量,將篩選后的變量繪制Nomogram圖,本章分享構(gòu)建模型后,如何繪制校準(zhǔn)曲線。

? ? ? cox模型的驗(yàn)證不同于Logistic回歸,cox的結(jié)局包括時(shí)間和狀態(tài),所以對(duì)于某個(gè)患者來說,他的結(jié)果是否準(zhǔn)確,就要看模型在他隨訪的時(shí)間點(diǎn),所預(yù)測(cè)的結(jié)局是否和真實(shí)的狀態(tài)一致,兩者一致說明擬合不錯(cuò),模型準(zhǔn)確。雖然大部分患者的患者的隨訪時(shí)間都不一樣,但對(duì)于生存分析來說,我們更關(guān)注一段時(shí)間在群體中的效應(yīng),比如1年生存率、3年生存率和5年生存率,以及中位生存率。換句話說,在評(píng)價(jià)手術(shù)后或者藥物治療后的效果時(shí),更關(guān)注某一段時(shí)間后的平均療效。

02

案例研究

? ? ? ?本文數(shù)據(jù)采用R自帶的lung數(shù)據(jù)集,一個(gè)晚期肺癌數(shù)據(jù)集,收集了228例癌癥患者的生存資料,包含患者年齡、性別、生存時(shí)間、生存狀態(tài)等10個(gè)變量。本文利用年齡、性別和ecog評(píng)分三個(gè)變量構(gòu)建模型,繪制列線圖并繪制指定時(shí)間點(diǎn)的校準(zhǔn)曲線。

臨床研究一般有提供多個(gè)危險(xiǎn)因素,首先做單因素的篩選,具體篩選方法,見公眾號(hào)之前的文章。詳細(xì)Nomogram圖繪制見之前文章,本章詳細(xì)說明校準(zhǔn)曲線的繪制和參數(shù)說明,采用驗(yàn)證的方法是基于原始數(shù)據(jù)集的重抽樣驗(yàn)證。

03

R代碼及解讀

##加載包?明確每個(gè)包的作用library(rms) ##繪制列線圖library(survival)??##生存分析包##調(diào)用數(shù)據(jù),數(shù)據(jù)格式與普通的spss中格式一樣,一行代表一條觀測(cè), ##一列代表一個(gè)變量;data(lung)d str(d)aggr(d,prop=T,numbers=T) #判斷數(shù)據(jù)缺失情況,紅色表示有缺失。d ?str(dt)??##查看每個(gè)變量結(jié)構(gòu)?aggr(dt,prop=T,numbers=T) #判斷數(shù)據(jù)缺失情況,紅色表示有缺失。 d?

? ? ? 由圖片可看到所有變量都為藍(lán)色,沒有缺失值,紅色表示有缺失,并展示出缺失比例。如果用na.omit()函數(shù)按照行刪除。

? ? ? ? 第一步,數(shù)據(jù)整理。

###添加變量標(biāo)簽,在列線圖上展示分類標(biāo)簽,作圖用到d$sex ##########################################################################d[,6] ##結(jié)局變量轉(zhuǎn)換d$status str(d)##可以查看數(shù)據(jù)結(jié)構(gòu)

? ? ? ? 第二步:構(gòu)建模型并繪制列線圖

ddoptions(datadist='dd') #設(shè)置工作環(huán)境變量,將數(shù)據(jù)整合##coxm?###繪制cox回歸生存概率的nomogram圖##?構(gòu)建Nomo圖的對(duì)象只能是rms保重d額cph()函數(shù)nom???????????????????????????????function(x)surv(2*365,x)),?##算出不同時(shí)間節(jié)點(diǎn)生存率值,顯示在列線圖上 funlabel = c('1-year probability', '2-year probability'),?????????????????????????????lp=F,????????????????fun.at=c('0.9','0.85','0.80','0.70','0.6','0.5','0.4','0.3','0.2','0.1'))par(mar=c(2,5,3,2),cex=0.8)##mar 圖形空白邊界 cex 文本和符號(hào)大小plot(nom,xfrac=0.6)

? ? ? 該圖為1年和2年生存率的列線圖,性別的標(biāo)簽在圖上展示出來了。接下來分別對(duì)1年生存率和2年生存率做驗(yàn)證曲線。

? ? ? ?第三步:繪制校準(zhǔn)曲線

###這里演示,采用age?sex?和ph.ecog?構(gòu)建coxph模型##構(gòu)建校準(zhǔn)曲線##time.in?和?u?要是一樣的,都是要評(píng)價(jià)的時(shí)間節(jié)點(diǎn)coxm_1?cal_1##繪制1年生存期校準(zhǔn)曲線par(mar=c(7,4,4,3),cex=1.0)plot(cal_1,lwd=2,lty=1, ##設(shè)置線條形狀和尺寸 errbar.col=c(rgb(0,118,192,maxColorValue = 255)), ##設(shè)置一個(gè)顏色 xlab='Nomogram-Predicted Probability of 1-year DFS',#便簽 ylab='Actual 1-year DFS(proportion)',#標(biāo)簽 col=c(rgb(192,98,83,maxColorValue = 255)),#設(shè)置一個(gè)顏色 xlim = c(0,1),ylim = c(0,1)) ##x軸和y軸范圍##繪制2年生存期校曲線##time.in 和 u 要是一樣的,都是要評(píng)價(jià)的時(shí)間節(jié)點(diǎn)coxm_2?cal_2plot(cal_2,lwd=2,lty=1,??##設(shè)置線條寬度和線條類型 errbar.col=c(rgb(0,118,192,maxColorValue = 255)), ##設(shè)置一個(gè)顏色 xlab='Nomogram-Predicted Probability of 1-year DFS',#便簽 ylab='Actual 2-year DFS(proportion)',#標(biāo)簽 col=c(rgb(192,98,83,maxColorValue = 255)),#設(shè)置一個(gè)顏色 xlim = c(0,1),ylim = c(0,1)) ##x軸和y軸范圍

? ? ? ?繪制校準(zhǔn)曲線的參數(shù)說明:

? ? 1.繪制校準(zhǔn)曲線前需要在模型函數(shù)中添加參數(shù)x=T,y=T和time.inc 參數(shù)

? ? 2.u需要和之前模型中定義好的time.inc一致,根據(jù)原數(shù)據(jù),要以天為單位

即365或者365*2,u和time.inc其實(shí)是一個(gè)意思,表示要評(píng)價(jià)的時(shí)間節(jié)點(diǎn)。如果它倆不一樣,表示你想要評(píng)價(jià)的時(shí)間點(diǎn)不一樣,矯正的結(jié)果當(dāng)然不同了。time.inc全稱是? ? ? ?time increase 即時(shí)間增量。當(dāng)surv=T時(shí)候,表示要計(jì)算surv .summary數(shù)組,此時(shí)time.inc用于計(jì)算數(shù)組內(nèi)部不同時(shí)間點(diǎn)的數(shù)據(jù)(seq(0,maxtime,by=time.inc))。評(píng)價(jià)時(shí)間點(diǎn)不能小于最大時(shí)間的1/25,也不能超過最大隨訪時(shí)間,會(huì)超出評(píng)價(jià)評(píng)價(jià)限度,不能評(píng)價(jià)。如果time.inc省略,則會(huì)根據(jù)時(shí)間單位自動(dòng)選擇,這往往不是我們要的,所以還需要指定值。

? ? 3.m要根據(jù)樣本量來確定,由于校準(zhǔn)曲線一般將所有的樣本均分為5組(對(duì)應(yīng)圖中的5分節(jié)點(diǎn)),而m代表每組樣本量數(shù),因此m*5等于或者近似等于樣本量

? ? 4.b代表最大再抽樣的樣本量,一般b=1000,足夠使用。

? ? 5.由兩個(gè)校準(zhǔn)圖可看,橫坐標(biāo)為預(yù)測(cè)的生存率,縱坐標(biāo)為實(shí)際的生存率,對(duì)角線是預(yù)測(cè)概率等于實(shí)際概率,偏離對(duì)角線越遠(yuǎn)說明預(yù)測(cè)的誤差越大。以上兩個(gè)圖中預(yù)測(cè)曲線基本和對(duì)角線重合,結(jié)果還行,這一點(diǎn)也可以通過計(jì)算C-index指數(shù)看出端倪。

##模型驗(yàn)證,采用surival包#Concordance indexf?sum.survc_indexc_index## C se(C) ##0.64123438?0.03103835?

? ? ? 該模型的區(qū)分度C-index為0.64,其本質(zhì)同ROC曲線面積。結(jié)果顯示,該模型的具有一定區(qū)分度。

04

參考文獻(xiàn)

  • 方積乾等. 衛(wèi)生統(tǒng)計(jì)學(xué). 人民衛(wèi)生出版社。

  • http://www.360doc.com/userhome.aspx?userid=46405145

  • https://www.bilibili.com/read/cv5975714/

  • http://www.360doc.com/content/19/0124/20/52645714_811083591.shtml

  • http://blog.sina.com.cn/s/blog_13ea9a2450102wzf6.html

  • https://blog.csdn.net/fjsd155/article/details/84669331

  • 作者介紹:醫(yī)療大數(shù)據(jù)統(tǒng)計(jì)分析師,擅長(zhǎng)R語言。

    更多閱讀:

    如何進(jìn)行高維變量篩選和特征選擇(一)?Lasso回歸

    基于Lasso回歸篩選變量構(gòu)建Cox模型并繪制Nomogram

    總結(jié)

    以上是生活随笔為你收集整理的语言nomogram校准曲线图_R语言实现Cox模型校准度曲线绘制的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。