
真實(shí)世界?數(shù)據(jù)分析系列聯(lián)合模型的R語?實(shí)現(xiàn)與解讀——以分析PBC2數(shù)據(jù)集
為例
公眾號(hào):醫(yī)學(xué)?數(shù)據(jù)挖掘分析
本系列上?期我們已經(jīng)簡(jiǎn)單介紹了聯(lián)合模型的相關(guān)原理(往期推?:真實(shí)世界?數(shù)據(jù)分析系列|聯(lián)合模型的簡(jiǎn)單介紹),
本期我們從實(shí)例出發(fā),看如何使?R語?實(shí)現(xiàn)聯(lián)合模型,如何解讀聯(lián)合模型的結(jié)果。
數(shù)據(jù)來源
數(shù)據(jù)為JM程序包中的1974年到1984年Mayo原發(fā)性膽汁肝硬化(Mayo Clinic Primary Biliary Cirrhosis Data, PBC2)數(shù)
據(jù)集,包含了312例患者,總計(jì)1945個(gè)觀測(cè)值,包含患者編號(hào)、死亡或刪失時(shí)間、?存狀態(tài)、?藥情況、年齡、性別、
觀測(cè)時(shí)間、?清膽紅素等20個(gè)變量。其中140例患者死亡,29例接受移植?術(shù),143例患者存活。由于死亡和刪失,該
研究對(duì)患者平均進(jìn)?6.2次隨訪,中位?存時(shí)間為9.43年。具體數(shù)據(jù)如下圖所?。
本研究的?的為:探討縱向指標(biāo)rBilir與肝硬化患者死亡風(fēng)險(xiǎn)之間的關(guān)系。下?構(gòu)建聯(lián)合模型。
?、構(gòu)建聯(lián)合模型
library(JMbayes)
pbc2$status2 <- c(pbc2$status != "alive")
$status2 <- c($status != "alive")
(1)構(gòu)建縱向?模型:
為了滿?擬合線性混合模型的因變量分布(服從正態(tài)分布)要求,對(duì)?清膽紅素進(jìn)?對(duì)數(shù)變換得到log(rBilir),并以
log(rBilir)為因變量,選擇觀測(cè)時(shí)間(year)、?藥情況(drug)、觀測(cè)時(shí)間和?藥情況的交互作?為固定效應(yīng)部分,
患者標(biāo)識(shí)影響下的觀測(cè)時(shí)間作為隨機(jī)效應(yīng),構(gòu)建線性混合模型:
1 <- lme(log(rBilir) ~ drug * year, data = pbc2,
random = ~ year | id, method = "ML")
summary(1)
(2)構(gòu)建?存?模型:
以?藥情況、年齡、?藥情況和年齡的交互作?為基線變量,構(gòu)建cox模型:
1 <- coxph(Surv(years, status2) ~ drug * age, data = , x = TRUE)
summary(1)
(3)聯(lián)合模型的參數(shù)估計(jì):
構(gòu)建聯(lián)合模型:
1 <- jointModelBayes(1, 1, timeVar = "year")
summary(1)
我們看聯(lián)合模型的結(jié)果,縱向?模型部分,觀測(cè)時(shí)間對(duì)log(rBilir)的變化差異有統(tǒng)計(jì)學(xué)意義(P<0.001),隨著觀測(cè)時(shí)
間的增加,log(rBilir)也逐漸增加(β=0.2313,P<0.001);?存?模型部分,患者年齡差異有統(tǒng)計(jì)學(xué)意義
(P<0.001),患者年齡每增加?個(gè)單位,患者死亡風(fēng)險(xiǎn)增加1.0358倍(95% CI: 1.0089-1.0618)。另外,聯(lián)合模型的
共享參數(shù)(Assoct)有統(tǒng)計(jì)學(xué)意義,表明log(rBilir)每縱向增加1個(gè)單位,患者發(fā)?死亡風(fēng)險(xiǎn)增加3.8675倍(95% CI:
3.2619-4.6856)。
?、模型預(yù)測(cè)效能與評(píng)價(jià)
我們可以計(jì)算出模型的AIC、BIC、LogLikelihood值,分別為4761.51、4855.935、-2350.755。這些評(píng)價(jià)指標(biāo)可?于模
型間的對(duì)?,我們挑選值AIC/BIC最?或?qū)?shù)似然函數(shù)值最?的模型為最佳模型。
利?到起始時(shí)間點(diǎn)的可?縱向信息,基于聯(lián)合模型可以計(jì)算指定時(shí)間點(diǎn)的ROC曲線和AUC估計(jì)值。下圖為起始時(shí)間為
5,預(yù)測(cè)到時(shí)間點(diǎn)為13的ROC曲線及其對(duì)應(yīng)的AUC值,AUC值越接近1預(yù)測(cè)效果越好。
plot(rocJM(1, pbc2, Tstart = 5, Thoriz = 8))
aucJM(1, pbc2, Tstart = 5, Thoriz = 8)
三、個(gè)體化動(dòng)態(tài)預(yù)測(cè)
根據(jù)建?的聯(lián)合模型,我們可以對(duì)任?患者的?存概率和縱向結(jié)果進(jìn)?動(dòng)態(tài)預(yù)測(cè),如對(duì)2號(hào)患者進(jìn)?預(yù)測(cè):
ND <- pbc2[pbc2$id == 2, ] # the data of Subject 2
survPreds <- vector("list", nrow(ND))
for (i in 1:nrow(ND)) {
survPreds[[i]] <- survfitJM(1, newdata = ND[1:i, ])
}
par(mfrow = c(2, 2), oma = c(0, 2, 0, 2))
for (i in c(1,3,5,7)) {
plot(survPreds[[i]], estimator = "median", = TRUE,
include.y = TRUE, main = paste("Follow-up time:",
round(survPreds[[i]]$, 1)), ylab = "", ylab2 = "")
}
mtext("log rum bilirubin", side = 2, line = -1, outer = TRUE)
mtext("Survival Probability", side = 4, line = -1, outer = TRUE)
上圖為2號(hào)患者在隨訪期間的動(dòng)態(tài)?存概率。垂直虛線表?最后?次?清膽紅素測(cè)定的時(shí)間點(diǎn)。垂線左邊描述了擬合的
縱向軌跡,垂線右邊的實(shí)線為?存概率中位數(shù)估計(jì)量,虛線對(duì)應(yīng)其95%置信區(qū)間。我們觀測(cè)到,在第三次測(cè)量后,2號(hào)
患者的對(duì)數(shù)?清膽紅素?平明顯增加,?存概率的下降速率變得更為陡峭,表明她的病情正在惡化。
參考?獻(xiàn):
[1] 翟映紅, 陳琪, 韓賀東, 趙欣欣, ?永晴, 周詳, 賀佳. 聯(lián)合模型介紹及在醫(yī)學(xué)研究中的應(yīng)?. 中華流?病學(xué)雜志, 2019,
40(11): 1456-1460.
[2] 肖宇飛,馮佳寧,王曉璇,?倩,?福艷,王素珍, XIAO Yufei, FENG Jianing, WANG Xiaoxuan, MAO Qian, SHI Fuyan,
WANG Suzhen. 利?數(shù)據(jù)庫數(shù)據(jù)采?聯(lián)合模型動(dòng)態(tài)預(yù)測(cè)312例肝硬化患者預(yù)后的觀察分析[J]. ?東?學(xué)學(xué)報(bào):醫(yī)學(xué)版,
2020, 58(9):7.
[3] Dimitris, Rizopoulos, Laura, et al. Combining Dynamic Predictions From Joint Models for Longitudinal and Time-to-
Event Data Using Bayesian Model Averaging[J]. Journal of the American Statistical Association, 2014, 109(508):1385-
1397.
[4] Rizopoulos D. Joint models for longitudinal and time-to-event data:with applications in R[M]. Boca Raton: CRC
Press, 2012.
[5] Kan L , Sheng L . Dynamic predictions in Bayesian functional joint models for longitudinal and time-to-event data:
An application to Alzheimer's dia[J]. Statistical Methods in Medical Rearch, 2017, 28(2):217.
更多內(nèi)容,請(qǐng)關(guān)注“醫(yī)學(xué)?數(shù)據(jù)挖掘分析”公眾號(hào),歡迎留?聯(lián)系~
郵箱:*********************
地址:?州市天河區(qū)珠江東路?德置地秋?場(chǎng)F座

本文發(fā)布于:2023-11-12 01:17:40,感謝您對(duì)本站的認(rèn)可!
本文鏈接:http://m.newhan.cn/zhishi/a/1699723060213083.html
版權(quán)聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請(qǐng)勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除。
本文word下載地址:真實(shí)世界大數(shù)據(jù)分析系列聯(lián)合模型的R語言實(shí)現(xiàn)與解讀——以分析PBC2數(shù)據(jù).doc
本文 PDF 下載地址:真實(shí)世界大數(shù)據(jù)分析系列聯(lián)合模型的R語言實(shí)現(xiàn)與解讀——以分析PBC2數(shù)據(jù).pdf
| 留言與評(píng)論(共有 0 條評(píng)論) |