官术网_书友最值得收藏!

1.1.3 臨床預測模型

臨床預測模型是指利用多因素模型估算患有某病的概率或將來某結局的發生概率,主要分為診斷模型(diagnostic model)和預后模型(prognostic model)。

診斷模型主要基于研究對象的臨床特征,預測當前患有某種疾病的概率,多見于橫斷面研究,病例對照研究;預后模型則是針對患有某種疾病的研究對象,預測將來疾病復發、死亡、傷殘等轉歸的概率,多見于縱向研究。

臨床預測模型建模策略依舊采用的是“先單后多策略”,但是其重點在于對Y預測的準確性,即不再對模型中每一個X是否P<0.05糾結,只要模型整體預測效果好,可以包容P>0.05的X在模型內的存在,此時模型優劣判定往往按照AIC準則進行,圖1-6和圖1-7反映了預測模型先單后多的建模策略。

圖1-6 臨床預測模型先單后多Logistic回歸建模策略展示

圖1-7 臨床預測模型先單后多COX回歸建模策略展示

臨床預測模型的建模,有一個“門當戶對”原則,這個雖然統計教材中沒有說,但確實是數據處理的經驗累積?!伴T當戶對”是指,我們研究的變量從性質而論,有定量與定性兩類,建模時盡量滿足因變量與自變量的定量對定量,定性對定性。這就是“門當戶對”原則。

臨床預測模型中Logistic回歸的因變量為二分類變量(注意臨床預測模型中的Logistic回歸只是Binary Logistic regression,其他多項和有序資料的臨床預測模型方法尚不成熟);COX回歸的因變量是二分類+時間;所以構建模型時的自變量(風險因素或預測因子)如果是定性則會較好,因為滿足“門當戶對”的原則,如果Logistic或COX回歸中,納入的是定量變量,也許統計上有意義,也能解釋,但是專業上可能不太容易解釋。

比如說年齡,如果直接代入,那結果解釋則為年齡每增加1歲,發生某種疾病或結局的風險增加多少,統計上沒問題,但是試問大家,哪種疾病只要增加1歲,就會增加專業上有意義的風險呢?所以,為什么大家經??吹?,很多文章會把年齡進行分組,如小于60歲和大于等于60歲等。

故而,您再看上面的圖1-6和圖1-7,其中的那么多原本是定量的指標,均根據專業進行了變量降維,從定量降維為定性,如圖1-7中的年齡,分為大于等于69歲和小于69歲??吹竭@您也許會心存困惑,為什么年齡降維分組,在不同文獻中往往不一樣呢?是的,年齡的降維分組,文獻中不下10種方法,沒有固定的套路,需要您根據自己的專業或者數據的特征進行降維,具體的請看本書相關章節。

主站蜘蛛池模板: 夏津县| 叶城县| 奎屯市| 陵川县| 元朗区| 万载县| 浪卡子县| 四会市| 天气| 鲁山县| 金塔县| 铜山县| 通江县| 林甸县| 广东省| 天气| 西乌珠穆沁旗| 长顺县| 镇雄县| 安国市| 朝阳市| 合肥市| 梅河口市| 大余县| 铜陵市| 商都县| 宜兴市| 泰来县| 平乡县| 墨脱县| 拜城县| 肇源县| 台东县| 黄山市| 长丰县| 杨浦区| 普兰店市| 杂多县| 罗田县| 上虞市| 青河县|