- 預測模型實戰:基于R、SPSS和Stata
- 武松編著
- 920字
- 2024-12-24 10:16:13
1.1.3 臨床預測模型
臨床預測模型是指利用多因素模型估算患有某病的概率或將來某結局的發生概率,主要分為診斷模型(diagnostic model)和預后模型(prognostic model)。
診斷模型主要基于研究對象的臨床特征,預測當前患有某種疾病的概率,多見于橫斷面研究,病例對照研究;預后模型則是針對患有某種疾病的研究對象,預測將來疾病復發、死亡、傷殘等轉歸的概率,多見于縱向研究。
臨床預測模型建模策略依舊采用的是“先單后多策略”,但是其重點在于對Y預測的準確性,即不再對模型中每一個X是否P<0.05糾結,只要模型整體預測效果好,可以包容P>0.05的X在模型內的存在,此時模型優劣判定往往按照AIC準則進行,圖1-6和圖1-7反映了預測模型先單后多的建模策略。

圖1-6 臨床預測模型先單后多Logistic回歸建模策略展示

圖1-7 臨床預測模型先單后多COX回歸建模策略展示
臨床預測模型的建模,有一個“門當戶對”原則,這個雖然統計教材中沒有說,但確實是數據處理的經驗累積。“門當戶對”是指,我們研究的變量從性質而論,有定量與定性兩類,建模時盡量滿足因變量與自變量的定量對定量,定性對定性。這就是“門當戶對”原則。
臨床預測模型中Logistic回歸的因變量為二分類變量(注意臨床預測模型中的Logistic回歸只是Binary Logistic regression,其他多項和有序資料的臨床預測模型方法尚不成熟);COX回歸的因變量是二分類+時間;所以構建模型時的自變量(風險因素或預測因子)如果是定性則會較好,因為滿足“門當戶對”的原則,如果Logistic或COX回歸中,納入的是定量變量,也許統計上有意義,也能解釋,但是專業上可能不太容易解釋。
比如說年齡,如果直接代入,那結果解釋則為年齡每增加1歲,發生某種疾病或結局的風險增加多少,統計上沒問題,但是試問大家,哪種疾病只要增加1歲,就會增加專業上有意義的風險呢?所以,為什么大家經常看到,很多文章會把年齡進行分組,如小于60歲和大于等于60歲等。
故而,您再看上面的圖1-6和圖1-7,其中的那么多原本是定量的指標,均根據專業進行了變量降維,從定量降維為定性,如圖1-7中的年齡,分為大于等于69歲和小于69歲。看到這您也許會心存困惑,為什么年齡降維分組,在不同文獻中往往不一樣呢?是的,年齡的降維分組,文獻中不下10種方法,沒有固定的套路,需要您根據自己的專業或者數據的特征進行降維,具體的請看本書相關章節。
- 創意UI:Photoshop玩轉移動UI設計
- Photoshop日系少女寫真后期解密
- Mastering phpMyAdmin 3.3.x for Effective MySQL Management
- Midjourney AI案例實戰:繪本+動漫+插畫
- Photoshop+Adobe Camera Raw+Lightroom(攝影后期照片潤飾實戰)
- 深入理解OpenCV:實用計算機視覺項目解析(原書第3版)
- 高等院校電腦美術教材:CorelDRAW X7中文版基礎教程
- 精進PPT:PPT設計思維、技術與實踐(第3版)
- Linux Shell Scripting Cookbook
- Power Query For Excel:讓工作化繁為簡
- Learning the Yahoo! User Interface library
- 7小時精通剪映:短視頻剪輯/調色/特效/字幕(手機版+電腦版)
- 中文版Photoshop CS6完全自學手冊(超值版)
- Instant Markdown
- Photoshop 2020實戰從入門到精通(超值版)