- 預測模型實戰:基于R、SPSS和Stata
- 武松編著
- 437字
- 2024-12-24 10:16:15
1.2.3 數據集分類
臨床預測模型建模和驗證的數據集稱為訓練集和驗證集。如果驗證集是來自訓練集來源的同一人群,則稱為內部驗證;如果驗證集來自外部數據,則稱為外部驗證,如圖1-12所示。

圖1-12 預測模型數據集與驗證區分
很多時候,我們對數據進行拆分,分為訓練集和驗證集,用訓練集建模,然后用驗證集進行驗證,注意此時也是內部驗證,因為驗證集與訓練集是同一批數據被拆分開的;同樣在某單位搜集前2年的數據作為訓練集,后1年的數據作為驗證集,這種情況也屬于內部驗證,因為也是來自同一家機構的。外部驗證是指驗證集來自不同于訓練集的數據,比如A醫院建模,而采用B醫院數據進行驗證,這就屬于外部驗證。
另從統計分析方法上,同一數據進行拆分為訓練集和驗證集,與A醫院數據建模,B醫院數據驗證,在統計實現方法上是一樣的,均屬于統計學上的外部驗證;而對研究全部數據進行建模,然后采用Bootsrap或交叉驗證的方法驗證,都屬于統計學上的內部驗證。這個容易混淆,一個是統計學上的內部驗證與外部驗證,另一個是數據集上的內部驗證與外部驗證。
推薦閱讀
- EJB 3.0 Database Persistence with Oracle Fusion Middleware 11g: LITE
- Flash CS6標準教程(全視頻微課版)
- AutoCAD 2014電氣設計從入門到精通
- 我為PS狂 Photoshop照片處理一分鐘秘笈
- Microsoft Dynamics GP 2010 Reporting
- iPad+Procreate室內設計手繪表現技法
- CMS Design Using PHP and jQuery
- 從零開始:AutoCAD 2010中文版建筑制圖基礎培訓教程(第2版)
- Vue 企業開發實戰
- 精進PPT:PPT設計思維、技術與實踐(第3版)
- AutoCAD 2022中文版完全自學一本通
- Premiere Pro CC 2015中文版基礎與實例教程(第4版)
- MATLAB在日常計算中的應用
- Origin 2022科學繪圖與數據分析(高級應用篇)
- 平面設計師實戰教程