- 預測模型實戰:基于R、SPSS和Stata
- 武松編著
- 437字
- 2024-12-24 10:16:15
1.2.3 數據集分類
臨床預測模型建模和驗證的數據集稱為訓練集和驗證集。如果驗證集是來自訓練集來源的同一人群,則稱為內部驗證;如果驗證集來自外部數據,則稱為外部驗證,如圖1-12所示。

圖1-12 預測模型數據集與驗證區分
很多時候,我們對數據進行拆分,分為訓練集和驗證集,用訓練集建模,然后用驗證集進行驗證,注意此時也是內部驗證,因為驗證集與訓練集是同一批數據被拆分開的;同樣在某單位搜集前2年的數據作為訓練集,后1年的數據作為驗證集,這種情況也屬于內部驗證,因為也是來自同一家機構的。外部驗證是指驗證集來自不同于訓練集的數據,比如A醫院建模,而采用B醫院數據進行驗證,這就屬于外部驗證。
另從統計分析方法上,同一數據進行拆分為訓練集和驗證集,與A醫院數據建模,B醫院數據驗證,在統計實現方法上是一樣的,均屬于統計學上的外部驗證;而對研究全部數據進行建模,然后采用Bootsrap或交叉驗證的方法驗證,都屬于統計學上的內部驗證。這個容易混淆,一個是統計學上的內部驗證與外部驗證,另一個是數據集上的內部驗證與外部驗證。
推薦閱讀
- 從零開始:Flash CS6中文版基礎培訓教程
- 專業級音樂制作理論與實踐Pro Tools:從入門到應用
- Drupal: Creating Blogs, Forums, Portals, and Community Websites
- Adobe創意大學Illustrator CS5 產品專家認證標準教材
- 新編 中文版Photoshop入門與提高
- 綁定的藝術:Maya高級角色骨骼綁定技法(第2版)
- AutoCAD入門教程全掌握
- JBoss RichFaces 3.3
- Photoshop CC 2019 平面設計實例教程
- NX Open API編程技術
- 中文版CorelDRAW X7技術大全
- 中文版Corel DRAW X5案例實訓教材
- 藝術二維碼設計與制作完全攻略 PHOTOSHOP+ILLUSTRATOR+FLASH
- 全鏈路UI設計:創意思維+項目實戰+就業指導
- Joomla! 1.5 Multimedia