官术网_书友最值得收藏!

1.2.3 數據集分類

臨床預測模型建模和驗證的數據集稱為訓練集和驗證集。如果驗證集是來自訓練集來源的同一人群,則稱為內部驗證;如果驗證集來自外部數據,則稱為外部驗證,如圖1-12所示。

圖1-12 預測模型數據集與驗證區分

很多時候,我們對數據進行拆分,分為訓練集和驗證集,用訓練集建模,然后用驗證集進行驗證,注意此時也是內部驗證,因為驗證集與訓練集是同一批數據被拆分開的;同樣在某單位搜集前2年的數據作為訓練集,后1年的數據作為驗證集,這種情況也屬于內部驗證,因為也是來自同一家機構的。外部驗證是指驗證集來自不同于訓練集的數據,比如A醫院建模,而采用B醫院數據進行驗證,這就屬于外部驗證。

另從統計分析方法上,同一數據進行拆分為訓練集和驗證集,與A醫院數據建模,B醫院數據驗證,在統計實現方法上是一樣的,均屬于統計學上的外部驗證;而對研究全部數據進行建模,然后采用Bootsrap或交叉驗證的方法驗證,都屬于統計學上的內部驗證。這個容易混淆,一個是統計學上的內部驗證與外部驗證,另一個是數據集上的內部驗證與外部驗證。

主站蜘蛛池模板: 常山县| 西藏| 上林县| 富锦市| 盘锦市| 金山区| 翁牛特旗| 拜城县| 榆中县| 昂仁县| 瓮安县| 万盛区| 达孜县| 高碑店市| 来安县| 沙湾县| 柯坪县| 新密市| 时尚| 鄢陵县| 泽库县| 蚌埠市| 保亭| 南乐县| 宣化县| 舞钢市| 广水市| 叶城县| 江孜县| 海门市| 石棉县| 行唐县| 蛟河市| 丹棱县| 佛学| 大田县| 鄱阳县| 墨脱县| 泽库县| 石阡县| 灵山县|