官术网_书友最值得收藏!

1.2.3 數據集分類

臨床預測模型建模和驗證的數據集稱為訓練集和驗證集。如果驗證集是來自訓練集來源的同一人群,則稱為內部驗證;如果驗證集來自外部數據,則稱為外部驗證,如圖1-12所示。

圖1-12 預測模型數據集與驗證區分

很多時候,我們對數據進行拆分,分為訓練集和驗證集,用訓練集建模,然后用驗證集進行驗證,注意此時也是內部驗證,因為驗證集與訓練集是同一批數據被拆分開的;同樣在某單位搜集前2年的數據作為訓練集,后1年的數據作為驗證集,這種情況也屬于內部驗證,因為也是來自同一家機構的。外部驗證是指驗證集來自不同于訓練集的數據,比如A醫院建模,而采用B醫院數據進行驗證,這就屬于外部驗證。

另從統計分析方法上,同一數據進行拆分為訓練集和驗證集,與A醫院數據建模,B醫院數據驗證,在統計實現方法上是一樣的,均屬于統計學上的外部驗證;而對研究全部數據進行建模,然后采用Bootsrap或交叉驗證的方法驗證,都屬于統計學上的內部驗證。這個容易混淆,一個是統計學上的內部驗證與外部驗證,另一個是數據集上的內部驗證與外部驗證。

主站蜘蛛池模板: 宣化县| 太康县| 融水| 廊坊市| 寻乌县| 永川市| 巴东县| 房山区| 平度市| 荔浦县| 师宗县| 聂拉木县| 邢台县| 新宾| 三原县| 宽城| 鄂伦春自治旗| 巍山| 若羌县| 隆尧县| 南开区| 若羌县| 蒙自县| 天柱县| 仁化县| 余江县| 克东县| 中西区| 钦州市| 肇州县| 广元市| 新安县| 仁布县| 九江县| 长治县| 长寿区| 扬中市| 定边县| 济宁市| 拜城县| 濉溪县|