官术网_书友最值得收藏!

1.4.1 測試數據

我們以Scikit-Learn環境介紹常見的性能衡量指標。為了便于演示,我們創建測試數據,測試數據一共有1000條記錄,每條記錄了100個特征,內容隨機生成:

x, y = datasets.make_classification(n_samples=1000, n_features=100,
                    n_redundant=0, random_state = 1)

把數據集隨機劃分成訓練集和測試集,其中測試集占40%:

train_X, test_X, train_y, test_y = train_test_split(x,
                                         y,
                                         test_size=0.2,
                                         random_state=66)

使用KNN算法進行訓練和預測:

knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(train_X, train_Y)
pred_Y = knn.predict(test_X)
主站蜘蛛池模板: 怀集县| 石柱| 沾益县| 绥中县| 舒兰市| 南溪县| 望都县| 方城县| 达日县| 伊吾县| 平阳县| 德格县| 桂林市| 柏乡县| 吉林市| 舟曲县| 乡城县| 泰顺县| 崇信县| 寿光市| 锡林郭勒盟| 资源县| 准格尔旗| 华池县| 法库县| 南通市| 湘潭市| 濮阳市| 仁布县| 松桃| 扎赉特旗| 漳浦县| 太康县| 工布江达县| 高雄县| 浪卡子县| 宜章县| 新巴尔虎右旗| 甘谷县| 札达县| 临城县|