- AI安全之對抗樣本入門
- 兜哥編著
- 132字
- 2019-07-11 18:32:06
1.4.1 測試數據
我們以Scikit-Learn環境介紹常見的性能衡量指標。為了便于演示,我們創建測試數據,測試數據一共有1000條記錄,每條記錄了100個特征,內容隨機生成:
x, y = datasets.make_classification(n_samples=1000, n_features=100, n_redundant=0, random_state = 1)
把數據集隨機劃分成訓練集和測試集,其中測試集占40%:
train_X, test_X, train_y, test_y = train_test_split(x, y, test_size=0.2, random_state=66)
使用KNN算法進行訓練和預測:
knn = KNeighborsClassifier(n_neighbors=5) knn.fit(train_X, train_Y) pred_Y = knn.predict(test_X)