官术网_书友最值得收藏!

2.4 本章小結

本章我們討論了處理機器學習問題的一個典型工作流程:我們如何從原始數據中提取信息特征;我們如何使用數據和標簽來訓練一個機器學習模型;以及我們如何使用最終確定的模型來預測新的數據標簽。我們得知把數據拆分成一個訓練集和一個測試集是非常重要的,因為這是了解一個模型對新數據點泛化性能的唯一方法。

在軟件方面,我們大幅提升了自身的Python技能。我們學習了如何使用NumPy數組存儲和操作數據,以及如何使用Matplotlib進行數據可視化。我們討論了scikit-learn及其很多有用的數據資源。最后,我們還討論了OpenCV自有的TrainData容器,該容器為OpenCV的C++ API用戶提供了一些幫助。

有了這些工具,我們現在就準備實現第一個真正的機器學習模型了!在第3章,我們將重點關注監督學習及其兩個主要問題類別:分類和回歸。

主站蜘蛛池模板: 法库县| 江陵县| 武清区| 扎兰屯市| 安阳市| 神农架林区| 大兴区| 类乌齐县| 林周县| 河池市| 莒南县| 西青区| 湖北省| 乌拉特中旗| 邢台县| 和平县| 宜兴市| 宜川县| 白河县| 邵阳县| 富裕县| 安岳县| 瑞安市| 清新县| 湛江市| 洛南县| 花莲市| 平遥县| 清苑县| 苏尼特右旗| 四平市| 吉林市| 渑池县| 南开区| 天峻县| 罗城| 句容市| 依安县| 石河子市| 兰州市| 当阳市|