機(jī)器學(xué)習(xí):軟件工程方法與實(shí)現(xiàn)
本書視角獨(dú)特,將軟件工程中的方法應(yīng)用到機(jī)器學(xué)習(xí)實(shí)踐中,重視方法論和工程實(shí)踐的融合。本書主要有3個特點(diǎn)。1)機(jī)器學(xué)習(xí)的軟件工程方法:用軟件工程(SoftwareEngineering)中的工具、方法和理論指導(dǎo)機(jī)器學(xué)習(xí)的實(shí)踐活動。主要體現(xiàn)在測試驅(qū)動開發(fā)(TDD)方法、機(jī)器學(xué)習(xí)項(xiàng)目管理方法、工程化軟件應(yīng)用于數(shù)據(jù)科學(xué)標(biāo)準(zhǔn)化環(huán)境,以及開源算法包的大量實(shí)踐應(yīng)用案例等。2)機(jī)器學(xué)習(xí)全生命周期:書中全面呈現(xiàn)了機(jī)器學(xué)習(xí)項(xiàng)目開發(fā)的完整鏈路,以項(xiàng)目需求為起點(diǎn),歷經(jīng)樣本定義、數(shù)據(jù)處理、建模、模型上線、模型監(jiān)控、模型重訓(xùn)或重建。流程中的大部分節(jié)點(diǎn)獨(dú)立成章,闡述充分,并且不是單純地闡述理論,而是重在實(shí)踐。同時,聚焦機(jī)器學(xué)習(xí)中應(yīng)用最廣泛和最有效的算法,使之成為貫穿機(jī)器學(xué)習(xí)項(xiàng)目生命周期的一條完整的學(xué)習(xí)路徑。3)提出機(jī)器學(xué)習(xí)是一門實(shí)驗(yàn)學(xué)科:書中有大量的工業(yè)實(shí)踐代碼,例如數(shù)據(jù)分析包、特征離散化包、特征選擇包、集成模型框架包、大規(guī)模模型上線系統(tǒng)架構(gòu)和對應(yīng)代碼包等,對機(jī)器學(xué)習(xí)算法特性也有大量的代碼解析。書中還多次強(qiáng)調(diào)對于機(jī)器學(xué)習(xí)這樣一門實(shí)驗(yàn)和實(shí)踐學(xué)科,工具、方法和策略的重要性,并介紹了在實(shí)際項(xiàng)目中對時間、人力成本等的權(quán)衡策略。本書不拘泥于公式推演、數(shù)值分析計算領(lǐng)域優(yōu)化求解(梯度、牛頓、拉格朗日、凸優(yōu)化)等主題,而重在展現(xiàn)機(jī)器學(xué)習(xí)的實(shí)際應(yīng)用,以及各知識點(diǎn)的落地。在寫作方式和內(nèi)容編寫等方面,本書力求既貼近工程實(shí)踐又不失理論深度,給讀者良好的閱讀體驗(yàn)。
·22.4萬字