- 機(jī)器學(xué)習(xí)案例實(shí)戰(zhàn)
- 趙衛(wèi)東
- 1040字
- 2020-01-16 10:54:16
前言
機(jī)器學(xué)習(xí)是人工智能的核心技術(shù)。本書(shū)針對(duì)典型的實(shí)際應(yīng)用情景,結(jié)合作者最近幾年在科研、教學(xué)和企業(yè)培訓(xùn)中的成果,基于TensorFlow、PySpark和TI-ONE等主流的開(kāi)源機(jī)器學(xué)習(xí)平臺(tái),使用真實(shí)的業(yè)務(wù)數(shù)據(jù)和企業(yè)應(yīng)用問(wèn)題,詳細(xì)、深入地介紹了機(jī)器學(xué)習(xí)實(shí)施的基本思路、關(guān)鍵步驟和難點(diǎn)。本書(shū)通過(guò)這些實(shí)際應(yīng)用案例介紹了數(shù)據(jù)可視化、典型的機(jī)器學(xué)習(xí)算法以及電子推薦技術(shù)的具體應(yīng)用,使得讀者能夠深刻地理解機(jī)器學(xué)習(xí)的專業(yè)知識(shí)和解決問(wèn)題的思路,提升對(duì)實(shí)際應(yīng)用領(lǐng)域問(wèn)題的分析和動(dòng)手能力。
本書(shū)可以與2018年出版的《機(jī)器學(xué)習(xí)》一書(shū)配套學(xué)習(xí)。通過(guò)對(duì)本書(shū)的學(xué)習(xí),讀者不僅可以模仿書(shū)中的案例實(shí)踐基于開(kāi)源機(jī)器學(xué)習(xí)平臺(tái)的實(shí)際數(shù)據(jù)分析應(yīng)用,也很容易舉一反三,對(duì)新的數(shù)據(jù)分析問(wèn)題提出合理的分析思路。
本書(shū)不是簡(jiǎn)單地介紹機(jī)器學(xué)習(xí)理論,而是通過(guò)分析目前機(jī)器學(xué)習(xí)技術(shù)的痛點(diǎn)(即與實(shí)際應(yīng)用結(jié)合不緊密等問(wèn)題)而編寫(xiě)的實(shí)戰(zhàn)案例集。當(dāng)前,國(guó)內(nèi)機(jī)器學(xué)習(xí)實(shí)戰(zhàn)方面的資料存在著以下3個(gè)明顯問(wèn)題:一是機(jī)器學(xué)習(xí)的應(yīng)用案例比較粗略,問(wèn)題也比較簡(jiǎn)單,分析過(guò)程不具體,難以支撐機(jī)器學(xué)習(xí)技術(shù)的學(xué)習(xí),而這方面又是培養(yǎng)人工智能應(yīng)用人才非常重要、不可或缺的環(huán)節(jié);二是數(shù)據(jù)量比較小,分析的問(wèn)題僅僅是實(shí)際問(wèn)題的簡(jiǎn)化,數(shù)據(jù)的分析深度、算法的復(fù)雜度還達(dá)不到機(jī)器學(xué)習(xí)的要求;三是內(nèi)容分散,主流的機(jī)器學(xué)習(xí)開(kāi)源平臺(tái)非常多,各有千秋,而實(shí)際上機(jī)器學(xué)習(xí)的工作使用TensorFlow、PySpark等幾種主流的機(jī)器學(xué)習(xí)平臺(tái)就可以勝任。
本書(shū)通過(guò)精心地選擇實(shí)際數(shù)據(jù)和應(yīng)用問(wèn)題,突出使用機(jī)器學(xué)習(xí)解決數(shù)據(jù)分析過(guò)程中常見(jiàn)的問(wèn)題,使讀者不僅能理解幾種主流機(jī)器學(xué)習(xí)平臺(tái)的原理,還能針對(duì)實(shí)際問(wèn)題設(shè)計(jì)可視化分析、機(jī)器學(xué)習(xí)等分析程序,具有較強(qiáng)的實(shí)戰(zhàn)性。
使用本書(shū)的讀者需要有一定的Python編程基礎(chǔ),如果對(duì)Spark有一定的了解更佳。對(duì)于學(xué)習(xí)者而言,定義機(jī)器學(xué)習(xí)模型是一項(xiàng)復(fù)雜而又有難度的工作,而借助良好的機(jī)器學(xué)習(xí)框架,可以降低應(yīng)用門(mén)檻。為了便于學(xué)習(xí)機(jī)器學(xué)習(xí)的分析過(guò)程,本書(shū)使用了多種業(yè)界主流的開(kāi)源機(jī)器學(xué)習(xí)平臺(tái),包括TensorFlow、PySpark和TI-ONE等,這些平臺(tái)一般注冊(cè)賬號(hào)后就可以使用,使讀者在數(shù)據(jù)分析的過(guò)程中可以把主要的精力放在數(shù)據(jù)分析的思路上,降低了應(yīng)用開(kāi)發(fā)的難度。
本書(shū)可作為對(duì)機(jī)器學(xué)習(xí)感興趣的研究人員和工程技術(shù)人員的參考資料,也可作為高等院校本科生、研究生的機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、數(shù)據(jù)挖掘等課程的實(shí)驗(yàn)或?qū)嵱?xùn)教材。
感謝騰訊、谷歌、百度等公司資助的產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目的支持。在本書(shū)寫(xiě)作的過(guò)程中,研究生蒲實(shí)、耿甲、于召鑫、袁雪如、陳伯宇、胡遠(yuǎn)文等在資料收集方面做了一些工作,在此特表示感謝。
2019年5月
于復(fù)旦大學(xué)
- Visualforce Development Cookbook(Second Edition)
- R Data Mining
- 21天學(xué)通C++
- 80x86/Pentium微型計(jì)算機(jī)原理及應(yīng)用
- Implementing Splunk 7(Third Edition)
- 影視后期編輯與合成
- 傳感器與新聞
- Windows Server 2003系統(tǒng)安全管理
- 新編計(jì)算機(jī)圖形學(xué)
- Working with Linux:Quick Hacks for the Command Line
- 單片機(jī)原理實(shí)用教程
- 傳感器與自動(dòng)檢測(cè)
- MPC5554/5553微處理器揭秘
- JSP網(wǎng)絡(luò)開(kāi)發(fā)入門(mén)與實(shí)踐
- 牛津通識(shí)讀本:大數(shù)據(jù)(中文版)