官术网_书友最值得收藏!

大數(shù)據(jù)挖掘與統(tǒng)計機器學(xué)習(xí)
會員

大數(shù)據(jù)時代的到來,使我們的生活在政治、經(jīng)濟、社會、文化各個領(lǐng)域都產(chǎn)生了很大改變。“數(shù)據(jù)科學(xué)”一詞應(yīng)運而生。如何更好地對海量數(shù)據(jù)進行分析、得出結(jié)論并做出智能決策是統(tǒng)計工作者面臨的機遇與挑戰(zhàn)。本書介紹數(shù)據(jù)挖掘與統(tǒng)計機器學(xué)習(xí)領(lǐng)域最常用的模型和算法,包括最基礎(chǔ)的線性回歸和線性分類方法,以及模型選擇和模型評價的概念和方法,進而介紹非線性的回歸和分類方法(包括決策樹與組合方法、支持向量機、神經(jīng)網(wǎng)絡(luò)以及在此基礎(chǔ)上發(fā)展的深度學(xué)習(xí)方法)。最后介紹無監(jiān)督的學(xué)習(xí)中的聚類方法和業(yè)界廣泛使用的推薦系統(tǒng)方法。除了方法的理論講解之外,我們給出了每種方法的R語言實現(xiàn),以及應(yīng)用Python語言實現(xiàn)深度學(xué)習(xí)和支持向量機兩種方法。本書的一個亮點是最后一章給出的兩個大數(shù)據(jù)案例,數(shù)據(jù)量均在10G左右。我們同時給出了單機版(Python、數(shù)據(jù)庫、R)和分布式(Hadoop、Hive、Spark)兩種實現(xiàn)方案。原始數(shù)據(jù)和程序代碼均可在出版社提供的網(wǎng)址下載。本書面向的主要讀者是應(yīng)用統(tǒng)計專業(yè)碩士,希望能夠拓展到統(tǒng)計專業(yè)高年級的本科生以及其他各個領(lǐng)域有數(shù)據(jù)分析需求的學(xué)生和從業(yè)人員。

呂曉玲 宋捷 ·自動化 ·11.6萬字

QQ閱讀手機版

主站蜘蛛池模板: 陆河县| 平利县| 阳信县| 乌鲁木齐市| 江西省| 安远县| 安平县| 棋牌| 东乡族自治县| 赤城县| 禄劝| 理塘县| 恩施市| 长乐市| 板桥市| 华阴市| 东乡县| 沂南县| 呼伦贝尔市| 台南县| 宜兴市| 通州区| 永修县| 临洮县| 肥东县| 稻城县| 三河市| 佛山市| 民丰县| 塘沽区| 赤城县| 德清县| 南宁市| 山阴县| 辽阳县| 始兴县| 罗甸县| 长治县| 呼和浩特市| 都江堰市| 巨鹿县|