官术网_书友最值得收藏!

大數(shù)據(jù)挖掘與統(tǒng)計機器學(xué)習(xí)
會員

大數(shù)據(jù)時代的到來,使我們的生活在政治、經(jīng)濟、社會、文化各個領(lǐng)域都產(chǎn)生了很大改變。“數(shù)據(jù)科學(xué)”一詞應(yīng)運而生。如何更好地對海量數(shù)據(jù)進行分析、得出結(jié)論并做出智能決策是統(tǒng)計工作者面臨的機遇與挑戰(zhàn)。本書介紹數(shù)據(jù)挖掘與統(tǒng)計機器學(xué)習(xí)領(lǐng)域最常用的模型和算法,包括最基礎(chǔ)的線性回歸和線性分類方法,以及模型選擇和模型評價的概念和方法,進而介紹非線性的回歸和分類方法(包括決策樹與組合方法、支持向量機、神經(jīng)網(wǎng)絡(luò)以及在此基礎(chǔ)上發(fā)展的深度學(xué)習(xí)方法)。最后介紹無監(jiān)督的學(xué)習(xí)中的聚類方法和業(yè)界廣泛使用的推薦系統(tǒng)方法。除了方法的理論講解之外,我們給出了每種方法的R語言實現(xiàn),以及應(yīng)用Python語言實現(xiàn)深度學(xué)習(xí)和支持向量機兩種方法。本書的一個亮點是最后一章給出的兩個大數(shù)據(jù)案例,數(shù)據(jù)量均在10G左右。我們同時給出了單機版(Python、數(shù)據(jù)庫、R)和分布式(Hadoop、Hive、Spark)兩種實現(xiàn)方案。原始數(shù)據(jù)和程序代碼均可在出版社提供的網(wǎng)址下載。本書面向的主要讀者是應(yīng)用統(tǒng)計專業(yè)碩士,希望能夠拓展到統(tǒng)計專業(yè)高年級的本科生以及其他各個領(lǐng)域有數(shù)據(jù)分析需求的學(xué)生和從業(yè)人員。

呂曉玲 宋捷 ·自動化 ·11.6萬字

QQ閱讀手機版

主站蜘蛛池模板: 达州市| 新龙县| 德化县| 扎兰屯市| 治县。| 工布江达县| 鄂托克旗| 东台市| 芜湖市| 涟水县| 库车县| 大英县| 河源市| 米林县| 东兴市| 敖汉旗| 洛川县| 蓬溪县| 海盐县| 平遥县| 庄河市| 叶城县| 宜都市| 广丰县| 清水河县| 东兴市| 海淀区| 连城县| 镇巴县| 井陉县| 台前县| 古交市| 金寨县| 楚雄市| 耿马| 金乡县| 民和| 怀仁县| 永修县| 平南县| 清丰县|