官术网_书友最值得收藏!

Python網(wǎng)絡(luò)爬蟲:從入門到精通

本書主要介紹如何使用Python語言進(jìn)行網(wǎng)絡(luò)爬蟲程序的開發(fā),從Python語言的基本特性入手,詳細(xì)介紹Python網(wǎng)絡(luò)爬蟲開發(fā)的多個(gè)方面,涉及HTTP、HTML、正則表達(dá)式、JavaScript、自然語言處理、數(shù)據(jù)處理與科學(xué)計(jì)算等不同領(lǐng)域的內(nèi)容。全書共12章,包括基礎(chǔ)篇、進(jìn)階篇、提高篇和實(shí)戰(zhàn)篇4個(gè)部分。基礎(chǔ)篇包括第1、2、3章,分別為Python基礎(chǔ)及網(wǎng)絡(luò)爬蟲、靜態(tài)網(wǎng)頁抓取、數(shù)據(jù)存儲。進(jìn)階篇包括第4、5、6章,分別為JavaScript與動態(tài)內(nèi)容、模擬登錄與驗(yàn)證碼、爬蟲數(shù)據(jù)的分析與處理。提高篇包括第7、8、9章,分別為爬蟲的靈活性和多樣性、Selenium模擬瀏覽器與網(wǎng)站測試、爬蟲框架Scrapy與反爬蟲。實(shí)戰(zhàn)篇提供了3個(gè)實(shí)戰(zhàn)項(xiàng)目供讀者學(xué)習(xí)參考。本書內(nèi)容覆蓋網(wǎng)絡(luò)數(shù)據(jù)抓取與爬蟲編程中的主要知識和前沿技術(shù)。同時(shí),本書在重視理論基礎(chǔ)的前提下,從實(shí)用性和豐富度出發(fā),結(jié)合實(shí)例演示爬蟲程序編寫的核心流程,將理論與實(shí)踐結(jié)合,力求提高讀者的網(wǎng)絡(luò)爬蟲實(shí)操技能。本書可作為高等院校數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、軟件工程等相關(guān)專業(yè)課程的教材,也可作為Python語言初學(xué)者、網(wǎng)絡(luò)爬蟲技術(shù)愛好者的參考書。

呂云翔主編 ·高教教材 ·11.2萬字

Python數(shù)據(jù)挖掘?qū)崙?zhàn)(微課版)
會員

數(shù)據(jù)挖掘旨在發(fā)現(xiàn)蘊(yùn)含在數(shù)據(jù)中的有價(jià)值的數(shù)據(jù)模式、知識或規(guī)律,是目前非常熱門的研究領(lǐng)域。理解數(shù)據(jù)挖掘模型的原理、方法并熟練掌握其實(shí)現(xiàn)技術(shù)是數(shù)據(jù)挖掘從業(yè)者必備的能力。本書從理論模型和技術(shù)實(shí)戰(zhàn)兩個(gè)角度,系統(tǒng)講述數(shù)據(jù)挖掘的基本流程、模型方法、實(shí)現(xiàn)技術(shù)及案例應(yīng)用,幫助讀者系統(tǒng)地掌握數(shù)據(jù)挖掘的核心技術(shù),培養(yǎng)讀者從事數(shù)據(jù)挖掘工作的基本能力。全書共12章,主要內(nèi)容包括數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、特征選擇、基礎(chǔ)分類模型及回歸模型、集成技術(shù)、聚類分析、關(guān)聯(lián)規(guī)則分析、時(shí)間序列挖掘、異常檢測、智能推薦等。除第1章、第2章外,本書以一章對應(yīng)一個(gè)主題的形式完整描述相應(yīng)主題的數(shù)據(jù)挖掘模型,簡潔、清晰地介紹其基本原理和算法步驟,并結(jié)合Python語言介紹數(shù)據(jù)挖掘模型的實(shí)現(xiàn)技術(shù),同時(shí)結(jié)合案例分析數(shù)據(jù)挖掘模型在數(shù)據(jù)挖掘中的應(yīng)用。此外,書中還通過大量的圖、表、代碼、示例幫助讀者快速掌握相關(guān)內(nèi)容。本書適合作為相關(guān)專業(yè)本科生和研究生的數(shù)據(jù)挖掘課程的教材,也可以作為數(shù)據(jù)挖掘技術(shù)愛好者或從業(yè)者的入門參考書。

王磊 邱江濤主編 ·高教教材 ·16.3萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 盐池县| 从江县| 左贡县| 广南县| 博白县| 伊春市| 肃北| 惠水县| 峡江县| 垫江县| 泰州市| 陕西省| 马鞍山市| 澄城县| 五原县| 射洪县| 通化市| 甘谷县| 清水河县| 怀远县| 察隅县| 隆化县| 郧西县| 府谷县| 磐石市| 通河县| 中牟县| 绥阳县| 关岭| 无棣县| 文昌市| 晋城| 汤原县| 临西县| 泾阳县| 唐河县| 固始县| 抚远县| 兰州市| 阳东县| 个旧市|