官术网_书友最值得收藏!

Python網(wǎng)絡(luò)爬蟲:從入門到精通

本書主要介紹如何使用Python語言進(jìn)行網(wǎng)絡(luò)爬蟲程序的開發(fā),從Python語言的基本特性入手,詳細(xì)介紹Python網(wǎng)絡(luò)爬蟲開發(fā)的多個(gè)方面,涉及HTTP、HTML、正則表達(dá)式、JavaScript、自然語言處理、數(shù)據(jù)處理與科學(xué)計(jì)算等不同領(lǐng)域的內(nèi)容。全書共12章,包括基礎(chǔ)篇、進(jìn)階篇、提高篇和實(shí)戰(zhàn)篇4個(gè)部分。基礎(chǔ)篇包括第1、2、3章,分別為Python基礎(chǔ)及網(wǎng)絡(luò)爬蟲、靜態(tài)網(wǎng)頁抓取、數(shù)據(jù)存儲(chǔ)。進(jìn)階篇包括第4、5、6章,分別為JavaScript與動(dòng)態(tài)內(nèi)容、模擬登錄與驗(yàn)證碼、爬蟲數(shù)據(jù)的分析與處理。提高篇包括第7、8、9章,分別為爬蟲的靈活性和多樣性、Selenium模擬瀏覽器與網(wǎng)站測試、爬蟲框架Scrapy與反爬蟲。實(shí)戰(zhàn)篇提供了3個(gè)實(shí)戰(zhàn)項(xiàng)目供讀者學(xué)習(xí)參考。本書內(nèi)容覆蓋網(wǎng)絡(luò)數(shù)據(jù)抓取與爬蟲編程中的主要知識(shí)和前沿技術(shù)。同時(shí),本書在重視理論基礎(chǔ)的前提下,從實(shí)用性和豐富度出發(fā),結(jié)合實(shí)例演示爬蟲程序編寫的核心流程,將理論與實(shí)踐結(jié)合,力求提高讀者的網(wǎng)絡(luò)爬蟲實(shí)操技能。本書可作為高等院校數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、軟件工程等相關(guān)專業(yè)課程的教材,也可作為Python語言初學(xué)者、網(wǎng)絡(luò)爬蟲技術(shù)愛好者的參考書。

呂云翔主編 ·高教教材 ·11.2萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 湖州市| 大城县| 同江市| 鸡泽县| 双流县| 寻甸| 舞阳县| 乌苏市| 芷江| 长岛县| 吉首市| 泾源县| 甘孜| 砀山县| 青浦区| 东丰县| 阜宁县| 石林| 湟源县| 花莲县| 达州市| 信宜市| 呼和浩特市| 雷山县| 鄱阳县| 海门市| 万全县| 安康市| 龙海市| 新疆| 鞍山市| 区。| 滨州市| 临安市| 沾益县| 玉环县| 黎平县| 五常市| 西吉县| 托克托县| 沙湾县|