Python網(wǎng)絡(luò)爬蟲:從入門到精通
本書主要介紹如何使用Python語(yǔ)言進(jìn)行網(wǎng)絡(luò)爬蟲程序的開發(fā),從Python語(yǔ)言的基本特性入手,詳細(xì)介紹Python網(wǎng)絡(luò)爬蟲開發(fā)的多個(gè)方面,涉及HTTP、HTML、正則表達(dá)式、JavaScript、自然語(yǔ)言處理、數(shù)據(jù)處理與科學(xué)計(jì)算等不同領(lǐng)域的內(nèi)容。全書共12章,包括基礎(chǔ)篇、進(jìn)階篇、提高篇和實(shí)戰(zhàn)篇4個(gè)部分?;A(chǔ)篇包括第1、2、3章,分別為Python基礎(chǔ)及網(wǎng)絡(luò)爬蟲、靜態(tài)網(wǎng)頁(yè)抓取、數(shù)據(jù)存儲(chǔ)。進(jìn)階篇包括第4、5、6章,分別為JavaScript與動(dòng)態(tài)內(nèi)容、模擬登錄與驗(yàn)證碼、爬蟲數(shù)據(jù)的分析與處理。提高篇包括第7、8、9章,分別為爬蟲的靈活性和多樣性、Selenium模擬瀏覽器與網(wǎng)站測(cè)試、爬蟲框架Scrapy與反爬蟲。實(shí)戰(zhàn)篇提供了3個(gè)實(shí)戰(zhàn)項(xiàng)目供讀者學(xué)習(xí)參考。本書內(nèi)容覆蓋網(wǎng)絡(luò)數(shù)據(jù)抓取與爬蟲編程中的主要知識(shí)和前沿技術(shù)。同時(shí),本書在重視理論基礎(chǔ)的前提下,從實(shí)用性和豐富度出發(fā),結(jié)合實(shí)例演示爬蟲程序編寫的核心流程,將理論與實(shí)踐結(jié)合,力求提高讀者的網(wǎng)絡(luò)爬蟲實(shí)操技能。本書可作為高等院校數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、軟件工程等相關(guān)專業(yè)課程的教材,也可作為Python語(yǔ)言初學(xué)者、網(wǎng)絡(luò)爬蟲技術(shù)愛好者的參考書。
·11.2萬字