官术网_书友最值得收藏!

Python網(wǎng)絡(luò)爬蟲:從入門到精通

本書主要介紹如何使用Python語言進(jìn)行網(wǎng)絡(luò)爬蟲程序的開發(fā),從Python語言的基本特性入手,詳細(xì)介紹Python網(wǎng)絡(luò)爬蟲開發(fā)的多個方面,涉及HTTP、HTML、正則表達(dá)式、JavaScript、自然語言處理、數(shù)據(jù)處理與科學(xué)計算等不同領(lǐng)域的內(nèi)容。全書共12章,包括基礎(chǔ)篇、進(jìn)階篇、提高篇和實(shí)戰(zhàn)篇4個部分。基礎(chǔ)篇包括第1、2、3章,分別為Python基礎(chǔ)及網(wǎng)絡(luò)爬蟲、靜態(tài)網(wǎng)頁抓取、數(shù)據(jù)存儲。進(jìn)階篇包括第4、5、6章,分別為JavaScript與動態(tài)內(nèi)容、模擬登錄與驗證碼、爬蟲數(shù)據(jù)的分析與處理。提高篇包括第7、8、9章,分別為爬蟲的靈活性和多樣性、Selenium模擬瀏覽器與網(wǎng)站測試、爬蟲框架Scrapy與反爬蟲。實(shí)戰(zhàn)篇提供了3個實(shí)戰(zhàn)項目供讀者學(xué)習(xí)參考。本書內(nèi)容覆蓋網(wǎng)絡(luò)數(shù)據(jù)抓取與爬蟲編程中的主要知識和前沿技術(shù)。同時,本書在重視理論基礎(chǔ)的前提下,從實(shí)用性和豐富度出發(fā),結(jié)合實(shí)例演示爬蟲程序編寫的核心流程,將理論與實(shí)踐結(jié)合,力求提高讀者的網(wǎng)絡(luò)爬蟲實(shí)操技能。本書可作為高等院校數(shù)據(jù)科學(xué)、統(tǒng)計學(xué)、計算機(jī)科學(xué)、軟件工程等相關(guān)專業(yè)課程的教材,也可作為Python語言初學(xué)者、網(wǎng)絡(luò)爬蟲技術(shù)愛好者的參考書。

呂云翔主編 ·高教教材 ·11.2萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 沙坪坝区| 大名县| 聊城市| 建湖县| 石家庄市| 泸州市| 南安市| 阆中市| 汤原县| 湘阴县| 洱源县| 景东| 吴桥县| 抚松县| 舞阳县| 博白县| 海晏县| 星座| 和龙市| 兴业县| 同心县| 汤原县| 基隆市| 张家口市| 稻城县| 峨眉山市| 乃东县| 资兴市| 鄂托克前旗| 通城县| 集安市| 涪陵区| 朝阳市| 陇西县| 嘉善县| 乌恰县| 苏尼特左旗| 彭山县| 若羌县| 游戏| 临猗县|