官术网_书友最值得收藏!

內容提要

本書以項目為導向,以任務為驅動,較為全面地介紹了不同場景、不同平臺使用Python爬取網絡數據的方法,涉及靜態網頁、動態網頁、登錄后才能訪問的網頁、PC客戶端、App客戶端等。全書共7個項目,項目1介紹爬蟲與反爬蟲的基本概念,以及Python爬蟲環境的配置;項目2介紹爬取過程中涉及的網頁基礎知識;項目3介紹在靜態網頁中爬取數據的過程;項目4介紹在動態網頁中爬取數據的過程;項目5介紹對登錄后才能訪問的網頁進行模擬登錄的方法;項目6介紹爬取PC客戶端和App客戶端數據的方法;項目7介紹使用Scrapy爬蟲框架爬取數據的過程。本書所有項目都包含實訓與課后習題,通過練習和操作實戰,讀者可鞏固所學的內容。

本書可以作為“1+X”證書制度試點工作中的大數據應用開發(Python)職業技能等級證書(中級)的參考書,也可以作為高校大數據技術類專業的教材和大數據技術愛好者的自學用書。

主站蜘蛛池模板: 定西市| 大连市| 大英县| 锡林郭勒盟| 易门县| 得荣县| 莱芜市| 灯塔市| 巍山| 略阳县| 贺兰县| 德阳市| 辰溪县| 呼伦贝尔市| 岳普湖县| 仁布县| 太康县| 满城县| 丁青县| 石楼县| 康马县| 利辛县| 天柱县| 濉溪县| 伊宁县| 鹤壁市| 广水市| 洛南县| 葫芦岛市| 陆川县| 遂宁市| 南溪县| 宝兴县| 伊宁县| 图片| 西平县| 潼关县| 洛隆县| 宜良县| 天柱县| 宜阳县|