- Python網絡爬蟲技術(第2版·微課版)
- 池瑞楠 張良均主編
- 984字
- 2023-11-16 17:59:22
前言
PREFACE
“數字經濟”時代,數據資源已經成為互聯網企業經營的生產要素,而獲取數據資源并基于此產出有價值的數據,已成為企業提升核心競爭力的關鍵。企業能夠收集、獲取的數據越多,越有可能在行業中占據優勢地位。行業的發展帶動了崗位需求的增長,工作中對網絡爬蟲技術的需求越來越多,爬蟲工程師崗位涌現。網絡爬蟲技術與數據分析、數據挖掘、人工智能等技術緊密關聯,是從互聯網上批量獲取數據的重要技術之一,網絡爬蟲、數據采集等課程也成為眾多高校大數據相關專業的重要課程。
Python語言因其簡單、易讀、可擴展的特性,在編寫爬蟲程序方面有特別的優勢。本書以Python語言為工具來介紹爬蟲技術,讀者無須掌握太多技術就可以快速上手,并能快速看到成果。
第2版教材與第1版教材的區別
結合近幾年Python語言的發展情況和廣大讀者的意見反饋,本書在保留第1版原書特色的基礎上,進行了全面的升級,修訂的主要內容如下。
·體例結構由章節式修改為項目任務式。
·將Python版本由Python 3.6.0升級為Python 3.8.5;將MySQL版本由MySQL 5.6.39升級為MySQL 8.0.13;將MongoDB版本由MongoDB 3.4升級為MongoDB 5.0.13。
·每個項目中增設了項目背景、思維導圖、思考題。
·項目1中新增了PyCharm的配置等內容。
·任務2.1由介紹Python網絡編程更新為介紹網頁基礎知識。
·項目4新增了圖片數據的獲取方法。
·更新了項目5和項目6的項目案例。
·更新了全書的實訓和課后習題。
本書特色
本書全面貫徹黨的二十大報告精神,堅持以為黨育人、為國育才為己任,以社會主義核心價值觀為指引,尊重人才培養時代性、規律性、創造性,內容契合“1+X”證書制度試點工作中的大數據應用開發(Python)職業技能等級證書(中級)考核標準。本書從初學者的角度出發,以項目為導向,將Python爬蟲常用技術和真實項目相結合,循序漸進地講解學習網絡爬蟲必備的基礎知識,以及一些爬蟲庫、框架的基本用法。本書設計時以應用為中心,圍繞真實項目展開,讓讀者明確如何利用所學知識來解決問題,并可通過實訓和課后習題鞏固所學知識,使讀者真正理解并能夠應用所學知識。本書大部分項目緊扣任務需求展開,不堆積知識點,著重于思路的啟發與解決方案的實施。通過從任務需求到實現這一完整工作流程的體驗,讀者將真正理解與掌握Python網絡爬蟲技術。
本書適用對象
·開設有網絡爬蟲、數據采集課程的高校的教師和學生。
·Python程序開發相關人員。
·進行數據采集應用研究的科研人員。
·“1+X”證書制度試點工作中的大數據應用開發(Python)職業技能等級證書(中級)考生。