- Python網絡爬蟲與數據分析從入門到實踐
- 馬國俊
- 1817字
- 2024-12-28 12:00:32
1.1 搭建Python開發環境
在搭建Python開發環境時,一般需要做三件事情,即安裝Python解釋器、搭建集成開發環境和安裝第三方庫。
安裝解釋器的目的是為了解釋Python語言,搭建集成開發環境的目的是為了提升開發效率,而安裝第三方庫的目的是為了開發Python核心庫不能支持的業務功能。
1.1.1 安裝Python解釋器
由于我們是在Windows系統上進行開發,所以可以到官網https://www.python.org/downloads/windows/下載基于Windows的Python解釋器,本書使用的是最新版的解釋器3.10.2版本,下載頁面如圖1.1所示。

圖1.1 在官網上下載解釋器的示意圖
在上述下載鏈接里包含32-bit字樣的解釋器版本只適用于32位操作系統,而包含64-bit字樣的解釋器則適用于64位操作系統。現在的Windows操作系統大多是64位的,所以建議讀者選擇含64-bit字樣的下載包。
下載并安裝完成后,可以在安裝路徑里看到python.exe,比如筆者電腦的安裝路徑是C:\Users\think\AppData\Local\Programs\Python\Python310,安裝后,建議把該路徑添加到環境變量Path中,這樣讀者就可以在命令窗口的任何路徑執行python.exe命令。
提示
添加環境變量的方法是:
①右擊桌面上的“計算機”圖標,選擇“屬性”,在打開的窗口中,再單擊“高級系統設置”選項。
②打開“高級系統設置”對話框,選擇“高級”選項卡,再單擊“環境變量”按鈕,打開“環境變量”對話框。
③在環境變量對話框的“系統變量”一欄中找到path選項,雙擊后打開“環境系統變量”對話框。
④在“變量值”文本框中加入Python的安裝目錄(即完成path配置),方法是在已有變量值的后面加入“;”(半角分號),再加入安裝路徑。
1.1.2 安裝第三方開發包
Python解釋器包含不少默認庫,通過引用這些默認的庫,開發者能開發比較基礎的程序。此外,如果要開發核心包之外具有比較復雜功能的程序,比如要開發數據分析或爬蟲等程序,則需要下載對應的第三方開發包,比如,科學計算包NumPy、數據處理包Pandas、數據可視化包Matplotlib包等,具體的下載步驟如下:
步驟01 在CMD命令窗口中,進入到Python解釋器所在路徑,比如本書是C:\Users\think\AppData\Local\Programs\Python\Python310,在此路徑中,再進入Scripts路徑,在其中能看到pip3.exe文件。
步驟02 通過pip3 install包名的方式,安裝第三方包,比如要安裝NumPy包,對應的命令是pip3 install numpy。pip3命令會下載對應的第三方包,下載后直接在本地安裝即可。
步驟03 通過pip3命令安裝好對應的第三方包后,可以通過pip3 list命令確認安裝結果,并查看安裝包的版本,具體如圖1.2所示。

圖1.2 通過pip3命令查看NumPy安裝包
在本書后續章節中,因為需要運行爬蟲和數據分析等的程序,所以會用到許多第三方包,比如在介紹可視化編程時會用到Matplotlib包。
對此,在使用這些第三方包之前,本書會提示要用pip3命令安裝此包,比如要通過pip3 install命令安裝Scrapy等包。看到此類文字時,讀者可以用上文給出的方法,下載并安裝對應的包。
1.1.3 在PyCharm里設置解釋器
PyCharm是Python的集成開發工具,通過該工具程序員可以高效地開發并調試Python代碼。讀者可以到https://www.jetbrains.com/pycharm/官網下載并安裝該集成開發工具。
請注意,PyCharm工具會自帶Python解釋器,但未必是最新版的,所以建議讀者在PyCharm集成開發環境里,不要使用它自帶的默認解釋器,而是使用自己安裝的3.10.2版本的解釋器(參照前一節的說明)。
具體做法是,打開PyCharm工具,依次單擊菜單選項“File→Settings”,打開如圖1.3所示的設置界面。

圖1.3 設置解釋器的界面
在設置界面的左側,用鼠標右鍵單擊當前項目名,并選中“Project Interpreter”,在設置界面的右側,我們可以更改解釋器和查看該解釋器所包含的第三方包。
如果本項目所需要的第三方包不包含在當前解釋器里,則可以根據1.1.2節所述,通過pip3命令安裝,安裝好后再次打開如圖1.3所示的設置界面,就能看到所需要的包。
1.1.4 在PyCharm里新建項目和文件
下載并安裝PyCharm集成開發環境后,可以按如下步驟新建Python開發項目和以py為擴展名的Python開發文件。
步驟01 打開PyCharm,能看到如圖1.4所示的歡迎界面,單擊“Create New Project”選項可新建Python項目。如果已經有創建好的項目,則可以通過“Open”選項打開。

圖1.4 PyCharm的歡迎界面
步驟02 在隨后彈出的窗口的左側,選擇“Pure Python”項,在Location字段中,輸入待創建項目的位置和項目名,其中chapter1是項目名。
在“Project Interpreter”項里,選擇本項目所用到的解釋器。這里可以選用默認的,也可以使用1.1.1節中安裝好的Python解釋器。完成后可單擊下方的Create按鈕創建項目。
步驟03 如圖1.5所示,在創建好的chapter1項目上右擊,選擇“New→Python File”菜單命令,創建一個Python文件。

圖1.5 在Python項目里創建文件
并在隨后彈出的對話框中輸入文件名:HelloPython,如圖1.6所示。

圖1.6 輸入文件名
步驟04 在隨后創建好的該文件里輸入代碼,即“print("Hello World Python")”打印語句,具體效果如圖1.7所示,請注意該行語句沒有縮進。

圖1.7 在文件里編寫打印語句
步驟05 在PyCharm工具的空白處,右擊,在隨后彈出的菜單里選擇“Run 'HelloPython'”選項運行代碼。運行后即可在控制臺看到“Hello World Python”的輸出,如圖1.8所示。

圖1.8 查看運行結果
- UNIX編程藝術
- Delphi程序設計基礎:教程、實驗、習題
- JavaScript:Functional Programming for JavaScript Developers
- CentOS 7 Linux Server Cookbook(Second Edition)
- Podman實戰
- 精通Python自然語言處理
- Mastering Business Intelligence with MicroStrategy
- 一本書講透Java線程:原理與實踐
- HTML5+CSS3+JavaScript 從入門到項目實踐(超值版)
- Go語言入門經典
- INSTANT JQuery Flot Visual Data Analysis
- Developing Java Applications with Spring and Spring Boot
- 精通Oracle 12c 數據庫管理
- Learning RxJava
- 項目實踐精解:Java核心技術應用開發