官术网_书友最值得收藏!

1.3 Python所需的環境搭建

Python的使用需要配置對應的環境,本節將介紹Python環境的選擇和相關環境的安裝、配置。已經配置好Python編程環境的讀者可以直接跳過本節。

1.3.1 Python環境的選擇

對于剛上手的新手來說,Python的安裝、環境配置和各種庫的安裝煩瑣且容易出錯。在這種情況下,Anaconda是個不錯的選擇。它是一個Python的集成環境管理器,包含大部分數據分析中常用的庫,如NumPy、Pandas、scikit-learn等。

簡單地說,我們要用Python來做數據分析,Anaconda就是一個貼心的管家,它已經準備好了絕大多數的東西,我們可以一鍵安裝,直接“拎包入住”。

1.3.2 Anaconda的下載和安裝

1.下載

Anaconda是開源的,可以直接從官網https://www.anaconda.com下載。在如圖1-1所示的界面中選擇合適的操作系統。

圖1-1 Anaconda官網下載頁面

跳轉之后,根據自己的操作系統和版本選擇對應的地址,寫作本書時默認是適配Python 3.9的版本,單擊之后會自動開始下載。

2.安裝

下載好了之后,雙擊打開安裝包,先后單擊Next和I Agree按鈕,如圖1-2所示。

圖1-2 初始安裝選擇

在安裝頁面可以默認選擇All Users選項,如圖1-3所示。因為我們一般都是用自己的計算機,所以選擇Just Me還是All Users差別不大。

圖1-3 安裝用戶選擇

接下來一步的選擇比較重要,我們只勾選下面的那個選項,上面的不勾選,如圖1-4所示,否則可能會出現問題。

等待安裝完畢,中間幾步操作單擊Next按鈕即可。

最后有兩個關于幫助和資源的選項(實際沒什么用),不選,然后單擊Finish按鈕,如圖1-5所示。

圖1-4 安裝的進階選項

圖1-5 安裝完成頁面的選擇

到這一步,我們已經成功安裝了Anaconda。

1.3.3 運行代碼

1.什么是Jupyter Notebook

安裝Anaconda的時候,安裝程序默認幫我們安裝了Jupyter Notebook。

Jupyter Notebook是一個輕量級的程序(IDLE),它以網頁的形式打開,讓我們可以直接在網頁中編寫、導入及運行代碼。它的交互性很強,分小模塊運行代碼可以馬上在網頁中反饋結果,非常方便。其輕便和易用的特點很好地契合了數據分析的使用場景,本書中所有的代碼實踐都是基于Jupyter Notebook進行的。

2.啟動Jupyter Notebook

由于我們剛安裝好Anaconda,單擊計算機左下角(這里以Windows 10為例),“最近添加”模塊顯示了Anaconda相關的內容,如圖1-6所示。

圖1-6 Windows 10的“最近添加”模塊

也可以直接在搜索欄中搜索Jupyter Notebook,打出前幾個字母就會模糊匹配到,如圖1-7所示。

圖1-7 在Windows 10的搜索欄中搜索Jupyter Notebook

單擊Jupyter Notebook圖標,正常情況下頁面會自動跳轉到如圖1-8所示的頁面,中間還會彈出一個小黑框的后臺程序,不要管它,將其最小化即可。

圖1-8 Jupyter Notebook初始頁面

3.創建一個文件

Jupyter Notebook的功能和技巧有很多,我按照最主要的路徑帶大家熟悉一下。

在實際操作中,我們會產生很多的代碼和文檔,因此第一步是創建文件夾,以方便對代碼進行分類。Jupyter Notebook中創建文件夾(Folder)的按鈕在右上角,如圖1-9所示。

圖1-9 在Jupyter Notebook中創建文件夾

文件夾默認是未命名的,可以在選中文件夾之后單擊Rename按鈕來重命名,如圖1-10所示。

圖1-10 Jupyter Notebook文件重命名

然后進入文件夾,創建一個Python文件,如圖1-11所示。

圖1-11 在Jupyter Notebook中創建Python文件

在打開Python文件的界面中有幾個區域:最上面是文件名,單擊即可重命名;中間是文件編輯區,不太常用,因為幾乎都有對應的快捷操作來替代;下面的長條框就是我們編寫和運行代碼的“主戰場”,如圖1-12所示。

4.運行代碼

我們可以在代碼編輯區直接輸入代碼print('Talk is cheap,show me the code'),然后按<Ctrl+Enter>組合鍵來運行代碼,如圖1-13所示。

圖1-12 Jupyter Notebook代碼編輯頁面

圖1-13 按<Ctrl+Enter>組合鍵運行代碼的效果

代碼成功運行并反饋打印結果。一般情況下,我們運行完一個小模塊的代碼之后,還會在新增的代碼框中繼續編寫。如果我們編寫完上面的代碼,按<Alt+Enter>組合鍵來運行,則會在運行代碼的同時新增代碼框,方便后續代碼的編寫,如圖1-14所示。

圖1-14 按<Alt+Enter>組合鍵運行代碼的效果

5.導入外部代碼

除了自己編寫代碼,另一個常用的場景就是導入外部的代碼。這本書所有的代碼我已經整理并打包好了,大家可以通過前言中提供的方式直接下載。將下載后的代碼導入Jupyter Notebook即可運行。

在Jupyter Notebook文件夾下,單擊右上角的Upload按鈕,如圖1-15所示。

圖1-15 導入文件的入口

再選擇對應的路徑和代碼文件,如圖1-16所示。

圖1-16 導入路徑及文件選擇

之后數據清洗.ipynb文件被自動導入Jupyter中,此時只需單擊“上傳”按鈕即可,如圖1-17所示。

圖1-17 最終上傳選項

6.快捷操作一覽

Jupyter Notebook的快捷操作分為命令模式和編輯模式兩種。

當我們單擊代碼區塊左邊的區域,或者在編輯之后按<Esc>鍵時,區塊左側邊框是藍色的,代表命令模式,如圖1-18所示。

圖1-18 命令模式效果

編輯模式則是我們單擊區塊編輯代碼的模式,這時左側邊框呈現綠色,代碼框里有光標閃爍,如圖1-19所示。

圖1-19 編輯模式效果

兩種模式下的快捷鍵Jupyter Notebook已經整理好,分別如圖1-20和圖1-21所示。

圖1-20 命令模式快捷鍵

圖1-21 編輯模式快捷鍵

大家可以把這里的快捷操作一覽看作字典,當在實踐過程中遇到問題時,再來查閱。

為了更好地學習本書內容,讀者最好具備一定的Python基礎知識。不過別擔心,學習本書所需的Python基礎知識并不多,你只要了解Python中的基礎變量、常見數據類型、判斷與循環語句、函數就足夠了。當然,就算你不熟悉這些也沒關系,我特意寫了一個Python極簡教程,以幫助有需要的讀者快速入門。由于Python基礎不是本書的重點,因此不在這里展開,在我的微信公眾號“數據不吹牛”后臺回復關鍵字“Python教程”即可獲取該教程。

主站蜘蛛池模板: 重庆市| 杨浦区| 桦川县| 延庆县| 汾西县| 哈巴河县| 东乌珠穆沁旗| 汶上县| 缙云县| 泊头市| 会泽县| 高州市| 富宁县| 南漳县| 满洲里市| 和硕县| 巢湖市| 宁城县| 碌曲县| 兴国县| 山阳县| 赫章县| 永康市| 逊克县| 光泽县| 亚东县| 麻栗坡县| 葫芦岛市| 平湖市| 福鼎市| 长宁区| 大丰市| 修水县| 冷水江市| 平谷区| 东阳市| 通海县| 高雄市| 库伦旗| 华池县| 金沙县|