- 深度學習自然語言處理實戰
- 開課吧組編 張楠 蘇南 王貴陽等編著
- 3298字
- 2021-04-22 17:09:10
2.1 環境配置
本書使用PyTorch深度學習框架進行講解,因此,在使用之前,需要在計算機或者服務器端進行環境配置。
2.1.1 Anaconda
Anaconda中集成了大部分經常使用的第三方庫,并且可以很方便地獲取所需要的其他庫以便進行管理。同時,也可以很方便地對現存的庫進行管理。Anaconda在pip install命令的基礎上加入了conda install命令,更加方便快捷。如果需要對已安裝的庫進行查詢,可以使用conda list命令。
Anaconda官方提供了基于Windows、macOS和Linux三個平臺的版本,且可以選擇基于Python 3.7或2.7的發行版,建議選擇基于Python 3.7的版本進行學習。
目前的Anaconda可以在macOS、Windows和Linux系統下進行安裝,硬件要求是32位或64位的系統,需要3GB的存儲空間來存放安裝包。當前大部分用戶的計算機都能滿足安裝條件。
(1)在macOS系統上的安裝
在所有的macOS系統上,建議優先選擇Anaconda圖形界面進行安裝。安裝步驟如下所示:
1)下載安裝包。在Anaconda官方網站找到下載界面,如圖2-1所示,單擊“64-Bit Graphical Installer”按鈕進行下載。

●圖2-1 Anaconda官方網站
2)校驗安裝包。下載完成之后,可以選擇使用SHA-256來校驗Anaconda安裝文件的數據完整性,這將生成安裝文件的SHA-256加密哈希。通過與官網提供的哈希表進行匹配來決定是否進行安裝,如果匹配無誤,就可以開始下一步安裝;如果不匹配,則需要再次下載。Anaconda官網提供的哈希匹配對應表如圖2-2所示。

●圖2-2 Anaconda官網提供的哈希匹配對應表
這一步在實際安裝過程中會被大部分人忽略,筆者建議在安裝前進行校驗以防安裝軟件有錯誤。如果不提前進行校驗的話,在后期的安裝過程中可能出現問題,那樣就將浪費大量的時間來解決軟件問題,這將得不償失。
3)安裝過程。驗證匹配完成之后,雙擊下載文件。如圖2-3所示,進入如下界面,開始安裝。

●圖2-3 安裝界面(一)
單擊“Continue”按鈕后開始進行安裝。進入安裝界面后,如圖2-4所示,連續單擊出現的“Continue”按鈕進入到如下界面。

●圖2-4 安裝界面(二)
單擊“Agree”按鈕進行到下一步安裝。
如圖2-5所示,可以選擇繼續安裝,那么Anaconda就會安裝在默認的用戶目錄下,如果需要進行更改的話,可以單擊“Change Install Location”按鈕進行更改。

●圖2-5 安裝界面(三)
單擊“Change Install Location”按鈕后進入更改安裝目錄的界面,如圖2-6所示。在此界面下選擇“Install for me Only”選項繼續安裝,但是一般不建議選擇這種安裝方法。

●圖2-6 安裝界面(四)
如果收到如圖2-6所示的錯誤消息如“You cannot install Anaconda3 in this location…”,解決方法是單擊一下“Install on a specific disk”選項,再次單擊“Install for me only”選項,然后進入如圖2-7所示的界面,單擊“Continue”按鈕繼續安裝。

●圖2-7 安裝界面(五)
進入如圖2-8所示界面后,單擊“Install”按鈕開始安裝。

●圖2-8 安裝界面(六)
在安裝過程中,可以選擇為Anaconda安裝Pycharm,但是建議在Anaconda安裝完成后再到Pycharm官網進行下載安裝。所以在這里選擇不帶Pycharm的Anaconda,單擊“Con-tinue”按鈕繼續安裝。
4)安裝成功。成功安裝完成后會顯示如圖2-9所示的界面。

●圖2-9 完成安裝界面
5)驗證安裝。在Terminal中輸入命令“conda list”,如果安裝成功,則會顯示已經安裝好的包和對應的版本號,如圖2-10所示。

●圖2-10 conda list命令
在Terminal中輸入“python”,會進入Python的交互界面,并顯示已安裝的Python的版本號,如圖2-11所示。

●圖2-11 Python環境
6)完成安裝。打開Terminal,輸入命令“jupyter notebook”然后按回車鍵,看看是否會在自己的瀏覽器中出現如圖2-12所示的界面。

●圖2-12 Jupyter Notebook界面
如果出現類似界面,就可以通過新建“Python 3”文件開始繼續學習!
有些讀者在macOS上習慣使用命令行安裝程序,那么可以下載“64-bit Command Line Installer”,然后在Terminal中使用相關命令進行安裝。后續安裝過程與圖形界面安裝基本一致。
(2)在Windows系統上的安裝
在Windows系統上的安裝過程與在macOS上的安裝過程基本一致。如圖2-13所示,有一個要注意的地方是,在安裝的過程中需要選擇“Add Anaconda3 to my PATH environment variable”復選按鈕,將安裝的Anaconda添加到環境變量中,以便在后續使用時進行調用。

●圖2-13 在Windows系統上安裝Anaconda
同時,也可以選擇“Register Anaconda3 as my default Python 3.7”復選按鈕,將此Ana-conda作為Windows系統下默認的Python編輯器。如果這兩步沒有在安裝過程中完成,那么在安裝完成后需要將Anaconda安裝的路徑添加到系統的環境變量中才能夠完成后續的調用。
(3)在Linux系統上的安裝
在Linux系統上的安裝與macOS系統的安裝基本一致。但是,由于要在不同的Linux發行版中安裝圖形界面顯示包,因此,建議在Linux系統下通過命令的方式來對下載的sh文件進行安裝。安裝與驗證安裝的過程與macOS基本一致。
2.1.2 英偉達GPU驅動+CUDA+cuDNN
安裝完Anaconda之后,如果是處理很小的數據集,可以在CPU上進行運算,但是當需要用到一些比較大的數據集或者深層網絡時,推薦使用圖形處理器(Graphics Processing Unit,GPU)加速運算。需要說明的是,PyTorch框架需要在英偉達(Nvidia)的GPU上才可以很好地被驅動。無論讀者使用什么系統,在有條件的前提下,建議使用集成的服務器進行運算。如果計算機配置有比較好的GPU,且使用的系統為Windows或Linux,則需要進行如下的安裝以便進一步使用。
以下為在Windows 10系統上的安裝指引。
(1)硬件檢查
查看自己的GPU型號。右鍵單擊“This PC”(我的電腦),選中“Properties”(屬性),選擇“Device Manager”(設備管理器),選擇“Display adapters”(顯示適配器)進行查看。一般會顯示兩個顯卡,一個是主板上的集成顯卡,另一個是獨立顯卡,查看獨立顯卡的型號,如圖2-14所示。

●圖2-14 獨立顯卡型號查詢
(2)下載安裝驅動和CUDA
根據Nvidia官網提供的CUDA Toolkit-Driver Version查詢對應版本的英偉達顯卡驅動,如圖2-15所示。

●圖2-15 Nvidia官網提供的顯卡驅動查詢
在英偉達官網查找到對應的系統,下載相應GP U型號下的驅動安裝包并安裝,如圖2-16所示。

●圖2-16 英偉達顯卡驅動下載
如圖2-17所示,下載對應的CUDA版本并安裝。

●圖2-17 CUDA版本下載
下載對應的cuDNN包,解壓后復制到CUDA安裝目錄中,一般在“C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.2”(讀者必須根據自己的實際地址進行更改),如圖2-18所示。

●圖2-18 CUDA版本
添加CUDA到計算機的環境變量中,具體設置如圖2-19、圖2-20所示。

●圖2-19 添加環境變量(一)

●圖2-20 添加環境變量(二)
(3)校驗安裝結果
完成安裝后,打開命令行窗口,然后輸入命令“nvcc-V”查看。
如果出現了安裝的CUDA版本號(見圖2-21),則說明已經將所需要的英偉達驅動-CUDA安裝完成。

●圖2-21 檢查安裝結果
2.1.3 PyTorch安裝
在完成Anaconda和GPU的安裝之后,就可以開始安裝PyTorch框架。這個過程非常簡單,打開PyTorch的官網,從單擊“Get Started”按鈕進入安裝界面,然后選擇與計算機匹配的環境和系統,在Terminal中輸入相應的命令即可,如圖2-22所示。

●圖2-22 PyTorch版本
需要說明的是,對于macOS系統,沒有與之對應的GPU版本的PyTorch,因此需要安裝CPU版本的PyTorch。對于Windows和Linux系統,可以選擇安裝GPU或者CPU版本的PyTorch。
如果需要以前的版本,可以選擇“Previous versions of PyTorch”。
2.1.4 Python IDE選擇
對于大部分的初學者而言,在最開始選擇專業的集成開發環境(Integrated Development Environment,IDE)非常重要,但是哪種IDE對于初學者是最友好的,每個研究者都有自己的見解。因此,本書僅推薦筆者日常使用的兩種IDE:PyCharm和Visual Studio Code。
(1)PyCharm
PyCharm是專業開發者比較常用的一款Python IDE,它集成了一系列在開發過程中必備的工具,如語法高亮、Project管理、自動填充、單元測試、Debug,等等。同時,PyCharm也支持集成版本控制、Django開發等。
相比于其他的編輯器,Pycharm具有如下優勢:
1)編碼協助。
PyCharm可以協助使用者進行代碼補全,支持代碼折疊和分割窗口的功能,從而幫助使用者更快地完成編碼工作。
2)代碼導航
使用快捷鍵可以幫助使用者快速找到函數所對應的代碼塊,也可以幫助使用者從一個文件導航到另一個文件。
3)代碼Debug分析
使用PyCharm自帶的編碼語法、錯誤高亮、智能檢測以及一鍵式代碼快速補全建議,可以使編碼更優化。
4)支持Django
通過PyCharm自帶的HTML、CSS和JavaScript編輯器,使用者可以更快速地通過Django框架進行Web開發。此外,它還能支持CoffeeScript、Mako和Jinja2等語言。
5)集成版本控制
登錄、退出、視圖拆分與合并——所有這些功能都能在其統一的版本控制系統的用戶界面(可用于Mercurial、Subversion、Git、P erforce和其他的源代碼管理服務器)中實現。
6)圖形頁面調試器
使用者可以用其自帶的、功能全面的調試器對Python或者Django應用程序以及測試單元進行調整,該調試器帶有斷點、步進、多畫面視圖、窗口以及評估表達式。
7)可自定義、可擴展
綁定了TextMate、NetBeans、Eclipse與Emacs鍵盤主盤,以及Vi/Vim仿真插件。
(2)Visual Studio Code
Visual Studio Code是微軟公司發布的一款Python IDE,也屬于開發者經常使用的IDE。這款IDE的最大特點是輕量化,對計算機的性能要求比較低,并且支持插件,比較方便。
還有部分開發者會使用Vim進行項目開發,值得注意的是選擇哪種Python IDE并不是最重要的,重要的是在初期能夠適合自己使用。讀者在完成安裝后應盡快進行開發,切勿在選擇和安裝IDE工具上浪費大量的時間。
- Painter 現代服裝效果圖表現技法
- Photoshop CC 網店視覺設計
- 中文版Rhino 5.0完全自學教程(第3版)
- Building Websites with ExpressionEngine 1.6
- Photoshop 2024從入門到精通
- OpenCart 1.4 Template Design Cookbook
- JBoss Tools 3 Developers Guide
- 中文版Flash CS6動畫制作(慕課版)
- Moodle Course Conversion: Beginner's Guide
- Adobe創意大學Premiere Pro產品專家認證標準教材(CS6修訂版)
- 玩轉微信5.0
- Instant GSON
- 從零開始:Photoshop CC 2019設計基礎+商業設計實戰
- Sage ACT! 2012 Cookbook
- Photoshop CC 從入門到精通