- Python數據挖掘入門與實踐
- Robert Layton
- 1463字
- 2020-01-10 15:40:58
1.2 使用Python和IPython Notebook
本節將介紹Python的安裝方法,及本書所用到的開發環境IPython Notebook的搭建方法。此外,還將安裝第一部分示例代碼所用到的numpy庫。
1.2.1 安裝Python
Python是一門出色的、應用范圍廣泛且簡單易用的編程語言。
本書將使用Python 3.4版本,你可以根據自己的系統從Python官網https://www.python.org/downloads/下載合適的版本。
Python主要有兩大版本Python 3.4和Python 2.7。記得要下載安裝Python 3.4,本書所有代碼都在該版本中測試過。
本書假定讀者了解編程和Python相關知識。本書不要求你是Python編程高手,當然有較多的知識儲備學起來更容易。
如果你沒有任何編程經驗,我建議你先看看《Python學習手冊》。
Python官網為新手準備了兩份在線教程。
? 非程序員背景,想通過Python學習編程:
https://wiki.python.org/moin/BeginnersGuide/NonProgrammers
? 程序員背景,想專門學習Python:
https://wiki.python.org/moin/BeginnersGuide/Programmers
Windows用戶設置好環境變量后,才能在命令行中使用Python。方法如下。首先,找到Python 3的安裝路徑,默認為C:\Python34。接下來,在命令行(cmd程序)中輸入以下命令:將環境設置為PYTHONPATH=%PYTHONPATH%; C:\Python34
。如果你將Python安裝到其他路徑下,請根據實際情況調整上述命令中的C:\Python34。
安裝好Python,打開命令提示符,輸入以下命令:
$ python3 Python 3.4.0 (default, Apr 112014, 13:05:11) [GCC 4.8.2] on Linux Type "help", "copyright", "credits" or "license" for more information. >>> print("Hello, world!") Hello, world! >>> exit()
請注意,我們用美元符號($)表示緊跟在后面的語句是一條命令,要輸入到終端(Unix系統中的shell,Windows系統中的cmd程序)。美元符號及后面的空格無須輸入。輸入后面的內容,然后敲回車執行命令。
運行完經典的“Hello, world!”例子后,退出Python,繼續安裝用來運行Python代碼的更為高級的開發環境IPython Notebook。
Python 3.4內置了Python的包管理器pip,用它來安裝Python包很方便。使用$ pip3 freeze
命令可以驗證pip是否能正常運行,該命令還會輸出你用它安裝過哪些包。
1.2.2 安裝IPython
Python開發平臺IPython提供多種Python開發工具和開發環境,比標準解釋器多出好多功能。IPython Notebook功能強大,有了它,你就可以在Web瀏覽器中編寫程序。它會為代碼添加樣式,顯示運行結果,允許你為代碼添加注釋。用它來做數據分析再好不過,我們將把它作為主要的開發環境。
請在命令提示符后(注意不是Python中),輸入以下命令安裝IPython:
$ pip install ipython[all]
如果要為系統所有用戶安裝IPython,需要管理員權限。如果你只想自己用或者沒有權限做系統級別的變更,則使用以下命令為當前用戶安裝即可:
$ pip install --user ipython[all]
以上命令只為當前用戶安裝IPython——該系統的其他用戶將無法使用。安裝過程中若遇到問題,請查閱官方文檔,了解更多幫助信息:http://ipython.org/install.html。
安裝好IPython Notebook后,運行方式如下:
$ ipython3 notebook
上述命令幫你做了兩件事。首先,在命令提示符界面創建一個IPython Notebook實例。其次,打開Web瀏覽器,連接到實例,你可以在此創建新的筆記本文件。Notebook界面如下圖所示(注意圖中的home/bob為當前用戶的主目錄,你看到的是自己的主目錄,所以目錄名稱很可能不同)。

IPython Notebook的關閉方法如下:打開運行實例的終端界面(就是你之前用IPython命令創建Notebook實例的界面),按下Ctrl+C鍵,系統提示Shutdown this notebook server (y/[n])?,詢問你是否關閉筆記本服務器。輸入y,敲回車,IPython Notebook就會關閉。
1.2.3 安裝scikit-learn庫
scikit-learn是用Python開發的機器學習庫,它包含大量機器學習算法、數據集、工具和框架。它以Python科學計算的相關工具集為基礎,其中numpy和scipy等都針對數據處理任務進行過優化,因此scikit-learn速度快、擴展性強,新手會覺得它很好用,老手也不會覺得它功能遜色。更多內容請見第2章。
scikit-learn庫可用Python 3提供的pip工具進行安裝,之前沒有安裝NumPy和SciPy的話,也會順便安裝。用管理員/根用戶權限打開一個終端,然后輸入以下命令:
$ pip3 install -U scikit-learn
Windows用戶在安裝scikit-learn之前,可能需要先安裝NumPy和SciPy。安裝指南請見http://www.scipy.org/install.html。
Ubuntu或紅帽(Red Hat)等Linux系統的用戶也許希望用自帶的包管理器安裝scikit-learn,但是它們提供的版本很可能不是最新的,所以在安裝前需仔細核對版本。本書使用的版本不能低于0.14,否則書中代碼可能無法運行。
如何通過編譯源文件進行安裝,以及更多的安裝指南,請見官方文檔:
- Drupal 7 Multilingual Sites
- 圖解PLC控制系統梯形圖和語句表
- 大型數據庫管理系統技術、應用與實例分析:SQL Server 2005
- OpenStack Cloud Computing Cookbook(Second Edition)
- AutoCAD 2012中文版繪圖設計高手速成
- INSTANT Autodesk Revit 2013 Customization with .NET How-to
- 完全掌握AutoCAD 2008中文版:機械篇
- Splunk Operational Intelligence Cookbook
- Ruby on Rails敏捷開發最佳實踐
- Azure PowerShell Quick Start Guide
- 深度學習與目標檢測
- 在實戰中成長:C++開發之路
- 計算機組成與操作系統
- INSTANT VMware vCloud Starter
- 電腦上網入門