- Python數據分析從入門到精通
- 李梓萌編著
- 1092字
- 2020-09-18 18:05:50
4.1 使用tablib模塊

在Python程序中可使用第三方模塊tablib將數據導出為不同的文件格式,包括Excel、JSON、HTML、Yaml、CSV和TSV等格式。在使用模塊tablib之前,需要先通過如下命令安裝tablib。

在接下來的內容中,將詳細講解使用tablib模塊的知識。
4.1.1 基本用法
1.創建Dataset(數據集)
在tablib模塊中,使用tablib.Dataset創建一個簡單的數據集對象實例:

接下來就可以填充數據集對象和數據。
2.添加Rows(行)
若想收集一個簡單的人名列表,需輸入下面的代碼。


在Python中可以通過下面的代碼獲取人名。

3.添加Headers(標題)
通過下面的代碼可以在數據集中添加標題。

通過下面的代碼獲取數據集信息。

4.添加Columns(列)
在數據集中可以繼續添加列,如下面的代碼。

通過下面的代碼獲取數據集信息。

5.導入數據
在創建tablib.Dataset對象實例后,可以直接導入已經存在的數據集,下面是導入CSV文件數據的代碼。

在tablib模塊中一旦需要導入數據,只要具備適當的格式化程序導入窗口,就可以從各種不同的文件類型導入數據。
6.導出數據
Tablib模塊的主要功能是將數據導出為不同類型的文件,例如下面的代碼將我們前面創建的數據集導出為CSV文件格式。


通過下面的代碼將數據導出為JSON文件格式。

通過下面的代碼將數據導出為YAML文件格式。

通過下面的代碼將數據導出為Excel文件格式。

4.1.2 操作數據集中的指定行和列
在下面的實例文件Tablib01.py中,演示了使用tablib模塊操作數據集中的指定行和列的過程。
源碼路徑:daima\4\4-1\Tablib01.py

執行后輸出:


4.1.3 刪除并導出不同格式的數據
在下面的實例文件Tablib02.py中,演示了使用tablib模塊刪除數據集中指定數據,并將數據導出為不同文件格式的過程。
源碼路徑:daima\4\4-1\Tablib02.py

執行后輸出:


4.1.4 生成一個Excel文件
在下面的實例文件Tablib03.py中,演示了將tablib數據集導出到新建Excel文件的過程。
源碼路徑:daima\4\4-1\Tablib03.py

執行后創建一個Excel文件excel.xls,里面填充的是數據集中的數據,如圖4-1所示。

圖4-1 創建的Excel文件
4.1.5 處理多個數據集
在現實應用中,有時需要在表格中處理多個數據集集合,如將多個數據集數據導到一個Excel文件中,這時可使用tablib模塊中的Databook實現。如在下面的實例文件Tablib04.py中,不但演示了增加、刪除數據集數據的方法,而且演示了將多個tablib數據集導出到Excel文件的過程。
源碼路徑:daima\4\4-1\Tablib04.py


執行后輸出:


執行后創建Excel文件mydata.xls,其中保存了從數據集中導出的數據,如圖4-2所示。

圖4-2 Excel文件中的數據
4.1.6 使用標簽過濾數據
在使用tablib數據集時,可將一個作為參數的標簽添加到指定行。在后面的程序中可基于任意條件的數據通過這個標簽篩選數據集。如在下面的實例文件Tablib05.py中,演示了使用標簽過濾tablib數據集的過程。
源碼路徑:daima\4\4-1\Tablib05.py

執行后輸出:

4.1.7 分離表格中的數據
當將tablib數據導出到某個格式的文件中時,有時需要將多種數據集對象進行分類。如在下面的實例文件Tablib06.py中,演示了將兩組數據分離導入Excel文件的過程。
源碼路徑:daima\4\4-1\Tablib06.py


執行后會將Tablib分類別導入到Excel文件中,如圖4-3所示。

圖4-3 分離的數據