官术网_书友最值得收藏!

5.1 Apache Superset可視化分析

Apache Superset是Python基于Web的開源BI工具,具有十分強大的可視化功能,通過直觀的界面,提供多種可視化方法進行數據分析,并且制作了互動看板,讓使用者可以深入地分析這些數據。本節將詳細介紹SQL Lab提取數據的步驟及Superset如何制作報表與看板等內容。

5.1.1 SQL Lab提取數據

Apache Superset中的SQL Lab是一個強大的SQL IDE,可以與SQLALCHEMY兼容的數據庫一起使用。

如果Apache Superset 1.2的安裝環境是Windows操作系統,而Python中的signal包只能用于Linux或Mac操作系統,就會報錯:AttributeError: module 'signal' has no attribute 'SIGALRM',該問題的解決方法是修改core.py配置文件,其位于F:\Uninstall\Anaconda3\envs\superset\Lib\site-packages\superset\utils路徑下。

在配置文件中,找到如下的代碼塊,注意這里使用的是Apache Superset 1.2版本,如果版本不同,那么配置文件的路徑和需要修改的代碼也是不同的。

把signal所在的代碼行都注釋掉,在下面再加一個pass空語句,修改后的代碼如下。

打開Apache Superset界面,依次單擊頂部導航菜單中的“SQL Lab”→“SQL Editor”選項,如圖5-1所示。

圖5-1 Apache Superset界面

在頁面的左側可以選擇數據庫和表,右上方可以編輯SQL語句,右下方可以查看SQL語句執行的結果,也可以導出查詢數據,基于維度生成不同類型的圖表等,如圖5-2所示。

圖5-2 數據查詢結果

5.1.2 制作報表與看板

在Apache Superset中,對于數據分析人員來說,SQL語句可被直接編輯,然后通過諸如配置指標(METRIC)、分組條件(GROUP BY)、篩選條件(FILTERS)等選項生成圖表,其中指標指某一域的統計結果,如總和、平均數、最值等。

下面將以前文對查詢客戶表后的數據進行可視化分析為例,介紹如何制作客戶受教育狀況的餅圖,以及對應的客戶主題分析看板,詳細步驟如下。

◆ 在SQL Lab的查詢頁面,單擊“EXPLORE”按鈕,如圖5-3所示。

圖5-3 “EXPLORE”按鈕

◆ 在保存或覆蓋數據集(Save or Overwrite Dataset)頁面,可以保存查詢結果,供以后使用,如圖5-4所示。

圖5-4 保存查詢結果

◆ 單擊“SAVE & EXPLORE”按鈕,進入可視化設置頁面。默認的視圖是表格(Table),這里需要重新設置可視化類型(VISUALIZATION TYPE),如圖5-5所示。

圖5-5 可視化設置頁面

選擇圖表類型(Select a visualization type),這里選擇餅圖(Pie Chart),如圖5-6所示。

圖5-6 選擇圖表類型

設置分組(GROUP BY)條件為“education”字段,意思是對查詢的數據按照受教育狀況來分組。單擊圖形上方的“RUN”按鈕后,就會展示客戶受教育水平的餅圖,如圖5-7所示。

圖5-7 設置分組

單擊左上方的“Save”按鈕,可以將圖表創建或保存到看板(Dashboards)中,例如,設置報表名稱為“客戶受教育程度餅圖”,看板名稱為“客戶屬性細分分析看板”,然后單擊“SAVE”按鈕,如圖5-8所示。

圖5-8 保存報表

查看報表,在“客戶屬性細分分析”看板主題中創建了一張“客戶受教育狀況餅圖”,如圖5-9所示,后續還可以根據需求繼續添加更多的報表。

圖5-9 查看報表

上面所講的是如何用Apache Superset生成報告和看板,每一個看板上顯示的圖表都對應著一種數據分析主題,其中的圖表不僅多層次地顯示了數據背后隱藏的業務信息,還大大豐富了視覺效果,使得原本單調乏味的數據變得清晰明了。

主站蜘蛛池模板: 镇江市| 交城县| 辉南县| 靖西县| 新河县| 来凤县| 区。| 陵川县| 瑞安市| 共和县| 宁河县| 长垣县| 四平市| 普陀区| 龙南县| 五指山市| 乌拉特后旗| 泾源县| 巩义市| 滁州市| 霞浦县| 兴化市| 和田市| 泸州市| 南陵县| 迭部县| 孟津县| 文昌市| 遵义县| 曲麻莱县| 正蓝旗| 天津市| 富裕县| 平阴县| 泊头市| 桂阳县| 永康市| 修武县| 东光县| 昭苏县| 筠连县|