- Power BI數據處理與分析(微課版)
- 黃達明 張萍編著
- 4773字
- 2023-11-29 19:42:26
1.2 Power BI簡介
Power BI是一個完整的數據分析和報表創建軟件,其全稱為Power Business Intelligence, Business Intelligence意為“商業智能”。
商業智能是指從許多不同的系統中獲取企業及其所在行業的數據,再對數據進行清洗以保證其正確性,經過抽取和轉換將數據加載到企業級數據庫里;之后用查詢分析和數據挖掘等工具對數據庫里的數據進行分析和處理,從中挖掘出有用的信息與知識,向管理者提供決策建議,以達到增加企業利潤、提升企業競爭力的目的。
傳統的商業智能通常由企業中專門從事數據分析的技術人員完成。隨著數據量不斷增加,數據分析的成本也不斷增加,僅僅依靠專業數據分析人員做數據處理和分析已不能滿足企業發展的需要,因此自助式商業智能軟件便應運而生。微軟公司開發的Power BI便是一款自助式商業智能軟件。
Power BI的前身是Excel。2010年微軟公司推出了Excel 2010,同期推出了一個名為Power Pivot的插件。用戶可免費下載Power Pivot插件并加載到Excel 2010中使用。2013年微軟公司在推出Excel 2013時又推出了Power Query、Power View和Power Map插件供用戶免費下載并加載到 Excel 中使用。這些插件極大地擴展了 Excel 在數據處理、數據分析和數據呈現方面的功能,使 Excel 從一個傳統的電子表格處理軟件變為商業智能軟件。此后微軟公司將上述4個插件整合在一起,于2015年正式推出了Power BI Desktop。Excel 2016和Excel 2019推出時,Power Query、Power Pivot、Power View和Power Map已預先安裝到Excel里,用戶不需要再下載和安裝插件,只要在加載項里激活這些插件便可以在Excel里直接使用。
與其他數據分析和報表創建軟件相比,Power BI具有以下優勢。
(1)可連接數十個數據源以導入數據并使這些數據具有正確的格式。數據源包括 Excel工作簿、文本文件、JSON文件、Access數據庫、SQL Server數據庫等。
(2)可快速對數據進行清洗和整理。
(3)可通過建立數據模型使數據之間具有關聯關系,以實現數據的統計和分析。
(4)可用數據分析的結果制作豐富的視覺對象并發布到云服務器。用戶登錄Power BI云服務賬戶后便可在網頁上瀏覽報表并與其他用戶互動,用戶還可以用手機等移動設備瀏覽報表。
(5)可導出PPT等格式的文檔。
(6)Power BI Desktop每月都會更新,每次更新時會解決之前版本中存在的問題,改進已有功能并增加新的功能。
1.2.1 Power BI的基本構成
Power BI包括本地桌面版(Power BI Desktop)、網頁服務版(Power BI Service)和移動版(Power BI App)。
Power BI Desktop是在本地計算機中運行的數據分析和報表創建軟件,擅長處理數據及創建報表,主要用于對原始數據進行清洗和整理、建立數據表之間的關系、建立可視化報表、將報表發布到Power BI Service。
Power BI Service是基于云服務的SaaS(Software as a Service,軟件即服務),提供數據共享和協作功能,其用戶之間可以協作或互動(如分享報表和儀表板、評論、制作書簽等)。沒有Power BI Pro許可證的用戶登錄Power BI Service賬戶后只能訪問“我的工作區”;擁有Power BI Pro許可證的用戶登錄Power BI Service賬戶后可訪問所有內容,并可與他人協作或互動。
Power BI App是一款在iOS或Android平臺的手機或平板電腦里運行的免費軟件,用戶運行該軟件并登錄Power BI賬戶后,在“我的工作區”中可查看報表和儀表板。
Power BI Desktop和Power BI Service的功能如表1-1所示。
表1-1 Power BI Desktop和Power BI Service功能一覽表

使用Power BI的一般流程(見圖1-2):在Power BI Desktop中導入、分析和處理數據,創建報表并將報表發布到Power BI Service;在Power BI Service中共享報表,再創建并共享儀表板;在Power BI App中瀏覽報表和儀表板。

圖1-2 Power BI數據分析一般流程
用戶具體使用Power BI的哪一部分是由其角色決定的。以一個企業為例,數據分析師通常用辦公室計算機中安裝的Power BI Desktop從多種數據源中獲取與企業有關的各類數據,再對數據進行處理和分析,用分析結果制作視覺效果豐富的報表,并將報表發布到Power BI Service;管理者及一線員工通常使用辦公室計算機中安裝的瀏覽器登錄Power BI賬戶查看數據分析師發布的報表、制作儀表板、與他人互動等;銷售員則主要使用手機上的Power BI App登錄Power BI賬戶,然后瀏覽Power BI Service中的報表和儀表板,隨時了解企業產品的銷售進度等業務狀況。如果某個員工同時扮演了多個角色,那么他會在不同的時間段使用Power BI的不同部分。
微軟公司為Power BI用戶提供了以下3種授權服務。
(1)Power BI Free(免費)。任何人只要注冊Power BI Free賬戶就可使用Power BI Desktop和Power BI App,還可以登錄Power BI Service。Power BI Free的用戶除了不能在Power BI Service里將報表和儀表板分享給其他Power BI用戶外,可使用Power BI的其他所有功能。
(2)Power BI Pro(收費)。微軟公司每月收取每個Power BI Pro賬戶一定的費用(目前可免費試用60天)。Power BI Pro的用戶除了能使用Power BI的所有功能外,還可以在Power BI Service上將報表和儀表板分享給其他Power BI Pro用戶。
(3)Power BI Premium(收費)。這類賬戶除了具有Power BI Pro的所有功能外,還享受一些額外服務,用戶付費后以套餐形式得到服務。
用戶通過以上3種授權服務可以無差別地使用Power BI Desktop和Power BI App,它們的不同之處主要體現在Power BI Service的使用上,如表1-2所示。
表1-2 Power BI 3種授權服務的功能

續表

下面簡要介紹Power BI中的幾類對象。
1.數據集(Dataset)
數據集是指在Power BI中做數據處理和分析,以及在報表或儀表板上創建視覺對象時的數據集合。數據集來自數據源,Power BI支持的數據源包括文件、Web網頁、數據庫等多種類型。
2.視覺對象(Visual)
視覺對象是指在報表或儀表板上呈現數據時使用的可視化表現形式(圖表、圖形、表格、地圖等)。圖 1-3是Power BI Desktop預安裝的視覺對象。

圖1-3 Power BI Desktop預安裝的視覺對象
Power BI不僅提供了豐富的視覺對象,還經常更新和增加視覺對象。用戶除了可以使用Power BI預安裝的視覺對象外,還可以從微軟應用商店或文件中導入自定義視覺對象到Power BI中使用。
3.報表(Report)
報表是各種視覺對象的集合。一個報表可以包含一個頁面或多個頁面,每個頁面都可以包含多個不同類型的視覺對象。例如,圖1-4所示的報表包含了兩個頁面,當前顯示的是其中一個頁面,該頁面有7個視覺對象,另一個頁面也包含了若干個視覺對象。
創建報表時使用的數據通常來自一個數據集中的多個數據表,一個數據集也可用于創建多個報表。報表既可以在Power BI Desktop中創建,也可以在Power BI Service中創建,但不能在Power BI App中創建。
4.儀表板(Dashboard)
儀表板與報表類似,也包含了各種類型的視覺對象(見圖1-5)。儀表板與報表的不同之處主要有以下幾點。
(1)儀表板只能在Power BI Service中創建并分享。在Power BI Desktop和Power BI App中都不能創建儀表板。
(2)一個報表可以有多個頁面,一個儀表板只有一個頁面。

圖1-4 在Power BI Desktop中制作的報表

圖1-5 在Power BI Service中制作的儀表板
(3)可以從一個報表的同一個頁面或不同頁面中選擇若干個視覺對象放在一個儀表板上,也可以從不同報表中選擇若干個視覺對象放在一個儀表板上。
1.2.2 數據處理組件Power Query
Power Query主要用于獲取數據和整理數據。Power Query具有強大的獲取外部數據并對數據做預處理的能力,能為后續用Power Pivot做數據分析及用Power View做數據可視化做好準備。
Power Query具有以下功能和特點。
(1)可從多種外部數據源中導入數據并把數據保存到數據表。以數據表為單位對數據做各種處理。數據源可以是Excel工作簿、文本文件、網頁、各類數據庫等。
(2)可完成對數據表中數據的清洗和整理工作。例如,刪除無用列,刪除包含錯誤數據的整行數據,刪除空行,隔行刪除,保留指定行并刪除其他行,刪除重復項;移動列;快速替換數據,替換錯誤數據,用相鄰單元格中的數據填充空白單元格;排序、篩選、分類匯總數據;將數據表轉置(轉換行列),反轉行;將一列拆分為多列;將多列合并為一列;提取文本;透視和逆透視等。
(3)可添加各種新的數據列。例如,重復列、條件列(通過設置條件得到新列及其中的數據)、索引列、度量列(通過設置公式得到新列及其中的數據)等。
(4)可將多個數據表匯總到一個表中。例如,若兩個數據表包含相同的列名,則可用“合并查詢”通過單列匹配或多列匹配將一個數據表中指定列的數據添加到另一個數據表中(類似于Excel中VLOOKUP函數的功能,但合并查詢操作比VLOOKUP函數更加簡單、方便)。如果兩個數據表具有相同的列數和列名,則可用“追加查詢”將一個表中所有行的數據添加到另一個表的下方。
(5)分析列可發現并處理導入的數據中可能存在的質量問題。例如,用“列質量”檢測數據表中的有效值、錯誤值和空值,并在含有錯誤值或空值的列上顯示醒目標識以提醒用戶;用戶可選擇對檢測出的錯誤值和空值的處理方式(如刪除包含錯誤值或空值的所有行)。
(6)可用M語言完成復雜的數據處理工作。
傳統的Excel也有數據處理功能。與Excel相比Power Query的優勢在于:①處理的數據量更大;②能自動記錄用戶的每一步操作,便于用戶直觀地了解對現有數據源已經做過的操作并隨時調整或改變之前做過的某些操作;③如果更改了數據源,則用戶不需要手動做重復的操作,Power Query 會自動將所記錄的操作應用于新的數據源,從而大大提高工作效率;④增加了一些Excel沒有的操作和一些Excel雖然有但實現起來很煩瑣的操作。
1.2.3 數據分析組件Power Pivot
Power Pivot主要用于完成數據建模和數據分析工作,是Power BI的“靈魂”。使用過Excel的用戶都知道Excel可以建立數據透視表(Pivot Table)。從Power Pivot這個名稱就可以看出它是Pivot Table的加強版。
Power Pivot具有以下功能和特點。
(1)以數據模型為單位做數據分析。可將Power Query生成的查詢表作為數據模型,也可從多種數據源中導入數據并將數據保存到數據模型。
(2)可在各個數據模型之間建立關系,生成多維的數據模型。
(3)對數據模型中的行數沒有限制,可以處理幾百萬行,甚至上千萬行的數據。
(4)用DAX函數可完成普通數據透視表無法完成的數據處理和分析任務。DAX函數與Excel函數在語法上有相似之處。
1.2.4 數據可視化組件Power View
Power View主要用于完成數據可視化工作。用Power View可以建立圖表、圖形、地圖等視覺對象來呈現數據,并且可將多個視覺對象組織在一個報表中。Power View中用于實現數據可視化的圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖和氣泡圖等。一個圖表可以包含多個數值字段和多個系列。設計圖表時,可以選擇顯示或隱藏標簽、圖例和標題。用Power View建立的圖表是交互式圖表,當用戶瀏覽報表時,若單擊圖表中的某個圖形元素,則該元素對應的數值會突出顯示。
1.2.5 Power BI與其他軟件的集成
Excel 2016、Excel 2019已包含了Power BI的四大組件(Power Query、Power Pivot、Power View、Power Map)。在Excel 2016、Excel 2019主界面的功能區的“數據”選項卡里已包含Power Query按鈕,但在Excel 2016、Excel 2019主界面中默認不顯示Power Pivot、Power View和Power Map按鈕。用戶如需使用這3個組件,則需要手動將其對應的按鈕加載到主界面的功能區里。手動添加Power Pivot、Power View和Power Map按鈕到Excel 2016、Excel 2019主界面的步驟如下:打開Excel 2016(Excel 2019),選擇“文件”菜單中的“選項”選項,單擊左側列表中的“加載項”選項,出現圖1-6所示的界面,在底部的“管理”下拉列表中選擇“COM加載項”選項,單擊“轉到”按鈕,出現圖1-7所示的“COM加載項”對話框,勾選其中需要加載的組件名稱(如勾選“Microsoft Power Pivot for Excel”復選框),單擊“確定”按鈕,Excel主界面的功能區中會出現圖1-8所示的組件選項卡。

圖1-6 “Excel選項”對話框

圖1-7 “COM加載項”對話框

圖1-8 加載Power Pivot組件后的Excel主界面
早期的Excel版本(如Excel 2010、Excel 2013等)未集成上述的Power BI組件。如果用戶仍在使用這些版本的Excel并想使用上述的Power BI組件,則需從微軟公司官網下載并加載對應插件到Excel中。
下面以Excel 2010為例介紹下載并加載Power Pivot for Excel插件的操作步驟。
在瀏覽器地址欄中輸入Power Pivot for Excel官網下載地址并按Enter鍵,出現圖1-9所示的頁面,選擇語言并單擊“下載”按鈕,出現圖1-10所示的頁面,根據本地計算機已安裝的Excel版本選擇下載程序。

圖1-9 選擇語言

圖1-10 選擇下載版本
如果本地計算機安裝的Excel是32位的,則勾選“CHS\x86\PowerPivot_for_Excel_x86.msi”復選框,如果是64位的,則勾選“CHS\amd64\PowerPivot_for_Excel_amd64.msi”復選框,之后單擊“Next”按鈕開始下載。
若不清楚計算機中已安裝的Excel版本是32位的還是64位的,則可打開Excel并在“文件”菜單中選擇“幫助”選項,在圖1-11所示的界面中查看Excel版本信息。
插件下載完成后,在本地計算機中運行Power Pivot插件安裝程序(例如,如果Excel是64位的,則運行PowerPivot_for_Excel_amd64.msi),按照安裝向導的指示完成每步操作。

圖1-11 Excel版本信息
打開Excel 2010,選擇“文件”菜單中的“選項”選項,單擊左側列表中的“加載項”選項,出現圖1-6所示的對話框,在底部的“管理”下拉列表中選擇“COM加載項”選項,單擊“轉到”按鈕,出現圖1-12所示的“COM加載項”對話框,勾選“PowePivot for Excel”復選框,單擊“確定”按鈕完成Power Pivot組件的加載。

圖1-12 安裝Power Pivot for Excel