- Power BI商業數據分析
- 胡永勝編著
- 6044字
- 2021-03-23 11:07:33
1 入門篇
第1章 認識Power BI:強大的自助商業智能分析工具
擁抱Power BI,從這里開始……
在人人都將成為數據分析師的大背景下,本章介紹了為什么要學習Power BI、Power BI的主要框架、操作界面以及Power BI數據處理的基本步驟,并通過一個示例,帶你體驗Power BI如何分分鐘制作出一個動態可視化報告。
1.1 讓數據技能成為你的競爭力
如今,我們生活在一個數字化的世界中,生活中有各種智能設備,我們可以選擇智能出行、在線辦公,可以在網上購買商品和服務,甚至在睡覺時都有設備記錄身體的各項數據。數據正改變我們的工作、生活和娛樂方式。
我們的各種行為每時每刻都在產生大量數據。我們上網的瀏覽記錄、交易記錄,行走數據、衣食住行等各種行為數據,可以幫助我們彼此建立更多和更深的聯系,并讓我們更快,更輕松地獲取產品和服務。伴隨而來的是數據的爆炸式增長。
當前,不僅是互聯網公司在利用數據做各種算法和推薦,以增強客戶體驗,提升業績,傳統行業同樣也在尋求數據化轉型。各行各業都在想方設法利用數據來獲取客戶、開拓新市場、提高工作效率、創造新的競爭優勢,以及更科學高效地制定決策。各種組織都在想辦法將數據轉化為更好看的各項業務指標,以保持競爭力,從而為組織帶來價值,“數據是組織中重要的資產”已不僅僅是口號。
盡管每個組織都認識到了數據的重要性,知道數據中隱藏著巨大的價值,并且對從這些數據中獲取新見解、提高運營效率和促進業務增長寄予厚望,但將數據轉化為價值并非易事。更常見的情形是,我們手中擁有海量數據,但不能充分利用。
從海量數據到實現價值之間,還有個重要的因素:人。
數據沒法變現或沒法產生業務價值就無法發揮作用,大部分組織,尤其是非互聯網公司,很少或者沒有專門的數據分析崗位,IT部門的職責也主要在于系統管理和維護。隨著數據范圍的擴大和維度的不斷增加,各種崗位都面臨著海量的數據,不僅僅是運營、財務,現在連人力、行政、審計都必須處理海量并且依然在大幅增長的各類數據。讓組織的各個業務流程人員擁有數據分析能力,從與其崗位相關的數據中提取自己的見解,變得更加必要和迫切。
組織的痛點在哪里,我們的機會和價值就在哪里!
組織中缺乏數據專長的人才,我們可以先人一步,將數據技能變成自己的優勢。我們應該主動融入業務,從自己的角色中識別數據問題,并將數據成果轉化為業務問題的解決方案,發現數據的價值和力量。
無論是已身處社會的職場人士,還是即將走出校園的大學生,早一點掌握數據分析技能,會增加自身的競爭力,這也意味著更多的工作機會以及獲得更高的收入。
未來,人人都將是數據分析師,提前用數據技能武裝自己,讓該技能成為自己的基本素養,它也會支撐你走得更遠、更穩固。
1.2 為什么是Power BI
雖然數據分析技能很重要,但作為非數據分析專業人士,沒有受過專業的訓練,沒有時間和精力再學習復雜的編程,面對海量的數據,我們可能有想法,想探索、發現其中蘊含的價值,但現實情況卻讓人無所適從,心有余而力不足。
那么該如何邁出這一步呢?或者更具體一些,應該選什么工具呢?
首先,這個工具應該足夠簡單、易于使用,讓數據能夠講述自己的故事。雖然Excel作為大眾化的分析工具,非常容易使用,也能進行日常的數據分析工作,但在海量數據、多種數據源以及實時快速的分析需求面前,顯得捉襟見肘。
其次,它還要功能強大、足夠靈活,不依賴技術人員就可以讓你輕松處理海量數據,并實時快速地發現數據中蘊含的信息,隨時隨地回答你的業務問題。
有沒有這樣的工具呢?當然有,它就是自助商業智能分析工具。自助表示人人可用,幾乎沒有門檻。由于它的出現,數據分析正在發生革命性的變化,這種改變體現在效率、性能和對數據量的駕馭上。
本書介紹的微軟Power BI就是這樣的工具——強大的自助商業智能分析工具。
Power BI可以快速將數據進行分析和呈現,它支持數百種數據源,可以建立模型,創建美觀的交互報表。
你也許知道Power BI炫酷的可視化效果,但它的可視化不僅僅是指傳統的圖表,它的可視化本身就是分析的一部分,是在動態交互式可視化界面的支持下進行的分析推理過程,這個過程遠比傳統圖表的意義要大得多。
當然,市場中與Power BI類似的也有其他工具,那么為什么要學習和使用Power BI呢?不妨來看看世界上最頂級的商業智能(BI)工具的排名情況。這里介紹的排名是由國際著名的第三方機構Gartner發布的BI平臺魔力象限,微軟Power BI近幾年一直處于領導者位置,圖1-2-1是2020年魔力象限。
魔力象限中標識的是公司名稱,全球范圍內上榜的有20余家公司,在魔力象限上我們可以看到很多熟悉的公司名稱,右上角是領導者象限,而微軟所處的是最高領導者位置,微軟的BI產品就是Power BI。
既然要選一個工具,為什么不用最高的呢?
其實Power BI不僅是一個BI軟件、一個商業數據分析工具,而是一整套解決方案,它賦能每一個人,從數據準備,數據建模,再到最后的可視化,均有強大的模塊支持。
與其他自助工具相比,Power BI還有以下這些明顯的優勢。
上手更快:Power BI簡潔的外觀與大家熟悉的微軟Office界面類似,從而使用戶能快速上手,提高工作效率。

圖1-2-1 Gartner 2020年BI平臺魔力象限
與微軟其他產品無縫協作:Power BI與微軟眾多其他工具無縫集成,可以使用現有解決方案無縫協作。比如將Power BI與Power Apps和Power Automate相結合,可輕松構建業務應用程序并使工作流自動化,Power BI與Azure配合使用,可以跨PB級數據進行快速、交互式分析,滿足苛刻的企業級需求。
成本低:相對于其他BI工具,成本低是Power BI的一大優勢,它最核心的Power BI Desktop完全免費,這意味著,個人可以完全免費地學習和使用,中小企業也可以低成本甚至零成本地應用Power BI。
截至2020年初,Power BI支持43種語言,并已在全球40個數據中心中部署。全世界有超過二十萬客戶使用Power BI,每個月將40PB的數據帶入Power BI。在不到五年的時間里,Power BI社區的成員數已迅速發展為超過一百萬。如今,大部分《財富》世界500強公司使用Power BI。
從這些數據里,你能得到什么信息呢?
它們一方面說明Power BI在全球的普及度已相當廣泛,另一方面,我們也應該看到,頂級公司的員工都已在學習和運用這個強大的工具,加速自己的知識積累和技能更新,那么我們是不是應該相信頂級公司的視野和眼光,追隨他們的步伐呢?
不管我們是否做好了準備,我們的很多同齡人和同事們都在武裝自己,與其最后迫不得已去學習,不如主動擁抱Power BI,駕馭海量數據,增強自己的競爭力。
1.3 Power BI主要架構
本節開始正式介紹Power BI。在學習之前,我們先來認識Power BI的主要知識架構,分清楚Power BI的一些概念。
Power BI是微軟推出的自助商業智能分析工具,Power BI不僅僅是計算機中安裝的一個軟件,而是一系列的軟件服務和應用,這些軟件服務和應用協同工作,不管數據是簡單的Excel工作簿,還是基于云的數據倉庫和本地混合數據倉庫的集合,Power BI都可以輕松連接到數據源,將多種的數據源轉化為數據模型,形成可交互的可視化報告,并與所需的人共享。
圖1-3-1很形象地展示了Power BI從各種數據源到可視化的過程。

圖1-3-1 Power BI從數據源到可視化
Power BI主要由Power BI Desktop、Power BI服務以及在移動終端上也可用的Power BI移動版組成,如圖1-3-2所示。

圖1-3-2 Power BI主要架構
1.Power BI Desktop
Power BI Desktop是Power BI的桌面應用程序,也稱為桌面版,專為分析人員設計。它結合了一流的交互式可視化效果和業界領先的內置數據查詢和建模功能,可以創建報告并將報告發布到Power BI服務中。
我們平時學習和使用Power BI,主要使用的是Power BI Desktop,數據分析的大部分環節主要在桌面版完成,而且Power BI Desktop完全免費。
本書的主要內容也是在介紹和使用Power BI Desktop的相關模塊,其中數據準備是在Power Query編輯器中進行。Power Query在Excel 2010之后的版本中同樣可以使用,本書第2章會介紹它的用法。
數據建模和DAX,是Power BI數據分析的靈魂,本書第3章會重點介紹。
數據分析的結果一般都會以可視化的方式來呈現,在Power BI Desktop中有大量的圖表類型和豐富的交互方式,本書第4章和第5章會介紹可視化的部分。
數據準備、數據分析到數據可視化,整個流程在Power BI Desktop中一氣呵成。
使用Power BI Desktop制作的報告可以在本地保存成擴展名為.pbix的文件,還可以上傳到Power BI服務中。
2.Power BI服務
Power BI服務(Power BI Service)是一個在線服務。Power BI Desktop中制作的報表發布后,就會顯示在Power BI服務中,用戶可以在瀏覽器中查看、分享、發布Power BI報表,也可以設置數據刷新計劃、管理數據的安全性等。
3.Power BI移動版
需要在移動終端查看跟蹤數據時,可以使用適用于iOS、Android的Power BI移動版。它是非常友好的Power BI移動應用程序,可以讓每一個人獲得觸手可及的交互式數據報表。
Power BI中的一個常見工作流開始于Power BI Desktop,數據分析人員在其中創建一個報表。然后,該報表將發布到Power BI服務并在最后進行共享,Power BI移動版的用戶可以隨時隨地查看該報表。
1.4 初識Power BI
本節介紹如何下載安裝Power BI Desktop,介紹Power BI Desktop的界面和操作的一般步驟?,F在就來邁出我們學習Power BI的第一步吧。
1.如何安裝Power BI Desktop
安裝Power BI Desktop有如下兩種方式。
(1)如果計算機操作系統為Windows 10,進入Microsoft Store,搜索Power BI Desktop,單擊安裝即可,如圖1-4-1所示。

圖1-4-1 從Microsoft Store中安裝Power BI Desktop
通過Microsoft Store安裝的好處是,當Power BI Desktop更新時,可以后臺自動更新且無須重新下載安裝。
(2)如果計算機操作系統不是Windows 10,那么登錄微軟Power BI官網,在產品中選擇Power BI Desktop,單擊下載即可,如圖1-4-2所示。

圖1-4-2 官網下載Power BI Desktop
根據計算機的操作系統選擇32位或者64位的安裝包。
這種安裝方式不能自動更新,當Power BI Desktop更新時,必須按上述方式重新下載安裝。
Power BI的一大優勢是更新迭代非常迅速,幾乎每個月都有更新,所以強烈推薦第一種安裝方式。
安裝完成,啟動后會提示注冊,可以用企業郵箱或者學校郵箱注冊,暫時不想注冊可以直接跳過,大部分功能不注冊同樣可以使用。
2.認識Power BI Desktop界面
Power BI Desktop界面如圖1-4-3所示。

圖1-4-3 Power BI Desktop界面
數據處理的第一步就是獲取外部數據,如圖1-4-4所示。

圖1-4-4 數據獲取
常用的數據來源如Excel、SQL Server、文本/CSV、Web出現在“最常見”里面,如果是其他來源,單擊“更多”,目前能見到的大多數數據格式都可以直接導入。
以一個Excel文件為例,導入之后,進入內嵌的Power Query編輯器,如圖1-4-5所示。

圖1-4-5 Power Query編輯器
這是Power BI的一個主要模塊,數據整理都在這里完成,第2章會專門介紹。
整理后的數據上載到Power BI數據模型中,可以在數據視圖中查看這些數據,如圖1-4-6所示。
不要被數據建模這個詞嚇到了,其實就是表格之間建立關聯,這是下一步數據可視化的基礎,可以在模型視圖中查看數據模型,如圖1-4-7所示。

圖1-4-6 數據視圖

圖1-4-7 模型視圖
然后就可以進行可視化工作了。Power BI主界面顯示的是系統默認自帶的一些圖表,都是平時最常見的圖表類型。另外推薦Power BI的一大理由就是還可以加載更多的自定義可視化包,包含各種酷炫的圖表,如圖1-4-8所示。

圖1-4-8 Power BI自定義視覺對象(部分)
目前已經有200多種自定義圖表可供免費下載使用,而且仍在不斷增加中。
通過上面這些介紹,讀者應該對Power BI的界面基本熟悉了,下面利用一個示例來介紹Power BI如何將數據快速轉化為動態可視化報告。
1.5 體驗Power BI:快速從原始數據到動態報告
本節讓我們嘗試一下,使用Power BI快速將原始數據表變成一個精美的、可交互的可視化報告,如圖1-5-1所示。

圖1-5-1 從Excel數據到Power BI報表
源數據為1999年到2018年全國部分省區市的生產總值數據,為Excel格式,如圖1-5-2所示。

圖1-5-2 Excel源數據
下面來體驗一下Power BI的操作流程。
1.數據導入
打開Power BI Desktop,在“數據”組中單擊“Excel”,如圖1-5-3所示。

圖1-5-3 獲取Excel格式數據
然后從本地路徑中選擇Excel文件,在彈出的“導航器”窗口選擇“轉換數據”,如圖1-5-4所示。

圖1-5-4 轉換數據
這樣數據就導入到Power BI的Power Query中了,如圖1-5-5所示。

圖1-5-5 導入到Power Query中的數據
為了便于分析,接下來需要對數據進行整理。
2.數據清洗
Power Query是Power BI的數據清洗模塊,可以幫用戶快速整理成需要的數據,第2章會重點介紹。
下面簡單看一下這個示例數據的清洗步驟。
(1)將第一行用作標題。
在Power Query中第一行就是數據行,如果標題在第一行,可以單擊功能欄上的“將第一行用作標題”,如圖1-5-6所示。

圖1-5-6 將第一行用作標題
(2)二維表轉一維表。
源數據是一個二維表,為了便于分析,需要轉為一維表。在Power Query中進行這樣的轉換很簡單,選中“地區”列,單擊“逆透視其他列”,這樣就變成了一維表,如圖1-5-7所示。

圖1-5-7 二維表轉一維表
(3)完成整理。
修改標題,并將“年度”字段中的“年”去掉,數據整理完成,然后可以在字段區看到這個表的3個字段,如圖1-5-8所示。

圖1-5-8 該表的3個字段
3.制作可視化報告
在Power BI中,只需要選擇一個圖表類型,然后拖曳字段到圖表中,就可以生成一個可視化圖表。
(1)制作生產總值年度趨勢圖。
選擇柱形圖,然后將“年度”字段放到【軸】中,“生產總值”字段放到【值】中,柱形圖就做好了,如圖1-5-9所示。

圖1-5-9 年度趨勢圖
(2)同樣的方式再生成三個圖表。
卡片圖:用于展示生產總值的數據。
條形圖:用于展示各省份的生產總值排名。
樹形圖:用于直觀展示生產總值的分布情況。
主要的圖表制作完成,如圖1-5-10所示。

圖1-5-10 Power BI圖表
(3)添加年度切片器。
上面這幾個圖表顯示的地區數據是所有年度的生產總值之和,如果想查看每個年度的數據,添加一個切片器就可以了,如圖1-5-11所示。

圖1-5-11 添加切片器
提示:關于切片器,在“格式”→“常規”→“方向”中,設置為“水平”,就可以顯示圖1-5-11的樣式。
然后在上方添加一個文本框作為報告標題,Power BI可視化報告就制作完成了。
是不是很快?如果操作熟練,幾分鐘就可以生成這樣一個可視化圖表。表面看這個報表也沒有什么特別的,但Power BI報表的特點是所有的圖表都可以動態交互。
單擊年度切片器,其他圖表會動態切換為該年度的數據;如果單擊條形圖的某個省份,其他圖表也顯示為該省份的數據,如單擊條形圖的“江蘇省”,切片器選為2016,效果如圖1-5-12所示。

圖1-5-12 江蘇省2016年數據
單擊樹狀圖中的某個省份,比如單擊“廣東省”,其他圖表同樣會動態響應,效果如圖1-5-13所示。

圖1-5-13 廣東省2016年數據
以上只是基本的交互形式,在Power BI中還有更豐富更高級的交互方式,在第5章會重點介紹。
提示:關于上面介紹的交互,可能讀者單擊某個數據,其他圖表變成只有一個數據了,這涉及編輯交互的技巧,具體操作可參考本書5.1節的介紹。
以上的報表布局是適應計算機端的,Power BI還支持移動布局,以滿足移動端查看報表的需要。單擊“視圖”→“移動布局”,前面制作好的各個圖表已存放在右側的可視化欄,分別將其拖到畫布上即可,如圖1-5-14所示。

圖1-5-14 移動布局
將此報表發布以后,就可以在Power BI App上按照移動布局來查看了。
4.發布分享
除了在Power BI Desktop中查看這張報表,還可以發布報表,其他人可以隨時隨地查看。如果讀者已經注冊賬號,登錄以后,單擊“發布”按鈕,如圖1-5-15所示。

圖1-5-15 發布報表
在瀏覽器中登錄Power BI服務,即可在線查看,并且在Power BI App中同樣可以查看該報表的移動布局,如圖1-5-16所示。

圖1-5-16 在多種設備上隨時隨地查看報表
還可以在Power BI服務中,單擊“發布到Web”,如圖1-5-17所示。

圖1-5-17 發布到Web
這樣就會生成報表網址。
把這個網址發給相關人員,他們就可以隨時隨地通過瀏覽器查看這個報表了。并且這個報表不是靜態的,仍然是可以單擊交互的。
提醒:內部敏感數據請不要隨意發布到Web。
看到這里,感覺Power BI怎么樣,是不是有種相見恨晚的感覺呢?這個示例只是簡單介紹了Power BI的最基本功能,更強大的數據分析和可視化技巧,后面的章節會逐一介紹。
1.6 本章練習
下載Power BI Desktop,并用本章最后一節的示例數據模仿制作可視化報表,熟悉Power BI的界面,體驗Power BI的基本功能。