- Tableau數據可視化分析一點通(案例視頻版)
- 何業文 郭杰 袁勛
- 539字
- 2021-05-19 17:52:36
1.3 在數據中尋找什么
我們通過數據可視化,是為了從中尋找什么呢?三個方面:模式、關系和異常。不管圖形表現的是什么,我們都要留心觀察這三個方面。
模式,即數據中的某種規律。比如機場每月的旅客人數隨著時間推移變化不定,通過幾年的數據的對比,我們可以發現旅客人數存在著季節性或周期性的變化規律。又比如,分析某家網站不同時間內各個板塊的訪問量,轉化率等,如圖1-3-1所示。

圖1-3-1 數據規律
關系,即各數據指標之間的相關性。在統計學中,關系通常代表關聯性和因果關系。多個變量之間經常存在某種聯系。比如,在散點圖中,我們可以觀察兩個坐標軸的兩個字段之間的相關關系,是正相關還是負相關,或者是不相關。如此,我們可以依次找到與因變量具有較強相關關系的自變量,從而確定主要的影響因素。比如我們研究網站訪問的目標完成情況與訪問量、轉化率等的關系,如圖1-3-2所示。
異常,即顯著不同于大多數的數據。異常的數據并非都是錯誤數據,有些可能是設備記錄或人工輸入數據時出現了錯誤而導致的錯誤數據;有些也可能就是正確的數據,只是存在人為欺詐或偶然因素的影響使得數據出現了異常。通過異常分析,一方面可以分析異常原因,對設備是否正常運轉或員工工作態度進行檢測;另一方面可以檢測制度的漏洞,以完善制度,如圖1-3-3所示。

圖1-3-2 關聯性分析

圖1-3-3 異常數據