官术网_书友最值得收藏!

1.3 在數據中尋找什么

我們通過數據可視化,是為了從中尋找什么呢?三個方面:模式、關系和異常。不管圖形表現的是什么,我們都要留心觀察這三個方面。

模式,即數據中的某種規律。比如機場每月的旅客人數隨著時間推移變化不定,通過幾年的數據的對比,我們可以發現旅客人數存在著季節性或周期性的變化規律。又比如,分析某家網站不同時間內各個板塊的訪問量,轉化率等,如圖1-3-1所示。

圖1-3-1 數據規律

關系,即各數據指標之間的相關性。在統計學中,關系通常代表關聯性和因果關系。多個變量之間經常存在某種聯系。比如,在散點圖中,我們可以觀察兩個坐標軸的兩個字段之間的相關關系,是正相關還是負相關,或者是不相關。如此,我們可以依次找到與因變量具有較強相關關系的自變量,從而確定主要的影響因素。比如我們研究網站訪問的目標完成情況與訪問量、轉化率等的關系,如圖1-3-2所示。

異常,即顯著不同于大多數的數據。異常的數據并非都是錯誤數據,有些可能是設備記錄或人工輸入數據時出現了錯誤而導致的錯誤數據;有些也可能就是正確的數據,只是存在人為欺詐或偶然因素的影響使得數據出現了異常。通過異常分析,一方面可以分析異常原因,對設備是否正常運轉或員工工作態度進行檢測;另一方面可以檢測制度的漏洞,以完善制度,如圖1-3-3所示。

圖1-3-2 關聯性分析

圖1-3-3 異常數據

主站蜘蛛池模板: 介休市| 辛集市| 安乡县| 象州县| 肇源县| 兴业县| 司法| 依兰县| 汝南县| 璧山县| 瓮安县| 石泉县| 林西县| 嵊泗县| 湖州市| 新蔡县| 德江县| 康乐县| 台中市| 武乡县| 汾阳市| 达日县| 台中市| 巴林右旗| 肥城市| 崇义县| 哈尔滨市| 蓬莱市| 郓城县| 连城县| 金乡县| 庆元县| 泾源县| 南康市| 湾仔区| 邵东县| 同江市| 泸西县| 青海省| 通山县| 四子王旗|