官术网_书友最值得收藏!

1.1.3 數據分析的流程

數據是客觀的事實,但是數據本身并不會告訴人們它的價值,其蘊涵的信息需要分析師進行挖掘。數據分析的流程分為8個步驟,如圖1-5所示。

圖1-5 數據分析的流程

1.明確目標

數據分析是一種有目的的行為,比如,你想要了解銷售情況,或者想找到數據之間的某種規律,一切行為操作都針對某個目標展開。因此進行數據分析的基礎是目標明確,沒有明確的目標,任何分析操作都可能是做無用功。

2.明確分析維度和指標

圍繞目標選定進行數據分析的維度和指標,只有選定了范圍才可以有目的地收集數據,并進行分析。明確的分析范圍能避免分析報告內容太多、不深入。

例1-3:分析目標是了解新上線的詳情頁的效果,為此選定分析的維度和指標。

解:分析的維度有日期、頁面,指標有停留時間、轉化率。

3.數據采集

數據是數據分析的基礎,沒有數據就無法開展數據分析工作,數據采集是將目標數據收集到計算機硬盤等存儲空間中。基礎的數據采集可采用Excel、八爪魚、火車采集器、碼棧等軟件,進階的數據采集可使用Python。

4.數據清洗

采集到的數據一般會有一部分“臟數據”,所以不能直接用于數據分析,如果不處理它們將會影響分析結果。所以在進行分析前需要對數據進行檢查,如果發現“臟數據”就必須進行清洗。

例1-4:表1-1所示為從淘寶生意參謀下載的店鋪經營數據,其中第三行觀測值中存在以“—”為標記的缺失值,如果不處理此類缺失值將無法進行下一步操作,因此需將數據中的“—”替換為數字“0”。

表1-1 店鋪經營數據

數據清洗可使用Excel、Python等工具,亦可使用專業的ETL(Extract Transform Load,抽取、轉換、裝載)工具。利用Excel中的Power Query組件(Office 2016及以上版本自帶該組件),可實現大量數據的清洗。

5.數據整理

因為收集到的數據一般都是零散或者雜亂的,直接觀察數據難以洞察出有效信息,所以只有對其進行整理,才能保證后續流程順利進行。

按照某個維度匯總數據才能對其進行有效的觀察。比如,要觀察新的詳情頁上線后用戶行為的變化,可以按照上線前和上線后的用戶行為數據進行分類匯總,然后通過這兩份數據的對比來得出結論。

例1-5:表1-2所示為淘寶網女裝T恤和襯衫兩個品類在2023年1~3月的成交金額數據,將數據整理成表1-3所示的形式,更便于分析。

表1-2 未經整理的成交金額數據

表1-3 整理后的成交金額數據   單位:千萬元

6.數據分析

數據分析的目的是將數據轉變成有效的信息。前面的步驟都是為這一步做準備,信息的提煉可以采用對比法、拆分法、分組法等分析方法。

例1-6:表1-4所示為商品標題中的關鍵詞詞根分析結果。觀察表1-4中的支付買家數,可以發現“收納箱”和“大號”這兩個詞根的支付買家數為0,表示沒有用戶通過這兩個詞根產生交易,因此得到的信息是“收納箱”和“大號”這兩個詞根可以優化。

表1-4 關鍵詞詞根分析結果   單位:個

7.數據可視化

數據可視化旨在借助圖形化手段,清晰、有效地傳達信息。

例1-7:將表1-5中的數據直觀地展現出來。

表1-5 多個產品的對比數據

根據表1-5中的數據畫出雷達圖,如圖1-6所示,各個產品間的差異清晰可見。

圖1-6 雷達圖

8.數據報告撰寫

數據報告是對分析結果進行邏輯性的集中展現并闡述分析的文檔,可以采用PPT、Word文檔等形式。圖1-7所示為一份數據報告示例。

圖1-7 數據報告示例

主站蜘蛛池模板: 随州市| 万宁市| 博客| 鹤壁市| 侯马市| 天长市| 诏安县| 阳曲县| 大荔县| 台前县| 巴楚县| 鹤山市| 浮梁县| 绥芬河市| 宁化县| 梅河口市| 巴林右旗| 嘉善县| 福泉市| 确山县| 大厂| 河东区| 嘉定区| 洞头县| 华蓥市| 积石山| 墨江| 哈尔滨市| 远安县| 尉氏县| 宁乡县| 无为县| 政和县| 宁晋县| 商洛市| 麻栗坡县| 密云县| 久治县| 临高县| 扬州市| 如皋市|