- 人人可做數據分析:從數據分析到數據驅動運營
- 于琪
- 1151字
- 2023-11-20 20:45:23
1.1 數據分析話題的“樹模型”知識框架
數據分析,聽起來似乎很高大上,離我們的日常生活非常遙遠,但它又經常縈繞在我們的耳邊。那么,數據分析到底是什么呢?數據分析有什么用處呢?數據分析能不能解決問題?數據又是什么?數據是數字嗎?數據從哪里來?很火熱的機器學習、深度學習算不算數據分析?本書將為你一一解答這些問題。
這些問題涉及的理論、技術、場景、工具是紛繁蕪雜的,這大概也是數據分析這個概念總會讓外行人摸不著頭腦、內行人盲人摸象而不得全貌的原因。為了解決這一問題,本書使用一個框架來幫助讀者厘清思路。
常用的思考框架有“道、法、術、器”等,但筆者發現這些框架對于數據分析并不適用,主要是數據分析涉及的內容太多,有業務層面的,也有技術層面的,上游是數據采集問題,下游是可視化及應用問題。因此,筆者用“樹模型”作為數據分析的知識框架(見圖1-1)。

圖1-1 用“樹模型”作為數據分析的知識框架
“樹”的根是數據分析的源頭,主要進行數據采集、存儲與整理。有了數據作為原材料才能進入數據分析的加工過程。
“樹”的干是數據思維,是把數據分析的技術與業務問題結合起來的橋梁,是數據分析最重要的方法論。
“樹”的花是數據可視化部分,是數據的展現,讓數據的關鍵部分一目了然,給人直觀感。
“樹”的葉是數據分析常用的統計分析和傳統算法,這些技術雖然偏傳統,但其實是數據分析最主要的技能。
“樹”的芽是AI技術,如機器學習、深度學習等,這些技術比較時髦,處于快速發展期,但目前還不是最主流的數據分析技能。
“樹”的果是數據的商業應用、數據驅動運營等,是數據分析最終的成果。
一個數據分析問題可大可小,并不是說這里提到的“樹”的每個部分都能在一個數據分析的案例里用到,多數案例只會用到“樹”的一部分。舉一個簡單的例子,一家餐館的老板一旦收集了每天所有的點餐記錄和結賬記錄,數據分析師就可以從這些點餐記錄里:
● 找出顧客最喜歡點的菜——了解顧客的喜好;
● 平均每桌的就餐時長——預估顧客排隊的時間;
● 平均每桌的上菜時間——預估顧客等餐的時間;
● 總結每天食材的消耗量——庫存管理。
借助數據分析,可以更好地提升顧客的滿意度,降低成本。在上面的這個例子中,數據分析師并沒有用到算法,而是在收集數據、從各個角度分析數據、得出結論、撰寫匯報材料。這就好比游泳,不需要學會所有泳姿,只要能游,不管是學蛙泳還是學自由泳,甚至學“狗刨”都可以。
一般來說,沒有用到算法的數據分析,叫作“商業智能”,也稱BI。業內人士戲稱“商業智能就是做個看板”(dashboard)。正是這個原因,這種類型的數據分析側重于從原始數據中通過簡單規則獲取有用的洞察,不需要用到算法。
用到算法,并使用算法尋找規律的數據分析,叫作“數據挖掘”。這種類型的數據分析借助算法從零散的數據中學習規律,找出數據之間的關系,從而進行預測。