- 數據分析咖哥十話:從思維到實踐促進運營增長
- 黃佳
- 7882字
- 2024-12-16 16:52:42
六、增長踐行成于思:數據分析的關鍵思維
題解 王陽明說“知是行之始,行是知之成”。它的意思是在知行關系上,認知是行為的開始,行為代表認知的完成,應用思維來指導行動。《大學》首篇《經:大學之道》中有云“物有本末,事有終始,知所先后,則近道矣”。正確思維體系的形成就是成事之本,成功之始,成材之道。
咖哥的面試問題越來越抽象:“小雪,我們有了AARRR模型,精益數據分析模型,各種數據分析、采集、治理、可視化方法。那么在具體行動之前,如何用正確的思維指導實戰,讓數據真正開始‘說話’?”
小雪回答:“我覺得最重要的是要建立起一個完善的、能解決問題的邏輯思維體系……”
“邏輯思維體系很多人都聽說過,但很少有人能夠說清楚怎么建立起這個體系并用它來完善我們的認知過程。讓我來和你說說。”咖哥再次成功搶過了話語權。
1 邏輯思維:演繹與歸納
什么是思維?什么是邏輯思維?
思維是人接受信息、存儲信息、加工信息及輸出信息的活動過程,是概括反映客觀現實的過程。邏輯則是推論和證明的思考過程。邏輯思維是采用科學的方法反映客觀現實的理性認識過程。借助邏輯思維,我們能夠找到正確的思考方向,減少思考過程中的謬誤及分析中的誤差。邏輯思維能力就是指正確、合理思考的能力,是在認識事物的過程中,進行觀察、比較、分析、綜合、抽象、概括、判斷、推理的能力。
數據分析基本遵循提出問題?分析問題?提出假設?驗證假設?輸出結論這一過程,這個過程本身就需要多種邏輯思維方法的參與。因此,良好的邏輯思維能力對數據分析的作用不言而喻。
邏輯思維的兩種基本方法是歸納法和演繹法。
先說歸納法,它是從特殊到一般的推理過程,是通過個別經驗歸納出普遍規律的方法,是從部分樣本推知全體樣本的過程,如下圖所示。

歸納法
歸納法是基于經驗的方法,其推理方式不夠嚴謹。除非我們搜集了全部年輕女性的促銷贈品信息,否則我們不能得出圖中的結論。一只黑天鵝的出現,就能夠推翻“天鵝是白的”這個基于經驗得出的結論。
而演繹法則是從一般到特殊的推理過程,它從一般原理出發,經過邏輯推理,解釋具體事件或者現象,或推導出個別性的結論。其常見的表現形式是從大前提到小前提,再到結論的邏輯三段論,如下圖所示。

演繹法
在演繹過程中,推論前提與結論之間存在聯系是必然的,演繹法是一種確實性推理。
然而在現實情況下,一般原理也只能來源于經驗。因此,我們不得不先使用歸納法得出原理,然后再用演繹法做出推斷、判斷或預測。“絕大多數男性都選擇這款剃須刀作為贈品,針對男性用戶推廣該產品是可行的,向咖哥這樣的用戶推送該款剃須刀很合適。”——這句話中就包含了演繹法和歸納法兩種邏輯思維方法[11]。
[11] 邏輯思維方法是現代科學的起點。在數據分析過程中,再三強調它亦不為過。遵循邏輯思維方法(演繹法和歸納法),會讓我們得出科學的結論。
2 發散思維與收斂思維
發散思維與收斂思維也是數據分析過程中常用的思維方法。
發散思維也叫放射思維或求異思維,其特點是視野廣闊,多角度,多維度,呈現出發散狀,追求“一題多解”。收斂思維也叫聚合思維或者求同思維,其特點是使思維始終集中于同一方向,使思維條理化、簡明化、邏輯化、規律化。
將發散思維和收斂思維結合使用,可以幫助分析人員得到更有創造性的解決方案。具體步驟可以是先發散,再收斂。針對一個特定的問題,可以先展開“頭腦風暴”,大家暢所欲言(發散),先不做任何限定和評判,得到盡可能多的答案和解決方案;然后把所有的方案集中在一起,按照相似性進行分類,此時可以淘汰一些不相關或者無法實施的方案;最后再進行排序與選擇,確定一個或多個較好的解決方案(收斂)。
下面舉一個電商運營環節中通過發散思維和收斂思維來解決問題的例子。
某知名電商以發貨速度極快著稱,然而也同時出現了用戶大量退貨的問題,有數據表明退貨單占據總送貨單的8%。問題是如何在控制退貨造成的損失的同時提升用戶體驗。
第一步是展開“頭腦風暴”。無前提地提出盡可能多的解決方案,不考慮方案的可行性,如下圖所示。

步驟一 展開“頭腦風暴”
第二步是分類并減少方案。把上述所有方案進行分類與整合,減少重復方案,同時移除不可行的方案,如下頁圖所示。

步驟二 分類并減少方案
其中方案9是通過提高商品質量減少退貨,這個方案過于宏大,涉及進貨流程,需要單獨立項探討,暫時刪除此方案。
第三步是排序和選擇,確定最終方案。
經過反復論證,公司認為其核心競爭力在于在減少退貨的同時提升用戶體驗。因此最終確定下述方案(見下圖)。

步驟三 排序和選擇,確定最終方案
這樣,VIP會員的會費成了公司新的收入來源,也可以用于建立自營物流公司以減少退貨的成本。這樣的做法也提高了公司的服務水準,進一步提升了公司的競爭能力,使得其他電商公司很難與其比肩。
3 從相關思維到因果思維
在現今的數據分析中,機器學習和統計學習方法[12]非常盛行。無論是機器學習,還是統計學習方法,都非常注重事物之間的相關性。而相關性需要通過對大量數據進行分析來發現。
[12] 二者無清晰界限。
舉個例子,有數據表明,某海濱度假城市冰淇淋的銷量和溺水人數呈現出很強的相關性。一旦冰淇淋賣得多,溺水人數就會增加,因此我們也可以將冰淇淋的銷量作為一個指標,用來指導海濱救援人員的工作安排。
然而,冰淇淋賣得多和溺水人數增加只具有相關關系,不具有因果關系。冰淇淋銷量增加是因為氣溫上升,氣溫上升使游泳人數增加,從而導致溺水人數增加。游泳人數增加和溺水人數增加才具有因果關系。
因此,通過數據分析和機器學習就能夠發現看似風馬牛不相及的兩個事物之間的聯系,這很了不起;然而,機器目前還無法給出相關性背后的因果邏輯推理過程。此時,數據分析師要使用邏輯思維中的歸納法、演繹法,在推理過程中貫穿從因到果的辯證,找到相關性背后的真正驅動因素。目前的AI機器無法取代人類完成這項工作,這也更體現出數據分析師的價值。
因果關系有下圖所示的類型。

因果關系的類型
演繹法和歸納法都是由因及果的推理過程。
舉一個因果思維的應用示例:由于監管不當,近期互聯網保險行業的營銷活動無法使用現金及優惠券等來促進保險交易的成交,這在一定程度上減少了活動的數量,因此交易量減少。那么,如何解決這一問題[13]?
[13] 這個例子引自Wise的知乎文章《數據分析應學習邏輯思維及分析方法》。
先試著拆解出可能的因果關系,如下頁圖所示。

對示例問題的簡單因果推理(不完善)
然后,進行因果辯證,提出一些假設性問題。
(1)原因是否真實?
(2)結果是否真實?
(3)這個原因一定會引出這個結果嗎?是否有其他的原因?
如果假設的原因和結果都為真,對這3個問題可以做如下啟發式的提問。
(1)使用現金及優惠券獎品,一定會使成交效果更好嗎,是否有其他的方式?
(2)不使用這兩種獎品,活動就一定不能做嗎,是否有其他的獎品?
(3)活動沒法做,一定不能促進保險交易的成交嗎,是否有其他的方式?
此時,我們會發現一些表面上的原因只是結果的必要不充分條件。應先對結論提出假設,并設計實驗或采取其他的手段來驗證假設,最終驗證結果才是真正的結論。

4 批判性思維:保持懷疑
上述的因果分析過程中也應用了批判性思維工具。
批判性思維一般包括理性的、保持懷疑的和無偏見的分析,以及對事實證據的評估等。思考者通過熟練地分析、評估和重構來提高其思維的品質。批判性思維是自我指導、自我約束、自我監督和自我糾正的思維。批判性思維著重研究如何系統地構建清晰的思路,以及研究不清晰思路的特征。
對于數據分析師來說,時時運用批判性思維的習慣能讓他們透過現象看清問題的本質,并做到去偽存真。
5 結構化思維:形成系統
另一個有用的邏輯思維工具是把事物結構化。結構化思維是從整體思考到局部思考,先對事物進行分解,然后歸類分組,最后總結概括。這是一種層級分明的思考模式,運用它可以把零散的信息整理成結構清晰的系統。
大家可能聽說過麥肯錫咨詢公司第一位女顧問芭芭拉·明托所著的《金字塔原理》。她總結出分為3個步驟的金字塔式結構化思維方法。
(1)歸類分組,將思想組織為“金字塔”。
(2)自上而下表達,結論先行。
(3)自下而上思考,總結概括。
這種方法看似簡單,實際上用處極大,運用它可以將碎片化的信息進行系統化的思考和處理,把復雜的事物分了層次,輔助我們更全面地思考,如下圖所示。

結構化思維的好處
沒有結構化的思維是零散混亂、無條理的想法集合,而結構化思維是一種有條理、有層次,脈絡清晰的思考模式。
在結構化思維的分組過程中,要先發散,后總結,而且要遵循MECE原則。MECE是4個英文單詞Mutually、Exclusive、Collective、Exhaustive首字母的組合,意思是各個部分之間相互獨立,沒有重疊;所有部分完全窮盡,沒有遺漏。
前面提到的SWOT矩陣、KANO模型,以及5W2H方法,其實都是從結構化思維衍生出來的分析工具。
在做數據分析的過程中,培養結構化思維十分重要,平時要刻意運用這種思維方法找邏輯結構,鍛煉自己系統思考的能力。
6 圖解思維:一圖勝千言
俗話說,一圖勝千言。另一個非常有用的思維工具是圖形,用圖形而非文字去引導思維往往效果更好。
法國數學家阿蘭·孔涅曾說,數學當中的幾何對應于大腦的視覺區域,并且是一種瞬時的、即刻的直覺。在這里,我們看到了一種幾何圖像,嘣!就是它,這就是一切,甚至不需要我們去解釋,我們不想去解釋。作家采銅在其著作《精進》中也提到,一張圖表,能夠直接激發直覺思考。這種直覺思考能引發頓悟,幫助人突破思考的瓶頸。
為什么會這樣?
一是作為一種直觀的表達,圖片比語言文字更有優勢,它可以讓復雜的關系更好地展現,因此圖形、圖表比在紙面上占據同樣空間的文字傳達的信息量更大。
二是用圖片展示信息,分擔了人腦中工作記憶的負荷——一般認為大腦同時只能處理(7±2)個元素,突破了內存瓶頸后,工作記憶將有更大的活動空間,它可以參與更深、更廣的思考。

咖哥在數據大屏幕前介紹圖形與圖表的重要性
因此,數據分析師都強調數據的可視化。這不僅是因為老板喜歡看圖,還源于上述理論的潛意識支配——我們每個人都更愿意從圖中獲取信息。而一張精美的數據可視化圖表不僅能展示大量的信息,還常常能夠把數據間的隱藏關系直觀地展現出來。
7 指標思維:北極星指標
指標的重要性不言而喻,在指標思維這個部分,我將介紹北極星指標、虛榮指標和魔法數字這些概念,然后給出優秀數據指標的一些特點,最后介紹互聯網行業數據的指標體系的演進過程。
《精益數據分析》一書中提醒創業者在一段時間內只專注于某一個引擎。例如,先專注于讓你的產品對核心用戶產生黏性,接著把主要精力放在使其呈“病毒”式增長,最后再全力利用增長后取得的用戶基數來增加營收,這就是專注。在數據分析的世界里,這意味著僅挑選一個指標,該指標對你當前所處的創業階段無比重要。
這個指標就是北極星指標(North Star Metric),也叫第一關鍵指標(One Metric That Matters)。它是指在產品的當前階段與業務、戰略相關的絕對核心指標,它就像北極星一樣,指引整個團隊向同一個方向邁進(提升這一指標)。它是一個在當前階段高于一切、需要集中全部注意力的指標。
目前的數據管理系統和數據分析工具很多,各種數據指標也很多,讓人眼花繚亂,切記不要因能跟蹤的數據太多而分散了注意力。我們可以捕捉所有的數據,但只應關注其中的那些重要數據。
而聚焦于最重要的業務場景,意味著我們要選擇關鍵指標,摒棄虛榮指標。什么是虛榮指標?例如在營收不足、現金流陷入危機的情況下仍然只注重流量、增速,那么流量和增速就是虛榮指標。
表2中粗略分析了一些知名產品和商業模式,并給出了它們可能對應的北極星指標。
表2 知名產品和商業模式所對應的北極星指標

除北極星指標外,肖恩·埃利斯(Sean Ellis)的《增長黑客》中還經常提到魔法數字,這也是一個關鍵指標。如果說北極星指標是長遠目標,魔法數字則是當前行動指南。例如,通過數據分析,某公司發現了高黏性用戶的“秘密”之一:在80% 的情況下,高黏性用戶會在第一次購物后的30天內完成第二次購物;LinkedIn用戶在一周內添加5個社交好友,Facebook用戶在10天內添加7個好友,這樣就能夠保證較高的留存率。這些例子中的“30天”“5個”“7個”就是《增長黑客》中的魔法數字。
優秀的數據指標有如下特點[14]。
[14] 原說法來自《精益數據分析》第2章“創業的記分牌”,本書根據筆者的實踐經驗做了一些提煉與擴展。

優秀數據指標的特點
上圖中對各特點的說明很簡短,但是含義深刻。例如,兩個指標“年銷售額增量”和“日新獲客數”,哪個更好?對于CEO來說,可能需要的是年銷售額的突破;但是對于完成日常業務的運營人員來說,也許更應該聚焦于每天的新獲客人數,通過“日新獲客數”他才知道近期的方案是否有效。這就說明優秀的數據指標能夠引領行動。因此,不同指標在不同的場合發揮的效用有差異。在運營人員調整短期獲客方案的場景中,“日新獲客數”指標就好過“年銷售額增量”指標。
從互聯網產品的發展歷史來看,隨著技術的創新和業務模式的進化,常用的指標體系從最早的聚焦于流量監控的PULSE指標體系,到衡量用戶體驗的HEART指標體系。現在互聯網產品間的差異越來越小,公司之間的競爭陣地從產品切換到運營,于是近幾年開始流行基于AARRR的指標體系[15]。這個指標體系的演進過程如表3所示。
[15] “三元方差”公眾號的文章《數據分析指標思維》和李啟方的知乎文章《數據指標體系的演進》等文章中都提及了數據指標體系從PULSE到HEART再到AARRR的演進,大家可以了解一下。
表3 近幾年開始流行的基于AARRR的指標體系的演進過程

也有人提出了從AARRR進一步過渡到RARRA的想法,即AARRR中5個階段的次序變為留存(Retention)→激活(Activation)→自傳播循環(Referral)→變現(Revenue)→獲客(Acquisition)。在這個模型中,指標本身沒有發生變化,但運營思路變了,AARRR以獲客(A)為起點,而RARRA則以用戶留存(R)為起點,也就是一切動作都以用戶的留存為核心,同時也更強調現有用戶在推薦和獲客中的作用。
其實,AARRR也好,RARRA也罷,這些指標之間原本就不存在固定的順序和明確的界限。當移動互聯網運營進入“下半場”,競爭日趨白熱化,每一個“大廠”都已經存儲了足夠的“流量池”后,那么重心當然應該從獲客轉移到留存上來,持續提高產品和服務的口碑,以老帶新,這是基業長青之根基。
8 細分思維:分組與分類
細分思維也是結構化思維的“衍生品”。這里對其進行強調是因為這種思維工具在數據分析過程中太有用,值得為其單獨命名。細分思維就是對產品、用戶、運營策略及各種數據做單一維度或多維度的拆解、分組,再進一步細分,比較各組之間的差異。用戶畫像、波士頓矩陣、RFM模型、漏斗分析等,都是細分思維的應用。
在數據分析工作中,細分的維度非常多,如時間、地區、渠道、產品、員工、用戶、行為、消費狀況等[16]。
[16] 此處“細分思維”的說法參考了“三元方差”公眾號的文章《數據分析細分思維》。
9 對比思維:找到變化點
剛才在學習優秀的數據指標時,我們知道了優秀的數據指標具有比較性質。在數據分析過程中,對比思維是非常實用的工具。通過對比數據,我們才能夠看出變化,計算增速,或者找到問題。
對比通常有兩個方向,一個是縱向,它是指不同時間的對比,如將去年同期的獲客數和今年同期的獲客數進行對比;另一個是橫向,它是指與同類產品相比,如將QQ的日活躍數和微信的日活躍數進行對比。
對比思維和細分思維經常結合起來使用,先分組,再對比。它們的特點是簡單,人人都能理解,但又非常實用。這說明越簡單的工具,往往越有大用,越有妙用。
10 用戶思維:初心不可忘
數據分析與運營都是為了獲客、激活、留存和增長。而這一切的最終目的是什么呢?就是為了給用戶提供他們所需要的服務。現在各個公司都把做用戶畫像、了解用戶、研究用戶的心理放在比較高的優先級,就是因為他們知曉了這個道理。
前面講過的KANO模型就是用戶思維的體現,它通過對用戶核心的需求進行優先級排序,確保產品和服務能解決用戶的痛點問題。而從AARRR到RARRA的演進,更是突出了用戶在持續增長過程中的關鍵作用。
無論是做產品、做運營、做市場,還是做數據分析,心里都要有為用戶服務的精神,這樣事情才能做得更好,路才能走得更長遠,這也就是不忘初心,方得始終。
11 真實思維:以事實為真
真實思維是以尊重事實為導向的思維,這看似與數據分析完全無關,但是又非常值得一提。
彼得·德魯克有句名言:一切無法用指標來衡量的東西都無法被管理(If you can't measure it, you can't manage it)。主觀的認知總會有偏差,但是數據是不會說謊的。
粥左羅在《學會成長》中提到了開面館的例子,如果以盈利為目的,商家就要根據真實的反饋信息不斷優化口味、提升服務品質、提高質量。但如果開面館是為了做慈善,免費給大家吃面,大家不花錢也就不提意見。該面館收不到真實的反饋信息,產品和服務品質就有可能弱于以營利為目的的面館。
對于處在創業、發展和守業各個階段的互聯網公司來說,真實思維就意味著認真地分析現狀,正確認識自身發展的實際情況,確定合理的目標,不虛榮地追逐數據,不弄虛作假,不急功近利,不追求紙面上的急速增長。否則,公司有再優秀的數據而沒有根基,它也可能只是曇花一現。
今天我的分享就以真實思維結束吧。我希望有一天,你發現精心準備的數據分析報告并不是總能與你所期待的結果相匹配,請不要強行用數據解釋結果,或者刻意忽略掉某些本不應該忽略的因素。而應該從始至終尊重事實,從事實出發,尋根究底,發現不足。要有接受數據分析不是“萬能靈丹”的勇氣,也要敢于找出數據背后隱藏的事實真相。
尊重數據,更要尊重數據背后的真相,這才是一個數據分析師應該具有的最大勇氣。
“等等,我還有問題!”小雪看咖哥手臂一揮,定格在那里,心想這冗長的演講終于進入了尾聲,趕緊發問:“第一,你到底是怎么知道我昨晚到今天早上的行蹤的?第二,我這面試到底過沒過?”
咖哥笑著說:“先回答你的第一個問題。剛才在“邏輯思維:演繹與歸納”的部分,我提到了演繹推理——從一般性原理出發, 經過邏輯推理,從“已知”推知“未知”,以解釋具體事件或者現象。而我正是用類似的方法通過數據對你的行蹤進行了演繹推理,我把它稱為‘數據演繹法’。”
咖哥頓了頓,開始詳細解釋:“昨天,我把公司的招聘海報發給了幾個朋友。很快,你姐姐就打電話給我,說了說你的情況。她說你是名校畢業,覺得自己在之前的公司學不到太多東西,對這邊的工作環境很有興趣。昨天下午4點25分,我在后臺數據系統看到用戶名為“小雪”的ID關注了“咖哥數據科學講習所”公眾號,然后,我們這個‘小芝麻’公眾號各篇文章的瀏覽量就開始+1、+1、+1了,一直到深夜還有人在訪問。”
小雪輕輕地點了點頭,心想:“難怪了,我昨天看咖哥的文章的確看到很晚。”
“看得出來你對我們公司挺有興趣的,所以小雪,我相信你是一個很認真的面試者,而且現在你對我們的工作風格可能也有點了解了。你給我們公眾號的最后一次點贊發生在今天早晨8點36分。我剛才看了眼實時數據,之后我們的公眾號就再沒有任何其他的訪問信息了。這說明,你大概在8點36分下了公交車。而且我想,你可能有一個走路不看手機的好習慣。”
“從地鐵站到我們公司,一共就那么幾路公交車,哪路車大概什么時間到站,我當然是了如指掌。根據8點36分這個時間細節,推測出857路公交車對我來說不是難事,哈哈。”
“也許你覺得我在故弄玄虛,其實我賣這個關子想表達的是:既然數據無處不在,對數據的分析就是無處不在的。這種‘福爾摩斯’式的數據思維能帶來很多意外驚喜。不過,我這里運用的‘數據演繹法’和我們常用的因果推理法不太一樣,它有點像貝葉斯的后驗概率模型,是由果到因的逆向推理,而且其中不僅應用了演繹法,還整合了歸納法和其他思維方法……好啦,說多了,你今天的面試就過關了吧。明天來公司,先實習,我們一起做項目,之后你就更加清楚我所說的‘數據思維’和‘數據演繹法’是什么了!”