- Excel電商數據分析與應用(第2版·微課版)
- 蔣長兵 陳海城 朱景偉編著
- 896字
- 2024-09-05 16:37:14
1.2.4 數據分析工具
掌握兩個及兩個以上的分析工具能更好地進行數據分析,分析工具大體可分成以下3類。
(1)數據庫:按照數據結構來組織、存儲和管理數據的倉庫,常見的數據庫有Access、MySQL、Oracle、DB2等。
(2)數據分析與可視化:用于組織數據并進行數據分析和可視化的工具,常見的工具有Excel、Power BI、Tableau等。
(3)統計與挖掘數據:用于進行統計分析和數據挖掘的工具,常見的工具有R語言、Python、SPSS、SAS等。
根據企業的不同需求階段,數據分析人員需要掌握的工具有所不同,具體如下。
第一階段:這個階段的數據一般用Excel或WPS文件存儲,數據文件多而雜,經營多年的電商企業甚至會有超過10萬張的歷史數據表格。企業無法對龐大的歷史數據進行分析,數據管理雜亂。這個階段企業需要解決數據的統一管理及分析問題,可選用Excel和MySQL工具。Excel解決分析層和應用層的問題,MySQL解決大量數據的存儲和計算問題,且Excel和MySQL在國內企業的占有率和普及率都相對較高。
第二階段:這個階段企業已經實現了數據的統一管理和分析,但隨著數據量的增加和數據應用能力的提升,Excel已經滿足不了對大量數據進行多表建模聯合分析的需求,可能刷新一個分析模型文件所需的時間都會很久。此時需要使用BI產品滿足復雜的業務建模需求,企業可選用微軟旗下的Power BI。部分企業在這個階段會有專業統計方法和數據挖掘的需求,可選擇SPSS,其使用難度不大。SPSS有兩個工具。一個是Statistics,用于統計分析;另一個是Modeler,用于商業數據的分析與挖掘。SPSS在國內企業的占有率較低。
第三階段:這個階段的企業已經屬于數據驅動型企業,數據應用需要在生產、流通、銷售和管理等各個環節滲透。隨著數據種類的復雜化,原有的數據采集、清洗及算法應用的效率已經滿足不了需求。要運用IT技術和算法解決商業問題,真正將數據轉變成生產力,可以在R語言和Python之間擇其一,這兩者都是應用非常廣泛的編程語言。
第四階段:這個階段的企業已經是資深的數據驅動型企業。進入這個階段的企業只有少數的龍頭企業,他們通過技術手段極大地提高工作效率和商業收益,轉入智慧商業領域,運用大數據和人工智能升級改造所有的環節。企業在這個階段需要應用大數據框架(如Hadoop等)來解決并發問題,并用人工智能框架(如TensorFlow等)來解決應用問題。