- 商業智能數據化運營實戰
- 王鑫
- 3207字
- 2022-08-16 16:57:12
1.4 數據化運營應掌握的技能與工具
數據化運營需要業務人員通過數據化的工具、技術和方法,對運營過程中的各個環節進行科學的分析,為數據使用者提供專業、準確的行業數據解決方案,從而達到優化運營效果和效率、降低運營成本、提高效益的目的。“工欲善其事,必先利其器”,這里對數據化運營過程中的所需技能和常用工具進行介紹。
1.4.1 數據化運營的五種能力
作為一名合格的數據化運營人員,需要具備數據處理能力、數據分析能力、數據呈現能力、數據決策能力、計算機及數據分析信息技術五種能力,如圖1.8所示。

圖1.8 數據化運營人員知識體系架構圖
(1)數據處理能力:數據化運營人員應該靈活掌握數據獲取、數據存儲與數據預處理的技能。其中,在數據獲取方面,要求業務人員能夠認知數據產生的時間、條件、格式、內容、長度、限制條件等,能針對性地實施和控制數據產生和采集的過程,加深對數據的理解程度;在數據存儲方面,要求業務人員掌握數據存儲基本理論,了解云端數據存儲和本地數據存儲,掌握MySQL、Oracle、SQL Server等數據存儲系統,了解數據存儲內部的工作機制和流程;在數據預處理方面,要求業務人員熟知數據處理規則,能實際解決數據分散、不清潔問題,具備與業務需求相結合的能力,保證動態和迭代更新的數據存儲和處理達到及時、完整、有效、一致、準確。
(2)數據分析能力:數據化運營人員應該掌握數據挖掘和模型構建技術,明確業務場景、確定分析目標、構建分析體系、梳理核心指標,并通過評估標準衡量模型的效果,能夠進行商業運行和模型解釋。業務人員需要做的是,明確業務場景,對于不同的業務場景,分析體系隨之不同;結合業務問題確定分析目標,列出核心指標,搜集整理所需要的數據。
(3)數據呈現能力:數據化運營人員應該掌握數據呈現工具,能夠運用圖表和圖形將業務信息與決策方案清晰、明確地展現出來,使分析結果一目了然。圖表設計是門大學問,如何選擇圖形,如何進行版式設計,顏色怎樣搭配等,都需要掌握一定的設計原則。
(4)數據決策能力:數據化運營人員應該對分析結果進行業務應用和解讀,將數據分析結果反饋到業務操作過程中。通過業務場景確定受眾和了解受眾的需求和習慣,能及時從相關的數據庫中搜索挖掘出信息以滿足特定時間、地點、場景的需求,最終基于業務驅動的數據化運營方法,為業務需求提供解決方案。
(5)計算機及數據分析信息技術:在商業智能時代,任何業務運營都將以底層數據為支撐,數據化運營人員需要掌握一定的計算機及數據分析信息技術,才能靈活地運用數據,相關工具既包括集搜客、SQL數據庫、OpenRefine等數據處理工具,又包括Python、R語言、Excel等數據分析工具,還包括Tableau、Gephi、水晶易表、ECharts等數據可視化工具。
1.4.2 數據化運營的常見工具
正如上文所講,數據化運營人員需要具備五種核心能力,其中的計算機及數據分析信息技術可以將數據靈活運用,解決業務問題,為企業提供解決方案。一款功能強大的數據化運營工具,將極大地提升數據化運營人員的工作效率。這里,我們針對數據處理、數據分析和數據可視化幾種能力的實現,介紹一些常見的數據化運營工具。
1.數據處理工具
集搜客:集搜客網頁數據抓取軟件是一款專業的網頁數據采集/信息挖掘處理軟件,能夠輕松抓取網頁文字、圖片、表格、超鏈接等多種網頁元素,并得到規范化的數據。通過集搜客網頁數據抓取軟件,整個Web都可以成為用戶的數據庫,有效降低數據獲取成本,得到全面、靈活的多維度行業數據,界面如圖1.9所示。

圖1.9 集搜客網頁數據抓取軟件界面
SQL數據庫:SQL(Structured Query Language)是具有數據操縱和數據定義等多種功能的數據庫語言,這種語言具有交互性特點,能為用戶提供極大的便利,數據庫管理系統可以充分利用SQL語言特點提高計算機應用系統的工作質量與效率。SQL不僅能獨立應用于終端,還可以作為子語言為其他程序設計提供有效幫助,在這些程序中,SQL可與其他程序語言一起優化程序功能,進而為用戶提供更多、更全面的信息。SQL Server數據庫包括Microsoft SQL Server和Sybase SQL Server兩個子數據庫,該數據庫能否正常運行直接關系著整個計算機系統的運行安全。SQL數據庫軟件界面如圖1.10所示。

圖1.10 SQL數據庫軟件界面
OpenRefine:OpenRefine軟件前身是谷歌公司開發的數據清洗工具GoogleRefine,隨后于2012年開放源代碼,改為現在的OpenRefine。該軟件是一款基于計算機瀏覽器的數據清洗軟件,在數據清洗、數據探索及數據轉換方面非常有效,可以在計算機中直接運行,這樣可以避免上傳指定信息到外部服務器的問題。OpenRefine軟件類似于傳統Excel處理軟件,但是工作方式更像數據庫,以列和字段的方式工作,而不以單元格的方式工作。OpenRefine軟件界面如圖1.11所示。

圖1.11 OpenRefine軟件界面
2.數據分析工具
Microsoft Excel:這款大家熟悉的電子表格軟件已經被廣泛使用20多年了,以至于現在有很多數據只能以Microsoft Excel表格的形式獲取到。在Microsoft Excel中,讓某幾列高亮顯示、做幾張圖表都很簡單,用戶很容易對數據有大致的了解,然而Microsoft Excel局限在它一次所能處理的數據量上,因此用Microsoft Excel來進行全面的數據分析或制作公開發布的圖表會有難度。Microsoft Excel軟件界面如圖1.12所示,在Microsoft Excel中內置圖表工具,利用這個工具可以方便快捷地插入已有的圖表。

圖1.12 Microsoft Excel軟件界面
Python:Python由荷蘭數學和計算機科學研究學會的Guido van Rossum于1990年代初設計,作為ABC語言的替代品。Python提供了高效的高級數據結構,還支持簡單有效的面向對象編程。Python簡潔的語法、動態的數據類型,以及解釋型語言的本質,使它成為多數平臺上寫腳本和快速開發應用的編程語言。隨著版本的不斷更新和語言新功能的添加,Python逐漸被用于獨立的、大型項目的開發。Python解釋器易于擴展,可以使用C或C++(或者其他可以通過C調用的語言)擴展新的功能和數據類型。Python豐富的標準庫提供了適用于各個主要系統平臺的源代碼或機器代碼。Python軟件界面如圖1.13所示。

圖1.13 Python軟件界面
R語言:R語言是用于統計分析、繪圖的語言和操作環境。R語言屬于GNU系統的一個自由、免費、源代碼開放的軟件,是一個用于統計計算和統計制圖的優秀工具。R語言是一套由數據操作、計算和圖形展示功能整合而成的套件,包括有效的數據存儲和處理功能、一套完整的數組(特別是矩陣)計算操作符,擁有完整體系的數據分析工具,可以為數據分析和顯示提供強大的圖形功能,是一套(源自S語言)完善、簡單、有效的編程語言(包括條件、循環、自定義函數、輸入輸出功能)。R語言軟件界面如圖1.14所示。

圖1.14 R語言軟件界面
3.數據可視化工具
Tableau:Tableau致力于幫助人們查看并理解數據。Tableau可以幫助任何人快速分析、可視化并分享信息,如圖1.15所示。Tableau的程序很容易上手,各公司可以用它將大量數據拖放到“畫布”上,轉眼間就能創建好各種圖表。這款軟件的理念是,界面上的數據越容易操控,公司對自己在所在業務領域里的所作所為到底是正確的還是錯誤的,就能了解得越透徹。

圖1.15 Tableau軟件界面
Gephi:Gephi是一款開源免費跨平臺基于JVM的復雜網絡分析軟件,主要用于各種網絡和復雜系統,是動態和分層圖的交互可視化與探測開源工具,具有探索性數據分析、鏈接分析、社交網絡分析、生物網絡分析等功能。Gephi軟件界面如圖1.16所示,其窗體中的圖形是一個典型的由節點和連線生成的Gephi圖形。
水晶易表:水晶易表(Crystal Reports)是一款商務智能(BI)軟件,主要用于設計及產生報表。水晶易表是專業的報表系統,具有強大的報表功能,包括使用各種資料來源制作報表、功能強大的設計與格式設定能力、具有彈性的分析能力、快速的報表處理能力、靈活的報表傳送作業能力、可擴充的Web報表制作能力,可以將精巧報表的制作能力結合到用戶的Windows及Web應用程序上,讓用戶享用前所未有的彈性與操控能力。水晶易表軟件界面如圖1.17所示。

圖1.16 Gephi軟件界面

圖1.17 水晶易表軟件界面
ECharts:ECharts是國內百度公司開發的JavaScript的圖表庫,兼容性好、使用簡單,提供了大量直觀、生動、可交互的數據可視化圖表,其底層基于ZRender創建了坐標系、圖例、提示、工具箱等基礎組件,并在此基礎上構建出了折線圖(區域圖)、柱狀圖(條狀圖)、散點圖(氣泡圖)、K線圖、餅圖(環形圖)、地理坐標/地圖、熱力圖等,同時支持任意維度的堆積和多圖表混合展現。ECharts軟件界面如圖1.18所示。

圖1.18 ECharts軟件界面