- 數據中臺架構:企業數據化最佳實踐
- 張旭等
- 6字
- 2020-06-05 16:54:48
2 企業數據化
2.1 企業數據化認知
2.1.1 企業數據化的定義
企業作為社會的重要組成部分也在經歷同樣的信息化過程和數據化過程。我們定義的企業數據化為對信息化建設所產生的所有數據和其他內外部數據進行加工與挖掘,產生更多高價值數據,并把這些高價值數據應用于企業管理和經營的過程。
按照這一定義,其實企業很早就已經開始了數據化工作,比如制作各種統計報表的工作、傳統的數據倉庫和商業智能建設工作、數據挖掘工作等。但是當前的一些內外部變化正在推動企業進入全面數據化時代:
(1)企業信息化建設的進一步完善與物聯網等技術的推進讓企業進入真正的數據爆發階段。
(2)數據應用技術和解決方案的成熟為企業帶來了更多的場景。
(3)數據計算技術的成熟、產品的成熟、成本的降低讓很多數據類應用的成本降低,使其可以進入應用階段。
(4)企業外部競爭加劇,精細化管理的要求日益增強,數據化管理思維逐漸被接納和認可。
(5)當前數據應用的推進阻礙、數據源的孤立讓數據化建設進入深水區。
2.1.2 數據分類
我們從價值視角對企業內的數據進行分類(如圖2-1所示),以便后續進行有針對性的區分和處理。

圖2-1
1.知識、情報數據
知識、情報數據是數據中的精華部分,是勞動實踐中的智慧結晶。
2.統計結果數據
統計結果數據是數據的匯總,是事物的宏觀總結,包括各種指數和各種統計結果。統計模型和復雜程度決定了統計結果數據的計算難度與業務價值。
3.交易數據
交易數據是重要的,是關于財、物、責任的記錄,是嚴謹的、不可篡改的。比如,合同、財務憑證、出入庫的記錄單據。
4.行為數據
行為數據是指我們所關注的客觀存在的行為的數據。比如,人的行為、產品的行為、項目的各種情況、資產的運轉情況等數據。這些行為數據的重要性要低于交易數據,而數據量是交易數據的2~3個數量級甚至更多。我們以往很難將這些數據持久化,主要的原因是持久化的成本太高,但是應用價值不高。隨著存儲成本的降低,越來越多的行為數據被存儲,同時大數據技術在行為數據中也獲取到了大量的業務價值。
5.無意義的雜亂數據
天空中的一聲鳥鳴、森林中一朵花的綻放、未知星球上的一場巨型離子風暴等都是雜亂數據。數據是無窮無盡的,只要人們覺得無法使用或者無關緊要就可以把它們暫時歸類為雜亂數據。