- 企業數據治理與SAP MDG實現
- 程旺編著
- 4726字
- 2021-03-23 16:31:50
3.3 數據管理
數據管理作為企業數據管理規劃的核心組成部分與方式舉措,其主要包括數據標準與指標管理、主數據管理、元數據管理以及數據質量管理等方面的內容,如圖3-2所示。

圖3-2 企業數據管理架構
下面依次對其中的內容進行闡述。
1.主數據管理
主數據作為企業數據的核心業務載體(如物料、分類、客戶、供應商、科目、組織、崗位、人員等),在多個業務流程中被反復利用與共享,所以在過去的信息化歷程中,各個企業都有多個業務系統中存在相同主數據入口與維護方式的問題,其關注點在如何將線下流程搬至線上各部門的業務活動,而忽視了從企業統一視角管理主數據的口徑、標準、質量、組織、流程等方面的內容。作為企業數據管理的基礎,主數據的管理規劃自然成為排頭兵。其主要建設內容包括主數據標準、模型、管理組織流程與職責、管理制度與規范、數據清理方案、生命周期閉環管理以及主數據平臺建設與集成應用等方面。
2.數據標準與指標管理
從價值管理的角度看,數據標準主要分為兩大類:基礎數據標準及指標數據標準。其中,基礎數據標準管理的主要是主數據與交易數據,作為支撐數據為指標服務,而指標數據標準則對應管理人員相對關注的指標部分,通常為管理人員提供輔助決策分析。在整個數據標準建設過程中,不僅包含數據標準本身,還包含制訂標準的組織、標準維護的流程、績效考核體系、技術平臺建設等一系列的內容。后續在數據標準與指標體系規劃章節重點講解。
3.元數據管理
元數據是描述其他數據的數據(Data about Other Data),或者說是用于提供某種資源的有關信息的結構數據(Structured Data)。根據NISO(國家信息標準組織)的定義,元數據是描述、解釋、定位或以其他方式使信息資源更容易檢索、使用或管理的結構化信息,不需要維護各種工具之間的雙向連接來交換數據。其使用目的在于:識別資源;評價資源;追蹤資源在使用過程中的變化;實現簡單高效的大量網絡化數據管理;實現信息資源的有效發現、查找、一體化組織和對使用資源的有效管理。
由于元數據也是數據,因此可以用類似數據的方法在數據庫中進行存儲和獲取。如果提供數據元的組織同時提供描述數據元的元數據,將會使數據元的使用變得準確而高效。用戶在使用數據時可以首先查看其元數據以便能夠獲取自己所需的信息。
元數據分為業務元數據、技術元數據和操作元數據。業務元數據指導技術元數據,是定義業務相關數據的信息,用于輔助定位、理解與訪問數據信息。其主要包括業務指標、規則、數據質量規則、專業術語、數據標準、實體與屬性等。技術元數據以業務元數據為參考,如數據的存放位置、數據的存儲類型、數據的血緣關系等,其中,關聯性技術元數據描述了數據之間的關聯和數據在信息技術環境中的流轉情況,包括技術規則、質量規則的技術描述、字段、衍生字段、維度、統計指標等。操作元數據為兩者提供管理支撐,主要包括與元數據管理相關的組織、崗位、職責、流程、版本以及系統生產運行的操作記錄等。
元數據的建設內容主要分為三個方面:元數據模型、元數據生命周期管理及元數據治理。其中,元數據模型用于描述內容管理系統中內容的所有元數據屬性及相關定義,定義的過程應盡可能實現自動化并簡化用戶輸入。元數據生命周期管理即管理元數據從產生到消亡的全過程,跨越了定義、校核、批準、創建、更新等一系列環節。而元數據治理過程應首先成立相應的元數據治理組織,并明確各主體相應的責任,整個組織建議由三個部分組成:元數據管理委員會、元數據管理工作小組和元數據管理員。
4.數據質量管理
數據質量管理是數據管理的重要組成部分,高質量的數據是企業管理報表和管理駕駛艙建設的重要保證。數據質量的標準見表3-1。
表3-1 數據質量標準

為了保證上述質量標準在企業中得到推行與保障,需要對數據質量的管理方法與建設內容進行梳理。
(1)關于數據質量管理方法
數據質量管理方法有多種,如按需啟動項目,對數據質量采取主動保證措施,為未來數據質量的提升提供支持,主要包括明確業務需求、反推數據管理需求、進行設計與實施。也可以對存量數據進行剖析和清洗,提升既有數據質量,具體包括發現問題、分析問題、提升質量和動態驗證,最后在檢查的過程中發現問題,然后進行問題的原因分析,進而提升數據質量。發現問題以后,針對問題進行整改,需要明確管理組織、管理制度和管理流程。
(2)關于數據質量建設內容
數據質量建設內容主要包括三個方面,即數據質量預防過程、數據質量管理過程和數據質量保障。其中,數據質量預防是指事前控制數據質量,主動發現數據質量問題,減少對后續數據使用的影響。數據質量預防是問題解決驅動和業務需求驅動,需要分析問題產生的根源和業務的真實需求,然后進行相應的系統改造和流程優化,在數據產生的前端進行控制。
數據質量管理過程具體是指針對企業當前的數據應用現狀進行質量剖析,確定數據質量的提升范圍和提升目標以及與之相配套的質量提升計劃;根據數據質量剖析的結果評估數據質量問題的嚴重性,出具數據質量報告,評估對下游的影響以及可能帶來的數據風險;針對不同的問題或者風險進行數據質量整改方案設計,制訂相應的數據清洗規則,然后集中進行數據清洗,并對清洗的結果進行監控和持續優化。數據質量的提升需要一定的保障措施,主要是建立數據質量管理組織,制訂數據質量管理標準和管理流程,并制訂數據質量度量規則,方能有效保證數據質量提升能夠順利落地。
當然,數據質量的提升不是一蹴而就的,而是伴隨數據質量工程的逐步迭代與相關組織人員的不斷努力以最終達到企業數據質量管理的目標。
5.數據生命周期管理
數據生命周期管理是一種數據管理策略型方法論,用于管理信息系統或企業業務運營、職能管理的數據在整個生命周期內的流動:從創建和初始存儲,到它過時被刪除。完整的數據生命周期包含創建、存儲、使用、共享、歸檔、銷毀等階段。
數據是企業的資產,其生命周期往往大于硬件設備與系統應用的生命周期。數據的爆發式增長,使企業在數據安全、法規遵從、服務質量等方面均面臨著極大的挑戰。
(1)數據安全
首先,海量數據的備份、恢復成為難題,系統的高可用性難以保證;其次,客戶信息、企業信息等隱私數據在測試、開發、維護等外包環節中面臨惡意泄露或意外發布;然后,出于審計等要求的歷史數據訪問與提供難以保證數據的正確性與不可更新性;最后,多個數據克隆直接導致數據安全環節的增加,數據的訪問、發布與獲取更加難以控制、跟蹤。
(2)法規遵從
集團與行政規范對數據的可用性、安全性與可追溯性提出要求;因不符法規而造成的潛在經濟、行政處罰損失往往大大高于系統建設成本;審計、公安、司法等部門對于歷史數據的審計均提出了指標性要求;敏感數據的安全性與企業最高領導者的責任直接掛鉤,存在觸犯法律與企業形象受損的風險。
(3)服務質量
由于海量數據導致的新業務上線難以保證按時、按質交付,系統性能難以保證;數據泄露與系統宕機等事故可能直接導致現有客戶的流失、工程的停工,甚至合同違約責任等。
針對上述需要關注的內容,企業面對未來數據管理可能面臨的各類挑戰,就需要建立起完善的數據生命周期管理機制。具體分為以下幾個方面。
(1)組織內部知識體系建設
提高整個集團的數據生命周期管理意識。管理層要首先對數據生命周期管理有較高的認識及推動力,無論是信息化管理抑或是在業務管理過程中不斷增強各級單位、各部門對數據全生命周期管理的意識。集團需要有專人或專業組織處理不可預測的數據問題,靈活、高效地應對集團可能出現的數據阻斷性問題。每個業務單元的危機處理團隊能夠用標準的計劃和程序向集團級的中央危機處理團隊報告。培養內部技術專家,提高對信息人員的技能要求。信息化工作人員對當前企業信息化基礎設施以及行業趨勢和新技術應具有廣泛、深入的了解,并能夠定期培訓業務用戶,使用戶具有引入和影響新興技術在企業中廣泛應用的能力(或機制)。
(2)流程及制度建設
建立各類數據(結構化、非結構化)生命周期管理的標準流程。對于數據產生、存儲、使用、存檔、檢索、清除這一系列管理過程,應進行標準化管理,并對集團內各類項目提出統一的管理框架要求。在未來,能夠將集團的數據生命周期管理流程推廣至施工總承包行業,成為行業范本。優化數據需求提出流程。信息化部門能夠準確捕獲、評估業務管理及職能管理中的利益相關方所提出的數據需求,并在各類項目的建設中通過信息化部門及業務部門的雙向合作,不斷優化業務部門提出數據需求至信息化部門進行需求評估的流程。
(3)提出容量規劃建設要求
集團層面需對呈爆發式增長的數據量進行提前預測,使整個集團能夠作為一個數據集合整體進行容量規劃建設。新興技術不斷發展,傳感器、社交媒體等外部大數據的存儲也需納入考慮范圍。集團應建立起完善的流程,對各級單位、各部門容量規劃進行監督、指導并匯總。
(4)合規性建設
對數據從產生到清除的一系列過程,集團均需對下屬公司提出要求,并定期監控各級單位的合規性建設執行情況,對相應指標進行考核。對于整個集團所涉及的信息系統建設,需要有官方渠道發布的變革管理措施,例如集團統建的官方公文發布渠道,而不僅僅是用郵件或內部通信工具傳遞。
(5)技術支撐
開發數據資產庫存管理工具。集團未來應逐步推動,將各級單位、各部門的各類項目及日常工作、業務運營過程中所產生的數據進行統一管理,而不是將數據資產局限于項目級管理或公司級管理。集團可通過開發成熟的工具,在提供保密機制的同時提高數據資產在集團內部的流通性。
6.數據安全管理
數據安全管理是企業整體信息化與數字化的基本要求,每個公司都有自己的一套安全體系要求,在大數據平臺或其他數據系統中更多的是安全制度的落實、安全制度的提升和安全能力的加強。
通過計劃、發展并執行數據安全策略和措施,為數據和信息提供適當的認證、授權、訪問和審計。
數據安全有對立的兩方面的含義:一是數據本身的安全,主要是指采用現代密碼算法對數據進行主動保護,如數據保密、數據完整性保障、雙向強身份認證等;二是數據防護的安全,主要是采用現代信息存儲手段對數據進行主動防護,如通過磁盤陣列、數據備份、異地容災等手段保證數據的安全。數據安全是一種主動的保護措施,數據本身的安全必須基于可靠的加密算法與安全體系,主要有對稱算法與公開密鑰密碼體系兩種。
數據處理的安全是指如何有效地防止數據在錄入、處理、統計或打印中由于硬件故障、斷電、死機、人為的誤操作、程序缺陷、病毒或黑客等造成的數據庫損壞或數據丟失現象,某些敏感或保密的數據可能由不具備資格的人員或操作員閱讀,而造成數據泄密等后果。而數據存儲的安全是指數據庫在系統運行之外的可讀性。一旦數據庫被盜,即使沒有原來的系統程序,照樣可以另外編寫程序對盜取的數據庫進行查看或修改。從這個角度看,不加密的數據庫是不安全的,容易造成商業泄密,所以便衍生出數據防泄密這一概念,這就涉及計算機網絡通信的保密、安全及軟件保護等問題。
針對數據安全管理體系,筆者梳理了以下幾個方面的內容。
數據安全管理目標如下。
1)為數據資產讀取和變更提供合適的方法、阻止不合適的方法。
2)實現監管對因素性和機密性的要求。
3)確保實現所有利益相關者的隱私性和機密性需求。
數據安全管理具體包括數據安全策略、數據安全技術和數據安全組織建設。
(1)數據安全策略
1)確定數據安全策略框架。
2)制訂數據分級規范。
3)制訂數據安全保護標準。
4)明確數據安全管理制度及流程。
(2)數據安全技術
1)用戶身份認證。
2)角色分工。
3)系統版本管理。
4)系統日志管理。
(3)數據安全組織
1)建立數據安全組織。
2)落實崗位職責。
3)建立安全考核機制。
上面對數據安全管理中安全策略、技術與組織等方面所包含的內容進行了講解,而關于管理體系的定義與聯系,如圖3-3所示。

圖3-3 數據安全管理體系說明