書名: 主數(shù)據(jù)管理:企業(yè)數(shù)據(jù)化建設基礎作者名: 張旭 陳吉平 楊海峰等本章字數(shù): 2002字更新時間: 2021-10-15 19:05:08
3.4 主數(shù)據(jù)的屬性
當主數(shù)據(jù)的定義和編碼規(guī)范確定后,就需要確定主數(shù)據(jù)的屬性內容了。屬性代表使用者對業(yè)務實體關注的特性要素。
對于一個人來講,他的身份證上所寫的信息一定是從社會角度來看人們所關心的核心信息:姓名、公民身份號碼和住址,我們還可以從公民身份號碼中看出這個人的出生年月和性別。如果這個人去看病,那么醫(yī)生關心的就是身高、體重、血型、過往病史等信息;而當這個人在企業(yè)工作時,企業(yè)就會關注他的入職時間、崗位、學歷等信息。另外,筆者曾經接觸過一個監(jiān)獄管理系統(tǒng),囚犯屬性中還有一個叫作“綽號”的字段,可見屬性范圍內并沒有限定的內容,但應遵守一些業(yè)務規(guī)則和標準。
主數(shù)據(jù)的屬性信息從何而來?主數(shù)據(jù)的屬性信息應當首先基于業(yè)務運轉過程中的積累,同時也可以借鑒國家標準、行業(yè)標準、行業(yè)內頭部客戶的標準。
那么我們可以通過以下途徑進行主數(shù)據(jù)屬性信息的收集。
1.現(xiàn)有信息系統(tǒng)
當前的企業(yè)大多數(shù)只能使用軟件廠商提供的現(xiàn)有數(shù)據(jù)模型。我們可以利用現(xiàn)有信息系統(tǒng)對基礎數(shù)據(jù)的描述獲取大量的主數(shù)據(jù)屬性信息。
2.業(yè)務資料、業(yè)務單據(jù)
企業(yè)在業(yè)務開展過程中,必定會對關鍵信息進行記錄,大量的業(yè)務過程和業(yè)務單據(jù)記錄的基礎信息內容,都可以成為主數(shù)據(jù)屬性選取的素材。
3.對業(yè)務骨干的調研與訪談
對于成熟度較低、數(shù)據(jù)模型并不完全清晰的主數(shù)據(jù),我們在進行主數(shù)據(jù)屬性項調研時需要再次與業(yè)務骨干進行深入溝通,業(yè)務骨干對基礎數(shù)據(jù)的描述也具有較大的參考價值。
通過以上工作的開展,我們可以獲取一份主數(shù)據(jù)屬性的基礎資料庫。我們可以將這些屬性做初次整理,同時制定屬性選擇的策略,最終由項目組給出一份主數(shù)據(jù)屬性確認表,既作為建模階段的成果,也作為后續(xù)工作開展的依據(jù)。
主數(shù)據(jù)屬性的選取往往涉及數(shù)據(jù)屬性多少的問題,在這里我們只討論主數(shù)據(jù)的普通屬性,先不涉及其分類屬性和編碼。
主數(shù)據(jù)的屬性獲取通常有兩種途徑:一種是在所有與之對應的基礎數(shù)據(jù)上,將獲取數(shù)據(jù)屬性的總和作為屬性選取的來源;另一種就是根據(jù)數(shù)據(jù)模型設計的理念來進行數(shù)據(jù)屬性設計。但無論是哪種設計模型,我們都要面臨將多少種屬性放入主數(shù)據(jù)中的問題。
首先我們先把主數(shù)據(jù)的屬性進行大致歸類。
1.基本屬性
基本屬性是對主數(shù)據(jù)本質的描述。從需求的角度講,基本屬性在各個系統(tǒng)都需要使用,是企業(yè)十分關心的一些屬性。比如,在人員主數(shù)據(jù)中,人的性別、年齡、手機號碼、郵箱、所屬部門、所屬單位、職級、職務等信息都是基本屬性。
2.業(yè)務性屬性
業(yè)務性屬性是在比較專業(yè)的系統(tǒng)中的特定信息,如人員主數(shù)據(jù)中的入職時間、是否為專業(yè)軍人、是否為黨員等信息。這些屬性是某個部門或業(yè)務人員出于自己的管理目的而對主數(shù)據(jù)屬性做出的要求。
3.統(tǒng)計屬性
統(tǒng)計屬性并不取決于主數(shù)據(jù)本身,而是由于業(yè)務的發(fā)生而產生的統(tǒng)計分析性屬性。比如,產品主數(shù)據(jù)中的本月銷售數(shù)量、是否為暢銷品等信息都是統(tǒng)計屬性。
首先,我們認為主數(shù)據(jù)的屬性項中不應當包含統(tǒng)計屬性信息,如在一個信息系統(tǒng)的數(shù)據(jù)庫表結構中,一個基礎數(shù)據(jù)的表中一般不會包含統(tǒng)計屬性信息,因為這樣的統(tǒng)計屬性信息的維度有很多(多變且不確定)。其次,統(tǒng)計屬性信息是附加在這個事物之外的信息,數(shù)值受業(yè)務影響而并不由其本身決定。雖然這個屬性的數(shù)值也需要在各個系統(tǒng)間共享,但是這樣的屬性以數(shù)據(jù)服務的方式通過統(tǒng)計系統(tǒng)發(fā)布會相對比較合理。
歸類完成之后,就應選擇可以進入主數(shù)據(jù)范圍的屬性了。主數(shù)據(jù)屬性的選擇有兩種方式。一種方式是只選擇該主數(shù)據(jù)最基礎、最核心的基礎屬性,這些數(shù)據(jù)反映的是主數(shù)據(jù)最基礎和客觀的信息,也是各個系統(tǒng)都需要的信息。另一種方式是將我們發(fā)現(xiàn)的盡可能多的屬性信息放入其中,以求在主數(shù)據(jù)管理系統(tǒng)中能夠看到更多、更全面的信息。具體的選擇策略如下。
1.選擇基礎屬性策略
主數(shù)據(jù)只選取最基本的屬性,后續(xù)工作則專注于系統(tǒng)間的編碼名稱一致和系統(tǒng)間的數(shù)據(jù)共享工作。主數(shù)據(jù)管理項目的管理難度高,選取基礎數(shù)據(jù)即可實現(xiàn)主數(shù)據(jù)管理90%以上的價值,所以我們優(yōu)先推薦此種策略。
2.選擇大而全的集合策略
業(yè)務屬性共享度低,可能僅在本系統(tǒng)中使用或僅由少數(shù)系統(tǒng)共用。如果將業(yè)務性屬性納入主數(shù)據(jù)模型,則主數(shù)據(jù)模型的變動會較為頻繁。
在以往的主數(shù)據(jù)定義中,凡是需要共享的內容都希望進入主數(shù)據(jù)范疇,但我們建議這樣的問題通過服務來解決。比如,在服務列表中增加獲取人員“是否為專業(yè)軍人”的服務,以及人員“是否為黨員”的服務。這樣既可以保證主數(shù)據(jù)模型的穩(wěn)定,又滿足了系統(tǒng)間數(shù)據(jù)共享的需求。主數(shù)據(jù)管理則應更加專注其本職的工作。
主數(shù)據(jù)屬性的定義并沒有嚴格的對錯之分,即使將所有的屬性都歸入主數(shù)據(jù)中也可以,甚至可以說我們將越多的屬性歸入其中,主數(shù)據(jù)管理所能發(fā)揮的價值就越大,但這也恰恰是眾多項目失敗的地方。
設計其實是一個取舍的過程,我們的策略永遠都是二八原則,即優(yōu)先獲取八成的價值。如果一定要追求剩余的兩成價值,那么投入產出比就會變得不合理。所以我們建議在相對復雜的主數(shù)據(jù)管理體系構建過程中能夠關注重點,優(yōu)先解決核心問題。