官术网_书友最值得收藏!

3.6 主數(shù)據(jù)的顆粒度問題

在主數(shù)據(jù)管理過程中很多主數(shù)據(jù)都存在顆粒度問題,存在顆粒度問題的主數(shù)據(jù)的處理難度都較高。在這里,我們所說的顆粒度問題主要針對類別主數(shù)據(jù)。

我們先詳細(xì)了解一下什么是顆粒度。顆粒度就是指不同視角下的主數(shù)據(jù)的數(shù)據(jù)量,人看事物的視角不同導(dǎo)致主數(shù)據(jù)的數(shù)據(jù)量不同。比如,當(dāng)我們用某一種視角看待事物時,這些事物在我們的記錄里應(yīng)當(dāng)是十條記錄,如果換成另一個視角,那么有可能是一百條記錄。所以大多數(shù)顆粒度問題都存在于一種存在分類性質(zhì)的主數(shù)據(jù)中。而分類性質(zhì)的主數(shù)據(jù),即類別型主數(shù)據(jù),在主數(shù)據(jù)管理系統(tǒng)中只對應(yīng)一條主數(shù)據(jù),如直徑20mm的閥門,現(xiàn)實中無論存在多少個這類閥門,其備品備件編碼都是001,如果我們將顆粒度調(diào)細(xì),變成20mm的單向閥門和20mm的雙向閥門,那么這些現(xiàn)實中的物品就對應(yīng)了兩條數(shù)據(jù)。

通常來說,人員主數(shù)據(jù)、客戶主數(shù)據(jù)、供應(yīng)商主數(shù)據(jù)、組織主數(shù)據(jù)都不存在顆粒度問題,因為這些主數(shù)據(jù)所描述的客觀對象,一個就是一個,一般情況下不會分成兩個;而物料主數(shù)據(jù)、產(chǎn)品主數(shù)據(jù)、資產(chǎn)主數(shù)據(jù)則普遍存在顆粒度問題。

在很長一段時間里,我們在談到編碼工作和主數(shù)據(jù)管理時都會提到一個敏感詞匯,即“一物一碼”,并且把它作為主數(shù)據(jù)管理的目標(biāo)。可是對于有些主數(shù)據(jù)而言,無論我們怎么劃分,都不可能做到“一物一碼”,而只能做到“一類一碼”,那么這個“類”就寬泛了,分的細(xì)數(shù)量就多,分的粗?jǐn)?shù)量就少。企業(yè)中幾十萬、上百萬種物料,可以只有一個編碼,稱為“物料”,或者有十個編碼,稱為“金屬”“設(shè)備”“備品備件”“燃料”“勞保用品”“潤滑劑”,也可以再細(xì)分為300~500種。

如果我們還是覺得這個分類太粗,無法滿足使用的需求,又無法再進一步分類,那么一個必要的概念就出現(xiàn)了,即“唯一性屬性”。唯一性屬性可以描述成,當(dāng)這幾個屬性不同時,我們就能決定一個新的分類的產(chǎn)生。比如,在醫(yī)藥企業(yè)的產(chǎn)品主數(shù)據(jù)中,在化學(xué)藥制劑這個大分類下,我們加入“通用名/品名”“規(guī)格/型號/級別”“最小包裝規(guī)格”“最小包裝單位”“生產(chǎn)企業(yè)”這五個唯一性屬性,只要一條數(shù)據(jù)進入時,這五個屬性不同,我們就認(rèn)為產(chǎn)生了一條新的主數(shù)據(jù),如表3-2所示。

表3-2

當(dāng)我們能夠認(rèn)知主數(shù)據(jù)顆粒度問題后就會知道,“一物一碼”的說法并不準(zhǔn)確,應(yīng)當(dāng)再加上“一類一碼”,因為“類”本身也是獨一無二的。當(dāng)這個類不再容易細(xì)分下去的時候,也就不存在顆粒度的問題了。如人員主數(shù)據(jù),一個人就是一個人,不再由于某些視角讓一個人變成兩個人。通常來說,一個客戶就是一個客戶,如果以法人來界定,那么有營業(yè)執(zhí)照的就是客戶,一個營業(yè)執(zhí)照就代表了一條客戶記錄。

主站蜘蛛池模板: 绵竹市| 凭祥市| 云安县| 朔州市| 漠河县| 大石桥市| 扬州市| 阜阳市| 榆社县| 类乌齐县| 阿拉尔市| 两当县| 台北县| 小金县| 桓台县| 黔南| 公安县| 景宁| 清丰县| 冀州市| 广汉市| 唐山市| 柘荣县| 栾川县| 贞丰县| 武邑县| 交城县| 毕节市| 芷江| 定州市| 固镇县| 禹州市| 汝州市| 邵武市| 上高县| 长汀县| 平陆县| 屯门区| 镇康县| 鄱阳县| 塔河县|