3.2.4 報告數據治理
報告數據是指對數據進行處理加工后,用作業務決策依據的數據。它用于支持報告和報表的生成。
用于報告和報表的數據可以分為如下幾種。
·用于報表項數據生成的事實表、指標數據、維度。
·用于報表項統計和計算的統計函數、趨勢函數及報告規則。
·用于報表和報告展示的序列關系數據。
·用于報表項描述的主數據、基礎數據、事務數據、觀測數據。
·用于對報告進行補充說明的非結構化數據。
報告數據涵蓋的范圍較廣,如主數據、基礎數據等,這些數據類別本身已經有相應的管理機制和規范,這里我們重點對部分新的細分數據類型進行說明。
1)事實表:從業務活動或者事件中提煉出來的性能度量。其特點為:
·每個事實表由顆粒度屬性、維度屬性、事務描述屬性、度量屬性組成;
·事實表可以分為基于明細構建的事實表和基于明細做過匯聚的事實表。
2)維度:用于觀察和分析業務數據的視角,支持對數據進行匯聚、鉆取、切片分析。其特點為:
·維度的數據一般來源于基礎數據和主數據;
·維度的數據一般用于分析視角的分類;
·維度的數據一般有層級關系,可以向下鉆取和向上聚合形成新的維度。
3)統計型函數:與指標高度相關,是對指標數量特征進一步的數學統計,例如均值、中位數、總和、方差等。其特點為:
·通常反映某一維度下指標的聚合情況、離散情況等特征;
·其計算數值在報告中通常呈現為圖表中的參考線。
4)趨勢型函數:反映指標在時間維度上變化情況的統計方式,例如同比、環比、定基比等。其特點為:
·通常將當期值與歷史某時點值進行比較;
·調用時,需要收集指標的歷史表現數據;
·其計算數值在報告中通常呈現為圖表中的趨勢線。
5)報告規則數據:一種描述業務決策或過程的陳述,通常是基于某些約束下產生的結論或需要采取的某種措施。其特點為:
·將業務邏輯通過函數運算體現,通常一個規則包含多個運算和判斷條件;
·規則的計算結果一般不直接輸出,需要基于計算結果翻譯成業務語言后輸出;
·規則通常與參數表密切相關。
6)序列關系數據:反映報告中指標及其他數據序列關系的數據。