3.2.5 觀測數據治理
觀測數據是通過觀測工具獲取的數據,觀測對象一般為人、事、物、環境。
相比傳統數據,觀測數據通常數據量較大且是過程性的,由機器自動采集生成。不同感知方式獲取的觀測數據,其數據資產管理要素不同。
觀測數據的感知方式可分為軟感知和硬感知。軟感知是使用軟件或者各種技術進行數據收集,收集的對象存在于數字世界,通常不依賴于物理設備,一般是自動運行的程序或腳本;硬感知是利用設備或裝置進行數據收集,收集的對象為物理世界中的物理實體,或者是以物理實體為載體的信息,其數據的感知過程是數據從物理世界向數字世界的轉化過程。
觀測數據的特征有如下幾點:
1)觀測數據通常數據量較大且是過程性的,主要用作監控分析。例如,視頻監控器產生的視頻數據、操作系統產生的日志記錄數據等;
2)觀測數據由機器自動采集生成。例如,各種傳感器或探針記錄觀測對象產生的數據;
3)觀測數據是觀測工具采集回來的原始數據(Raw Data),僅轉換結構和格式,不做任何業務規則解析。
觀測數據的管理模型如圖3-9所示。
觀測工具的元數據可以作為數據資產管理:軟感知(埋點、日志收集、爬蟲)觀測工具抽象成業務對象,由IT部門擔任數據Owner進行統一管理;硬感知觀測工具作為資源類數據,也建議作為業務對象由相應的領域擔任數據Owner進行管理。
原則上,觀測對象要定義成業務對象進行管理,這是觀測數據管理的前提條件。
觀測數據需要記錄觀測工具、觀測對象。針對不同感知方式獲取的觀測數據,其資產管理方案也不盡相同。例如,以用戶界面瀏覽記錄為例,如果是對銷售機會點的查詢訪問觀測,應當歸屬到相應業務領域;如果是對頁面性能、頁面UV、PV的觀測,應當歸屬到IT部門。