- 數據資產評估指南
- 中國電子技術標準化研究院編著
- 2093字
- 2022-05-06 19:13:03
2.3.1 數據標準不統一
1.數據資產類型多樣、分散復雜
21世紀以來,全球數據呈爆發式指數增長。國際數據中心(IDC)發布的《數據時代2025》報告顯示,到2025年全球每年產生的數據將從2018年的33ZB增長到175ZB,相當于每天產生491EB的數據。單一機構的數據規模由以前的GB級上升到TB級,甚至PB級、EB級。各國政府、不同行業領域的企業除了可采集內部業務數據,還可利用手機終端、傳感器、機器設備、網站網絡、日志等技術獲得大量的外部第三方數據。
數據作為一種資產呈現出數據對象海量、多樣、多元化等特點。各行業(如電信、金融、政府、醫療、工業等)存在海量的數據資產,根據用戶關注點不同,可以分成不同維度的資產類型,如按照數據來源,可將數據分為互聯網數據、科研數據、感知數據和大數據。數據格式種類也日益豐富,文本數據、圖像數據、語音數據、視頻數據等半結構化數據或非結構化數據占比越來越大。但目前,數據資產還沒有權威的分類標準。此外,不同類型數據的處理、存儲、管理方式也不同。多來源、不同格式、不同種類的數據資產為其治理和價值評估帶來一系列難題。
2.管理部門分割自治,數據壁壘現象嚴重
政府數據管理部門分割自治。在大數據時代,要最大限度地挖掘和釋放數據的價值,根本在于促進數據自由、安全地流動。在政務數據方面,2018年國務院印發了《關于加快推進全國一體化在線政務服務平臺建設的指導意見》,以加快推進構建統一高效、互聯互通、安全高效的國家數據開放共享交換平臺,使“讓數據跑路,不讓群眾跑腿”成為可能。但是,當前我國政府信息化建設仍然處于初級階段,仍然面臨著各機構各自為政、管理部門分割自治、各部門溝通困難、“數據壁壘”現象嚴重等問題。主要原因包含兩點,第一,出于觀念、利益和安全等諸多因素的考慮,很多政府單位將數據資產當作本部門追求政治利益和經濟利益的手段,對數據開放共享持抵觸或推諉現象,導致出現“數據煙囪”的不利局面;第二,數據資產是在機構各部門長期信息化發展的基礎上產生的,由于較長時期內各部門間信息化建設各自為政,數據元、數據類型、數據標準和數據質量等各不相同,使得數據資源橫向傳播受阻,各部門之間數據共享困難,加重了“數據孤島”的現象。例如,醫院、社保、保險、公安、銀行和運營商等不同機構分別掌握著公民個人的不同信息,但各個部門實現數據融合共享卻是很困難的事情。
數據壁壘現象不僅存在于政府部門之間,企業間此現象也相當嚴重。為維持本企業的競爭優勢,在數據資源方面具有市場支配地位的經營者,可能采取限制措施妨礙競爭對手收集數據。例如,在2019年年初的騰訊與抖音、多閃之爭中,騰訊表示,騰訊用戶在注冊賬號時同意的《用戶協議》中就有約定,微信、QQ頭像、昵稱、好友關系等數據的所有權歸屬騰訊,因此沒有騰訊授權,即使用戶同意,也不能使用微信、QQ賬號直接登錄抖音或多閃。當前,阿里巴巴、騰訊和百度幾乎壟斷著我國大多數的消費數據、社交數據和搜索數據,通過數據壟斷的形式,使自身發展更加強大,不斷擴張商業版圖。但是,互聯網市場中的其他中小型企業對巨頭所掌握的數據望塵莫及,因此也很難在現有市場中取得突破,這也進一步加劇了“數據壟斷”的現象,導致跨行業間數據流通和共享不暢,一些有價值的公共數據資源和大量的商業數據資源基本處于鎖死狀態,降低了資源利用率和數據的可得性。
3.數據組織標準不一,數據質量參差不齊
當前,我國政府和主管部門對數據描述標準的制定仍處于初級階段。地方政府數據資源的組織發展都具有各自的獨立性,僅有少數如貴州、廣東、北京等省市制定了數據標準方案。這些標準對數據資產的組織和標準化具有一定的參考性,但并沒有按照資產屬性對數據資產進行不同維度的資產分級分類,缺乏對數據資產元數據目錄的制定,在元素取值范圍、元數據文件格式等方面都尚未建立標準規范,且內容差異性較大、標準并不統一,無法在更大的地區乃至全國范圍內推行。
數據組織標準不統一導致數據資產治理和數據資產評估困難。在大數據時代,原生數據不能被直接利用,需要對原生數據進行加工處理,其價值才能顯現,就像翡翠原石的開采,如若不加工成飾品,其價值與石頭并無二致。政府、企業追逐的數據價值也基本都體現在衍生數據上,而衍生數據價值的高低則取決于原生數據到衍生數據的聚合、加工、計算的準確程度。但是,由于各企業、機構的信息系統完全由設計人決定,數據分類標準和組織方式可能不同,則不同信息系統產生的數據及結構可能完全異構。這也使得當前無論是政府還是企業,他們的大部分數據資源都被束之高閣。要實現信息系統之間的互聯互通,就必須轉變數據結構方式,這是一項專業性強、難度大的技術活,國內大部分企業和政府部門的數據基礎比較薄弱,很多數據主體不具備數據資源的整合和加工能力,更不必說數據資產的流通和治理。此外,數據標準的混亂,也導致數據質量參差不齊,糟糕的數據質量將直接導致數據統計分析不準確、監管業務難、高層領導難以決策等問題。根據數據質量專家Larry English的統計,不良的數據質量會使企業額外花費15%~25%的成本。因此,若要將數據資源轉化為資產,并充分發揮其經濟價值,前提是制定統一、規范化的數據描述和組織標準,規避錯誤數據,保證數據質量。