- 數據質量實踐手冊:4步構建高質量數據體系
- (美)普拉桑特·蘇特卡爾
- 7字
- 2024-12-18 17:26:43
第1篇
定義階段
第1章
概述
1.1 引言
如今,相比于有形資產(如土地、機器設備、庫存和現金)而言,無形資產(不具有物質性質的資產,包括數據、品牌和知識產權等)的重要性迅速上升。2018年,標普500指數中的無形資產價值達到21萬億美元,占據了所有企業價值的84%。相比于1975年的17%,這是一個巨大的增長(Ali,2020)。總體來說,隨著5G、人工智能、機器人、物聯網(IoT)、量子計算機、數據分析、區塊鏈等技術的普及,越來越多的企業正在研究和開發并最大化保護無形資產,特別是數據資產價值,因為所有數字技術都是以數據為基礎的。
在此背景下,數據作為一種重要的無形資產,被認為是關鍵的商業資源,因為它可以使組織的生產力最大化。在市值排名前五的公司中,有四家是數據公司(Investopedia,2022)。加拿大豐業銀行(Scotiabank)的首席執行官Brain Porter在2019年表示,“我們從事的是數據和技術業務。我們的產品恰好是銀行業務,但主要是通過數據和技術來提供”(Berman,2016)。AIG和Hamilton Insurance Group宣布成立合資公司Attune,這是一個利用數據和人工智能(AI)來簡化業務流程、縮短獲得保險的時間并減少成本的技術平臺。油田服務公司Schlumburger利用模擬器和傳感器中捕獲的鉆井遙測數據來提高油井鉆探性能。數據已經成為提高企業業務績效的關鍵驅動力,更是改善企業業務績效的關鍵因素,高質量的數據可以增加企業收入、降低成本和降低風險。
數據經濟生態系統,即利用數據促進業務績效的生態系統,越來越受到全球認可。Netflix、Facebook、Google和Uber等公司利用數據獲得了獨特的競爭優勢。谷歌研究總監彼得·諾維格(Peter Norvig)曾表示,“我們沒有比其他公司更好的算法,我們只是擁有更多的數據”(Cleland,2011)。到2021年,谷歌市值已經超過了墨西哥或沙特阿拉伯的國內生產總值。以數據為驅動力的公司表現出更好的業務績效,麻省理工學院的一份報告稱,數據利用率高且數字化成熟的企業比同行企業利潤高出26%(MIT,2013)。麥肯錫全球研究所的研究發現,以數據為驅動力的組織獲取客戶的可能性是普通組織的23倍,保留客戶的可能性是普通組織的6倍,并且盈利能力是其他公司的19倍(Bokman等,2014)。Forrester的研究發現,利用數據進行決策的公司實現兩位數增長的可能性是其他公司的3倍(Eveslon,2020)。在大規模應用大數據后,美國保險委員會協會(NAIC)表示保險服務的獲取率提高了30%,成本節約了40%~70%,麥肯錫公司的一項研究表明,在石油和天然氣公司中有效實施數據分析,可以在幾個月內產生相當于投資額30~50倍的回報(McKinsey,2017)。
然而,大多數公司都面臨將數據轉化為業務績效增長的挑戰,這主要是由于缺乏高質量的數據。根據精品數據管理公司Experian Data Quality的說法,不準確的數據影響了88%的組織,影響收入高達12%(Levy,2015)。麥肯錫公司指出,平均每個用戶每天要花費2小時來查找正確的數據(Probstein,2019)。《哈佛商業評論》發表的一份報告稱,在企業中只有3%的數據符合質量標準(Nagle等,2017);而IBM和卡內基梅隆大學聯合進行的一項研究發現,公司中有超過90%的數據處于未被使用的狀態。