舉報

會員
數據質量實踐手冊:4步構建高質量數據體系
最新章節:
本書贊譽
高質量的數據關乎企業運營、合規、決策和業績的關鍵,哈佛商業評論的一項研究發現,企業中只有3%的數據符合質量標準,絕大多數公司都在尋求切實可行的指導來提高數據質量。本書作者基于多年在數據、數據分析和人工智能方面的實踐經驗,闡述了4步構建高質量數據體系。他提出了高質量數據的四階段DARS方法(定義、評估、實現、持續)和10個數據質量最佳實踐案例,以此來提高業務中的數據質量水平,為業務提供數據價值,保證生成的數據可以有效支持高級分析和人工智能。在本書中,您將學習定義和評估數據質量的技術、標準和度量指標,了解如何確保公司的數據收集實踐避免常見的陷阱。本書適合數據科學家、數據分析師、商業智能專業人士、首席技術官和數據官,以及對收集和使用高質量數據感興趣的人士。對于有志成為首席數據官的各位讀者,這是一本難得的寶典級書籍!
目錄(126章)
倒序
- 封面
- 版權信息
- 文前
- 推薦序
- 前言
- 致謝
- 第1篇 定義階段
- 第1章 概述
- 1.1 引言
- 1.2 數據、數據分析、人工智能和業務績效
- 1.3 數據作為業務資產或負債
- 1.4 數據治理、數據管理和數據質量
- 1.5 領導層對數據質量的承諾
- 1.6 關鍵要點
- 1.7 結論
- 參考文獻
- 第2章 業務數據
- 2.1 引言
- 2.2 業務中的數據
- 2.3 遙測數據
- 2.4 數據在業務中的用途
- 2.5 業務數據視角
- 2.6 業務數據的關鍵特征
- 2.7 關鍵數據元素
- 2.8 關鍵要點
- 2.9 結論
- 參考文獻
- 第3章 業務中的數據質量
- 3.1 引言
- 3.2 數據質量維度
- 3.3 上下文中的數據質量
- 3.4 數據質量不佳所產生的影響
- 3.5 數據貶值及其影響因素
- 3.6 IT系統中的數據
- 3.7 數據質量和可信信息
- 3.8 關鍵要點
- 3.9 結論
- 參考文獻
- 第2篇 評估階段
- 第4章 數據質量差的原因
- 4.1 引言
- 4.2 數據質量問題根本原因分析工具
- 4.3 數據質量不佳的典型原因
- 4.4 關鍵要點
- 4.5 結論
- 參考文獻
- 第5章 數據生命周期和數據血緣
- 5.1 引言
- 5.2 數據生命周期
- 5.3 數據血緣
- 5.4 關鍵要點
- 5.5 結論
- 參考文獻
- 第6章 數據質量分析
- 6.1 引言
- 6.2 數據剖析的標準
- 6.3 測量中心性的數據剖析技術
- 6.4 測量變異性的數據剖析技術
- 6.5 整合中心性和變異性KPI
- 6.6 關鍵要點
- 6.7 結論
- 參考文獻
- 第3篇 實現階段
- 第7章 數據質量參考架構
- 7.1 引言
- 7.2 數據質量解決方案
- 7.3 DataOps
- 7.4 數據產品
- 7.5 數據編織和數據網格
- 7.6 數據增強
- 7.7 關鍵要點
- 7.8 結論
- 參考文獻
- 第8章 數據質量最佳實踐(一)
- 8.1 引言
- 8.2 最佳實踐概述
- 8.3 BP 1:確定業務KPI以及這些KPI和相關數據的所有權
- 8.4 BP 2:建立和提高組織中的數據文化和素養
- 8.5 BP 3:確定當前和期望的數據質量的狀態
- 8.6 BP 4:遵循極簡主義原則的數據采集方法
- 8.7 BP 5:選擇并定義用于提高質量的數據屬性
- 8.8 BP 6:使用MDM系統中的數據標準采集和管理關鍵數據
- 8.9 關鍵要點
- 8.10 結論
- 參考文獻
- 第9章 數據質量最佳實踐(二)
- 9.1 引言
- 9.2 BP 7:合理化和自動化關鍵數據元素的集成
- 9.3 BP 8:定義SoR并在SoR/OLTP系統中安全地采集交易數據
- 9.4 BP 9:構建和管理強大的數據集成能力
- 9.5 BP 10:分發數據來源與洞察消費
- 9.6 關鍵要點
- 9.7 結論
- 參考文獻
- 第4篇 持續階段
- 第10章 數據治理
- 10.1 引言
- 10.2 數據治理原則
- 10.3 數據治理設計組件
- 10.4 實施數據治理計劃
- 10.5 數據可觀察性
- 10.6 數據合規性——ISO 27001、SOC1和SOC2
- 10.7 關鍵要點
- 10.8 結論
- 參考文獻
- 第11章 數據保護
- 11.1 引言
- 11.2 數據分類
- 11.3 存儲相關的數據安全
- 11.4 訪問相關的數據安全
- 11.5 關鍵要點
- 11.6 結論
- 參考文獻
- 第12章 數據倫理
- 12.1 引言
- 12.2 數據倫理的定義
- 12.3 數據倫理的重要性
- 12.4 數據倫理的原則
- 12.5 模型漂移中的數據倫理
- 12.6 數據隱私
- 12.7 管理數據倫理
- 12.8 關鍵要點
- 12.9 結論
- 參考文獻
- 作者簡介
- 本書贊譽 更新時間:2024-12-18 17:27:22
推薦閱讀
- Word 2010中文版完全自學手冊
- Voice Application Development for Android
- Effective Amazon Machine Learning
- 文本數據挖掘:基于R語言
- 數據化網站運營深度剖析
- iOS and OS X Network Programming Cookbook
- Learn Unity ML-Agents:Fundamentals of Unity Machine Learning
- Ceph源碼分析
- 數據架構與商業智能
- Scratch 3.0 藝術進階
- 大數據架構和算法實現之路:電商系統的技術實戰
- R Object-oriented Programming
- R Machine Learning Essentials
- 數據中心經營之道
- 數據庫原理及應用:SQL Server 2016
- 碼上行動:利用Python與ChatGPT高效搞定Excel數據分析
- 數據庫技術與應用:SQL Server 2008
- Redis 6開發與實戰
- 計算機應用實務(第3版)
- SQL必知必會(第5版)
- Working with OpenERP
- TypeScript Microservices
- MySQL技術內幕:InnoDB存儲引擎(第2版)
- 社交網站的數據挖掘與分析
- 劍指大數據:Flink學習精要(Scala版)
- 深入解析Oracle:數據庫的初始化
- Spark 3.0大數據分析與挖掘:基于機器學習
- Oracle DBA手記
- 數據庫云平臺理論與實踐
- 零基礎學SQL Server 2008