- 數(shù)據(jù)準(zhǔn)備和特征工程:數(shù)據(jù)工程師必知必會技能
- 齊偉
- 198字
- 2020-06-05 17:00:55
第2章 數(shù)據(jù)清理

掃描二維碼,獲得本章學(xué)習(xí)資源
現(xiàn)實的數(shù)據(jù)是多種多樣的,即使它們已經(jīng)是結(jié)構(gòu)化的,仍可能存在各種問題,如數(shù)據(jù)不完整、丟失、類型錯誤、前后不一致等。因此,要進行數(shù)據(jù)清理(Data cleaning),也譯為數(shù)據(jù)清洗。
有一句流傳已久的話:“Garbage in, garbage out”(垃圾進,垃圾出)。對這句話的詳細說明,請參考:https://en.wikipedia.org/wiki/Garbage_in,_garbage_out),現(xiàn)在我們也把這句話用于數(shù)據(jù)科學(xué)領(lǐng)域,旨在強調(diào)數(shù)據(jù)本身對結(jié)果的影響。
第2章知識結(jié)構(gòu)如圖2-0-0所示。

圖2-0-0 第2章知識結(jié)構(gòu)
推薦閱讀
- Mastering Proxmox(Third Edition)
- 人工智能超越人類
- AWS:Security Best Practices on AWS
- PIC單片機C語言非常入門與視頻演練
- OpenStack Cloud Computing Cookbook(Second Edition)
- Ruby on Rails敏捷開發(fā)最佳實踐
- 西門子變頻器技術(shù)入門及實踐
- 網(wǎng)絡(luò)管理工具實用詳解
- INSTANT VMware vCloud Starter
- 生物3D打印:從醫(yī)療輔具制造到細胞打印
- 一步步寫嵌入式操作系統(tǒng)
- 漢字錄入技能訓(xùn)練
- 穿越計算機的迷霧
- Practical AWS Networking
- 工業(yè)機器人應(yīng)用系統(tǒng)三維建模