官术网_书友最值得收藏!

Chapter 2. Working with Data

Building real world's data analytics requires accurate data. In this chapter we discuss how to obtain, clean, normalize, and transform raw data into a standard format such as Comma-Separated Values (CSV) or JavaScript Object Notation (JSON) using OpenRefine.

In this chapter we will cover:

  • Datasource
    • Open data
    • Text files
    • Excel files
    • SQL databases
    • NoSQL databases
    • Multimedia
    • Web scraping
  • Data scrubbing
    • Statistical methods
    • Text parsing
    • Data transformation
  • Data formats
    • CSV
    • JSON
    • XML
    • YAML
  • Getting started with OpenRefine
主站蜘蛛池模板: 嘉祥县| 吉林市| 新竹市| 唐河县| 东乡族自治县| 眉山市| 德州市| 收藏| 秀山| 奈曼旗| 大方县| 涞水县| 吉安市| 都匀市| 金塔县| 页游| 军事| 衡水市| 宜州市| 河西区| 厦门市| 都匀市| 古田县| 保山市| 西乡县| 洛南县| 永胜县| 璧山县| 青川县| 许昌县| 乌兰察布市| 莱芜市| 泉州市| 南皮县| 龙州县| 镶黄旗| 林周县| 延长县| 三门峡市| 梨树县| 福安市|