Greenplum:從大數(shù)據(jù)戰(zhàn)略到實現(xiàn)
本書分為四個部分。第一部分介紹大數(shù)據(jù)戰(zhàn)略。其中,第1章將分享作者對于ABC(人工智能、大數(shù)據(jù)和云計算)之間關系的理解以及對人和人工智能的思考。第2章將介紹進取型企業(yè)為什么需要大數(shù)據(jù)戰(zhàn)略以及如何建立大數(shù)據(jù)戰(zhàn)略。第二部分介紹大數(shù)據(jù)平臺。其中,第3章將以數(shù)據(jù)平臺演進歷史和未來趨勢為主題,描述三次整合的背景及影響,介紹選擇大數(shù)據(jù)平臺需要考慮的因素,以及為什么Greenplum是理想的大數(shù)據(jù)平臺。第4章為Greenplum數(shù)據(jù)庫快速入門指南。第5章將介紹Greenplum架構的主要特點和核心引擎。第6章將介紹數(shù)據(jù)加載、數(shù)據(jù)聯(lián)邦和數(shù)據(jù)虛擬化。第7章將介紹Greenplum的資源管理以及對混合負載的支持。第三部分介紹機器學習與數(shù)據(jù)分析。其中,第8章介紹Greenplum的各種過程化編程語言(用戶自定義函數(shù)),用戶可以使用Python、R、Java等語言實現(xiàn)用戶自定義函數(shù),還可以通過容器化技術實現(xiàn)自定義函數(shù)的安全性和隔離性。第9章將介紹Greenplum內建的機器學習庫MADlib,數(shù)據(jù)科學家可以使用內建的50多種機器學習算法基于SQL對數(shù)據(jù)進行高級分析,并介紹如何擴展MADlib以實現(xiàn)新算法。第10章和第11章將分別介紹Greenplum如何對文本數(shù)據(jù)和時空數(shù)據(jù)(GIS)進行存儲、計算和分析。第12章將介紹Greenplum豐富的圖計算能力。第四部分介紹運維管理和數(shù)據(jù)遷移。其中,第13章將介紹各種監(jiān)控和管理工具及相關企業(yè)級產(chǎn)品。第14章介紹數(shù)據(jù)庫備份、恢復和遷移。第15章和第16章將分別介紹如何從Oracle和Teradata遷移到Greenplum。
·21.5萬字