Greenplum:從大數(shù)據(jù)戰(zhàn)略到實(shí)現(xiàn)
本書分為四個(gè)部分。第一部分介紹大數(shù)據(jù)戰(zhàn)略。其中,第1章將分享作者對(duì)于ABC(人工智能、大數(shù)據(jù)和云計(jì)算)之間關(guān)系的理解以及對(duì)人和人工智能的思考。第2章將介紹進(jìn)取型企業(yè)為什么需要大數(shù)據(jù)戰(zhàn)略以及如何建立大數(shù)據(jù)戰(zhàn)略。第二部分介紹大數(shù)據(jù)平臺(tái)。其中,第3章將以數(shù)據(jù)平臺(tái)演進(jìn)歷史和未來趨勢(shì)為主題,描述三次整合的背景及影響,介紹選擇大數(shù)據(jù)平臺(tái)需要考慮的因素,以及為什么Greenplum是理想的大數(shù)據(jù)平臺(tái)。第4章為Greenplum數(shù)據(jù)庫(kù)快速入門指南。第5章將介紹Greenplum架構(gòu)的主要特點(diǎn)和核心引擎。第6章將介紹數(shù)據(jù)加載、數(shù)據(jù)聯(lián)邦和數(shù)據(jù)虛擬化。第7章將介紹Greenplum的資源管理以及對(duì)混合負(fù)載的支持。第三部分介紹機(jī)器學(xué)習(xí)與數(shù)據(jù)分析。其中,第8章介紹Greenplum的各種過程化編程語言(用戶自定義函數(shù)),用戶可以使用Python、R、Java等語言實(shí)現(xiàn)用戶自定義函數(shù),還可以通過容器化技術(shù)實(shí)現(xiàn)自定義函數(shù)的安全性和隔離性。第9章將介紹Greenplum內(nèi)建的機(jī)器學(xué)習(xí)庫(kù)MADlib,數(shù)據(jù)科學(xué)家可以使用內(nèi)建的50多種機(jī)器學(xué)習(xí)算法基于SQL對(duì)數(shù)據(jù)進(jìn)行高級(jí)分析,并介紹如何擴(kuò)展MADlib以實(shí)現(xiàn)新算法。第10章和第11章將分別介紹Greenplum如何對(duì)文本數(shù)據(jù)和時(shí)空數(shù)據(jù)(GIS)進(jìn)行存儲(chǔ)、計(jì)算和分析。第12章將介紹Greenplum豐富的圖計(jì)算能力。第四部分介紹運(yùn)維管理和數(shù)據(jù)遷移。其中,第13章將介紹各種監(jiān)控和管理工具及相關(guān)企業(yè)級(jí)產(chǎn)品。第14章介紹數(shù)據(jù)庫(kù)備份、恢復(fù)和遷移。第15章和第16章將分別介紹如何從Oracle和Teradata遷移到Greenplum。
·21.5萬字