官术网_书友最值得收藏!

Greenplum:從大數據戰略到實現
會員

本書分為四個部分。第一部分介紹大數據戰略。其中,第1章將分享作者對于ABC(人工智能、大數據和云計算)之間關系的理解以及對人和人工智能的思考。第2章將介紹進取型企業為什么需要大數據戰略以及如何建立大數據戰略。第二部分介紹大數據平臺。其中,第3章將以數據平臺演進歷史和未來趨勢為主題,描述三次整合的背景及影響,介紹選擇大數據平臺需要考慮的因素,以及為什么Greenplum是理想的大數據平臺。第4章為Greenplum數據庫快速入門指南。第5章將介紹Greenplum架構的主要特點和核心引擎。第6章將介紹數據加載、數據聯邦和數據虛擬化。第7章將介紹Greenplum的資源管理以及對混合負載的支持。第三部分介紹機器學習與數據分析。其中,第8章介紹Greenplum的各種過程化編程語言(用戶自定義函數),用戶可以使用Python、R、Java等語言實現用戶自定義函數,還可以通過容器化技術實現自定義函數的安全性和隔離性。第9章將介紹Greenplum內建的機器學習庫MADlib,數據科學家可以使用內建的50多種機器學習算法基于SQL對數據進行高級分析,并介紹如何擴展MADlib以實現新算法。第10章和第11章將分別介紹Greenplum如何對文本數據和時空數據(GIS)進行存儲、計算和分析。第12章將介紹Greenplum豐富的圖計算能力。第四部分介紹運維管理和數據遷移。其中,第13章將介紹各種監控和管理工具及相關企業級產品。第14章介紹數據庫備份、恢復和遷移。第15章和第16章將分別介紹如何從Oracle和Teradata遷移到Greenplum。

馮雷 ·數據庫 ·21.5萬字

機器學習:軟件工程方法與實現
會員

本書視角獨特,將軟件工程中的方法應用到機器學習實踐中,重視方法論和工程實踐的融合。本書主要有3個特點。1)機器學習的軟件工程方法:用軟件工程(SoftwareEngineering)中的工具、方法和理論指導機器學習的實踐活動。主要體現在測試驅動開發(TDD)方法、機器學習項目管理方法、工程化軟件應用于數據科學標準化環境,以及開源算法包的大量實踐應用案例等。2)機器學習全生命周期:書中全面呈現了機器學習項目開發的完整鏈路,以項目需求為起點,歷經樣本定義、數據處理、建模、模型上線、模型監控、模型重訓或重建。流程中的大部分節點獨立成章,闡述充分,并且不是單純地闡述理論,而是重在實踐。同時,聚焦機器學習中應用最廣泛和最有效的算法,使之成為貫穿機器學習項目生命周期的一條完整的學習路徑。3)提出機器學習是一門實驗學科:書中有大量的工業實踐代碼,例如數據分析包、特征離散化包、特征選擇包、集成模型框架包、大規模模型上線系統架構和對應代碼包等,對機器學習算法特性也有大量的代碼解析。書中還多次強調對于機器學習這樣一門實驗和實踐學科,工具、方法和策略的重要性,并介紹了在實際項目中對時間、人力成本等的權衡策略。本書不拘泥于公式推演、數值分析計算領域優化求解(梯度、牛頓、拉格朗日、凸優化)等主題,而重在展現機器學習的實際應用,以及各知識點的落地。在寫作方式和內容編寫等方面,本書力求既貼近工程實踐又不失理論深度,給讀者良好的閱讀體驗。

張春強 張和平 唐振 ·人工智能 ·22.4萬字

QQ閱讀手機版

主站蜘蛛池模板: 铜鼓县| 达尔| 金平| 安义县| 卢湾区| 廊坊市| 延边| 晋州市| 横山县| 红安县| 龙川县| 成武县| 勃利县| 麻城市| 曲阳县| 浦县| 东乡县| 新龙县| 岳阳县| 平阳县| 涿鹿县| 泗水县| 榆中县| 商丘市| 周口市| 右玉县| 青海省| 金乡县| 鄂托克前旗| 河北省| 阿尔山市| 海阳市| 安化县| 内丘县| 富阳市| 新安县| 临武县| 阳谷县| 封丘县| 绥德县| 六盘水市|