官术网_书友最值得收藏!

Greenplum:從大數據戰略到實現
會員

本書分為四個部分。第一部分介紹大數據戰略。其中,第1章將分享作者對于ABC(人工智能、大數據和云計算)之間關系的理解以及對人和人工智能的思考。第2章將介紹進取型企業為什么需要大數據戰略以及如何建立大數據戰略。第二部分介紹大數據平臺。其中,第3章將以數據平臺演進歷史和未來趨勢為主題,描述三次整合的背景及影響,介紹選擇大數據平臺需要考慮的因素,以及為什么Greenplum是理想的大數據平臺。第4章為Greenplum數據庫快速入門指南。第5章將介紹Greenplum架構的主要特點和核心引擎。第6章將介紹數據加載、數據聯邦和數據虛擬化。第7章將介紹Greenplum的資源管理以及對混合負載的支持。第三部分介紹機器學習與數據分析。其中,第8章介紹Greenplum的各種過程化編程語言(用戶自定義函數),用戶可以使用Python、R、Java等語言實現用戶自定義函數,還可以通過容器化技術實現自定義函數的安全性和隔離性。第9章將介紹Greenplum內建的機器學習庫MADlib,數據科學家可以使用內建的50多種機器學習算法基于SQL對數據進行高級分析,并介紹如何擴展MADlib以實現新算法。第10章和第11章將分別介紹Greenplum如何對文本數據和時空數據(GIS)進行存儲、計算和分析。第12章將介紹Greenplum豐富的圖計算能力。第四部分介紹運維管理和數據遷移。其中,第13章將介紹各種監控和管理工具及相關企業級產品。第14章介紹數據庫備份、恢復和遷移。第15章和第16章將分別介紹如何從Oracle和Teradata遷移到Greenplum。

馮雷 ·數據庫 ·21.5萬字

數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow
會員

這是一本將數據科學三要素——商業理解、量化模型、數據技術全面打通的實戰性著作,是來自騰訊、滴滴、快手等一線互聯網企業的數據科學家、數據分析師和算法工程師的經驗總結,得到了SQLFlow創始人以及騰訊、網易、快手、貝殼找房、谷歌等企業的專家一致好評和推薦。全書三個部分,內容相對獨立,既能幫助初學者建立知識體系,又能幫助從業者解決商業中的實際問題,還能幫助有經驗的專家快速掌握數據科學的Z新技術和發展動向。內容圍繞非實驗環境下的觀測數據的分析、實驗的設計和分析、自助式數據科學平臺3大主題展開,涉及統計學、經濟學、機器學習、實驗科學等多個領域,包含大量常用的數據科學方法、簡潔的代碼實現和經典的實戰案例。第1部分(第1~6章)觀測數據的分析技術講解了非實驗環境下不同觀測數據分析場景所對應的分析框架、原理及實際操作,包括消費者選擇偏好分析、消費者在時間維度上的行為分析、基于機器學習的用戶生命周期價值預測、基于可解釋模型技術的商業場景挖掘、基于矩陣分解技術的用戶行為規律發現與挖掘,以及在不能進行實驗分析時如何更科學地進行全量評估等內容。第二部分(第7~9章)實驗設計和分析技術從A/B實驗的基本原理出發,深入淺出地介紹了各種商業場景下進行實驗設計需要參考的原則和運用的方法,尤其是在有樣本量約束條件下提升實驗效能的方法及商業場景限制導致的非傳統實驗設計。第三部分(第10~12章)自助式數據科學平臺SQLFlow針對性的講解了開源的工程化的自助式數據科學平臺SQLFlow,并通過系統配置、黑盒模型的解讀器應用、聚類分析場景等案例幫助讀者快速了解這一面向未來的數據科學技術。

謝梁 繆瑩瑩 高梓堯 王子玲等 ·數據庫 ·13萬字

QQ閱讀手機版

主站蜘蛛池模板: 时尚| 鄱阳县| 无极县| 兰考县| 南昌县| 崇明县| 东乌| 光山县| 巩义市| 铁力市| 秦安县| 平原县| 甘肃省| 体育| 高邮市| 凭祥市| 黄大仙区| 公主岭市| 靖州| 商南县| 延庆县| 龙泉市| 弥勒县| 武功县| 永吉县| 宜宾县| 中宁县| 乌兰县| 屯昌县| 日照市| 康定县| 石棉县| 商都县| 信阳市| 乌什县| 吴江市| 绵阳市| 白河县| 新乐市| 兴和县| 乌审旗|