官术网_书友最值得收藏!

深入淺出存儲引擎
會員

全書分為3篇:第1篇首先會詳細講解存儲引擎的全貌,讓讀者能對存儲引擎有一個整體的思維框架,介紹存儲引擎的兩大分支:基于b+樹的存儲引擎、基于lsm派系的存儲引擎,其次對存儲引擎部分涉及的一些數(shù)據(jù)結構、存儲介質(zhì)等概念做一個簡要的介紹,為后面內(nèi)容的深入學習做鋪墊。第二篇主要介紹基于b+樹的存儲引擎,在理論部分重點回答為什么選擇b+樹做存儲引擎索引結構、b+樹存儲引擎解決哪些問題以及如何解決。在實踐部分選擇開源社區(qū)中比較有名的boltdb存儲引擎項目來講解其內(nèi)部核心源碼的實現(xiàn)細節(jié)。第三篇主要介紹基于lsm派系的存儲引擎,理論部分重點介紹lsmtree中各組件的功能及作用,并在此基礎上擴展介紹其他幾類lsm派系存儲引擎的實現(xiàn)思路,幫助讀者開闊視野,實踐部分分別以bitcask、moss、leveldb等開源項目的核心源碼來展開,介紹其內(nèi)部實現(xiàn)細節(jié)。通過閱讀本書,讀者不僅能對存儲引擎,尤其是單機的存儲引擎有一個整體的框架,而且能對兩類存儲引擎的實現(xiàn)思路及背后原理有個深刻的掌握,只有深刻理解了存儲引擎的背后實現(xiàn)原理,讀者不僅可以自己動手開發(fā)自己的存儲引擎,更可以很快掌握關系型數(shù)據(jù)庫或者NoSql這類組件的核心原理,對未來實際應用與開發(fā)提供參考。

文小飛 ·數(shù)據(jù)庫 ·18.3萬字

金融商業(yè)算法建模:基于Python和SAS
會員

這是一本貫穿金融業(yè)務經(jīng)營全流程,以業(yè)務為驅(qū)動的金融數(shù)據(jù)挖掘與建模著作,涵蓋分析框架、模型算法、模型評估、模型監(jiān)控、算法工程化等數(shù)據(jù)建模環(huán)節(jié)。本書的4位作者都是在金融領域有多年工作經(jīng)驗的大數(shù)據(jù)專家,不僅技術功底深厚、業(yè)務經(jīng)驗豐富,而且對金融行業(yè)從業(yè)者的需求痛點和圖書市場的供給情況有深入了解。他們通過精心策劃和寫作,讓本書內(nèi)容獨樹一幟。本書針對決策類、識別類、優(yōu)化分析類三大主題,獨創(chuàng)九大模板:客戶價值預測、營銷響應預測、細分畫像、交叉銷售、申請反欺詐、違規(guī)行為識別、預測、運籌優(yōu)化、流程挖掘,詳細講解了每個模板的算法原理、評估方法、優(yōu)化方法和應用案例等,內(nèi)容上極力做到準確、明晰、直觀與實用。此外,本書還對數(shù)據(jù)科學項目中比較容易被忽視的內(nèi)容做了補充,包括模型評估、模型監(jiān)控、算法工程化,指導讀者構建易讀、高效、健壯的數(shù)據(jù)科學工程。本書堅持理論與實踐相結合,通過圖形、示例、公式幫助讀者快速掌握算法與優(yōu)化理論的同時,還打造了一套可輕松適配各種分析場景與需求的工具模板,力圖幫助讀者從理論快速跨越到實踐。

趙仁乾 田建中 葉本華 常國珍 ·數(shù)據(jù)庫 ·18.2萬字

Pandas數(shù)據(jù)分析快速上手500招(微課視頻版)
會員

本書采用“問題描述+解決方案”模式,通過500個案例介紹了使用Pandas進行數(shù)據(jù)分析和數(shù)據(jù)處理的技術亮點。全書共分為8章,主要案例包括:讀寫CSV、Excel、JSON、HTML等格式的數(shù)據(jù);根據(jù)行標簽、列名和行列數(shù)字索引篩選和修改數(shù)據(jù),使用各種函數(shù)根據(jù)數(shù)據(jù)大小、日期范圍、正則表達式、lambda表達式、文本類型等多種條件篩選數(shù)據(jù);統(tǒng)計NaN(缺失值)的數(shù)量、占比,根據(jù)規(guī)則填充和刪除NaN;在DataFrame中增、刪、查、改行列數(shù)據(jù),計算各種行差、列差、極差以及直接對兩個DataFrame進行加、減、乘、除運算和比較差異;將寬表和長表相互轉(zhuǎn)換,創(chuàng)建交叉表和各種透視表;對數(shù)據(jù)分組結果進行求和、累加、求平均值、求極差、求占比、排序、篩選、重采樣等多種形式的分析,將分組數(shù)據(jù)導出為Excel文件。本書還附贈36個數(shù)據(jù)可視化案例,如根據(jù)指定的條件設置行列數(shù)據(jù)的顏色和樣式,根據(jù)行列數(shù)據(jù)繪制條形圖、柱形圖、餅圖、折線圖、散點圖、六邊形圖、箱形圖、面積圖等。本書適于作為數(shù)據(jù)分析師、物流分析師、金融分析師、數(shù)據(jù)產(chǎn)品開發(fā)人員、人工智能開發(fā)人員、市場營銷人員、辦公管理人員、Python程序員等各行各業(yè)人員的案頭參考書,無論對于初學者還是專業(yè)人士,本書都極具參考和收藏價值。

羅帥 羅斌編著 ·數(shù)據(jù)庫 ·10.9萬字

數(shù)據(jù)科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow
會員

這是一本將數(shù)據(jù)科學三要素——商業(yè)理解、量化模型、數(shù)據(jù)技術全面打通的實戰(zhàn)性著作,是來自騰訊、滴滴、快手等一線互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)科學家、數(shù)據(jù)分析師和算法工程師的經(jīng)驗總結,得到了SQLFlow創(chuàng)始人以及騰訊、網(wǎng)易、快手、貝殼找房、谷歌等企業(yè)的專家一致好評和推薦。全書三個部分,內(nèi)容相對獨立,既能幫助初學者建立知識體系,又能幫助從業(yè)者解決商業(yè)中的實際問題,還能幫助有經(jīng)驗的專家快速掌握數(shù)據(jù)科學的Z新技術和發(fā)展動向。內(nèi)容圍繞非實驗環(huán)境下的觀測數(shù)據(jù)的分析、實驗的設計和分析、自助式數(shù)據(jù)科學平臺3大主題展開,涉及統(tǒng)計學、經(jīng)濟學、機器學習、實驗科學等多個領域,包含大量常用的數(shù)據(jù)科學方法、簡潔的代碼實現(xiàn)和經(jīng)典的實戰(zhàn)案例。第1部分(第1~6章)觀測數(shù)據(jù)的分析技術講解了非實驗環(huán)境下不同觀測數(shù)據(jù)分析場景所對應的分析框架、原理及實際操作,包括消費者選擇偏好分析、消費者在時間維度上的行為分析、基于機器學習的用戶生命周期價值預測、基于可解釋模型技術的商業(yè)場景挖掘、基于矩陣分解技術的用戶行為規(guī)律發(fā)現(xiàn)與挖掘,以及在不能進行實驗分析時如何更科學地進行全量評估等內(nèi)容。第二部分(第7~9章)實驗設計和分析技術從A/B實驗的基本原理出發(fā),深入淺出地介紹了各種商業(yè)場景下進行實驗設計需要參考的原則和運用的方法,尤其是在有樣本量約束條件下提升實驗效能的方法及商業(yè)場景限制導致的非傳統(tǒng)實驗設計。第三部分(第10~12章)自助式數(shù)據(jù)科學平臺SQLFlow針對性的講解了開源的工程化的自助式數(shù)據(jù)科學平臺SQLFlow,并通過系統(tǒng)配置、黑盒模型的解讀器應用、聚類分析場景等案例幫助讀者快速了解這一面向未來的數(shù)據(jù)科學技術。

謝梁 繆瑩瑩 高梓堯 王子玲等 ·數(shù)據(jù)庫 ·13萬字

QQ閱讀手機版

主站蜘蛛池模板: 杭锦旗| 定远县| 怀安县| 沭阳县| 民勤县| 理塘县| 高碑店市| 乌鲁木齐市| 开原市| 银川市| 丘北县| 沂水县| 临猗县| 海原县| 大方县| 洪雅县| 昌乐县| 方山县| 平远县| 房山区| 怀集县| 金华市| 苍溪县| 辽中县| 南充市| 石柱| 郧西县| 凭祥市| 叶城县| 周口市| 剑河县| 达孜县| 留坝县| 晋宁县| 九龙县| 岳阳市| 黄骅市| 石景山区| 甘孜| 曲靖市| 重庆市|