登錄???|???注冊
本書以《中華人民共和國數據安全法》和《中華人民共和國個人信息保護法》為背景,旨在從概念和技術的角度對數據隱私與數據治理進行系統概述。首篇從歷史與系統的角度介紹數據隱私與數據治理的基礎,后三篇分別側重大規模數據收集、機器學習,以及數據治理中的隱私問題,介紹其相應的技術基礎,總結當下的關鍵問題與技術方案。本書從全新的數據生態的角度介紹數據隱私與數據治理,在內容介紹上,以技術與算法的講解為主,輔以案例,詳略得當。
孟小峰等編著 ·數據庫 ·12.6萬字
本書詳細介紹了開源的分布式SQL查詢引擎Trino涉及的方方面面的知識。本書共三部分,第一部分介紹Trino的發展歷史、主要功能以及如何安裝和使用它,第二部分介紹Trino的內部架構、部署、連接器和所支持的SQL語句的使用等,第三部分介紹在生產環境中部署Trino的必備知識,以及一些真實世界的部署案例。通過學習本書,你將了解Trino在解決海量數據分析和查詢問題方面的優越性,并學會在現實場景中使用它來高效地解決需要在短時間內返回結果的大數據查詢問題。
(美)馬特·富勒等 ·數據庫 ·11.8萬字
本書采用“問題描述+解決方案”模式,通過500個案例介紹了使用Pandas進行數據分析和數據處理的技術亮點。全書共分為8章,主要案例包括:讀寫CSV、Excel、JSON、HTML等格式的數據;根據行標簽、列名和行列數字索引篩選和修改數據,使用各種函數根據數據大小、日期范圍、正則表達式、lambda表達式、文本類型等多種條件篩選數據;統計NaN(缺失值)的數量、占比,根據規則填充和刪除NaN;在DataFrame中增、刪、查、改行列數據,計算各種行差、列差、極差以及直接對兩個DataFrame進行加、減、乘、除運算和比較差異;將寬表和長表相互轉換,創建交叉表和各種透視表;對數據分組結果進行求和、累加、求平均值、求極差、求占比、排序、篩選、重采樣等多種形式的分析,將分組數據導出為Excel文件。本書還附贈36個數據可視化案例,如根據指定的條件設置行列數據的顏色和樣式,根據行列數據繪制條形圖、柱形圖、餅圖、折線圖、散點圖、六邊形圖、箱形圖、面積圖等。本書適于作為數據分析師、物流分析師、金融分析師、數據產品開發人員、人工智能開發人員、市場營銷人員、辦公管理人員、Python程序員等各行各業人員的案頭參考書,無論對于初學者還是專業人士,本書都極具參考和收藏價值。
羅帥 羅斌編著 ·數據庫 ·10.9萬字
算力、數據、AI已經成為驅動當今社會技術發展的三架馬車,而算力也從傳統的超級計算向云超算的方向發展。本書旨在探討當前超級計算與云計算的融合而給算力帶來的新的發展,介紹當前在算力領域的一些實踐和探索,從理論到工程,幫助讀者了解超級計算的關鍵技術與未來發展,從而更好地應用和發展高性能技術。
(加) 張福波 張云泉 ·數據庫 ·10.4萬字
數據結構是計算機存儲、組織數據的方式,往往同高效的檢索算法和索引技術有關。學習和掌握數據結構的相關知識,使我們能夠更好地運用計算機來解決實際問題。為了提高讀者的學習效率,本書直接從各類競賽真題入手,以精練而準確的語言、全面細致地介紹了信息學競賽中經常用到的數據結構類型,包括鏈表、堆棧、隊列、樹、圖等。本書精挑細選、由淺入深地安排了相關習題。考慮讀者接受水平的差異,一般在引入新知識點的題目時,本書會提供該題目的完整參考代碼,但隨著讀者對此知識點的理解逐步加深,后續的同類型題目將逐步向僅提供算法思路、提供偽代碼和無任何提示的方式轉變。此外,對于一些思維跨度較大的題目,本書會酌情給予讀者一定的提示。本書可以與《信息學競賽寶典基礎算法》同步學習,也可以作為有一定編程基礎的讀者學習數據結構算法的獨立用書。
張新華 梁靖韻 劉樹明編著 ·數據庫 ·9.7萬字
本書針對當前恒星光譜分析面臨的主要問題,利用數據挖掘方法,對恒星光譜分類、稀有天體光譜自動發現、天文大數據挖掘等方面的內容展開研究。本書將定性與定量研究、理論與實證研究相結合,融合多個學科的研究成果,在研究方法和手段上有所創新。本書既有翔實的理論闡述,又有系列的公式推導,嚴謹可信,具有較高的理論研究價值;同時,本書提出的一些新型模型和理論框架具有較高的應用價值。
劉忠寶 ·數據庫 ·9.4萬字
PostgreSQL是一個開源的多用途關系數據庫系統,在世界各地廣泛使用。它是一個集成了子系統的龐大系統,每個系統都有一個特殊的復雜功能,并且可以相互協作。對內部機制的理解對于使用PostgreSQL進行管理和集成至關重要,本書從內核邏輯層面展現了PostgreSQL的全貌,并詳細分析了PostgreSQL數據庫的進程與內存體系結構,并發控制的原理及多種場景的流程、內存管理機制、預寫日志的文件結構、流復制等多個子系統的的原理細節。
(日)鈴木啟修 ·數據庫 ·9.1萬字
本書從大數據實時計算框架Spark的編程語言Scala入手,第1~4章重點介紹函數式編程語言Scala的基礎語法、面向對象編程以及函數式編程等,再通過編程訓練案例介紹Scala這門語言的實際開發應用,為讀者后面學習Spark框架打下牢固的編程基礎。第5~10章重點介紹Spark的安裝部署、SparkCore編程、SparkSQL結構化數據處理以及SparkStreaming實時數據處理等,對它們進行詳細的剖析和解讀。最后,在第11章中通過網站運營指標統計和IP經緯度熱力圖分析兩個實戰開發項目,讓讀者充分掌握Spark大數據實時計算框架技術的應用與實操方法。本書適合所有對大數據技術感興趣的讀者。
楊力 ·數據庫 ·8.2萬字
Spark作為新興的、應用范圍廣泛的大數據處理開源框架,吸引了大量的大數據分析與挖掘從業人員進行相關內容的學習與開發,其中ML是Spark3.0機器學習框架使用的核心。本書用于Spark3.0ML大數據分析與挖掘入門,配套示例源碼、PPT課件、數據集、思維導圖、開發環境和作者答疑服務。本書共分13章,從Spark3.0大數據分析概述、基礎安裝和配置開始,依次介紹ML的DataFrame、ML的基本概念,以及協同過濾、線性回歸、分類、決策樹與隨機森林、聚類、關聯規則、數據降維、特征提取和轉換等數據處理方法;最后通過經典的鳶尾花分析實例,回顧前面的學習內容,實現了一個完整的數據分析與挖掘過程。本書采取實例和理論相結合的方式,講解細致直觀,示例豐富,適合Spark3.0機器學習初學者、大數據分析和挖掘人員,也適合高等院校和培訓機構人工智能與大數據相關專業的師生教學參考。
王曉華 羅凱靖編著 ·數據庫 ·8萬字
Web3.0深刻地變革了數據存儲的方式,使個人數據和隱私得到了充分的保障,是實現元宇宙的重要保障。本書深入淺出地介紹了Web3.0和分布式存儲技術,深入探討了數據存儲、區塊鏈最新技術發展與產業應用,以及分布式計算等內容,帶來關于Web3.0應用與發展的新思路。
焜耀研究院 ·數據庫 ·7.9萬字
Python已成為廣受數據科學領域歡迎的開發語言。《Python絕技:運用Python成為數據工程師》契合這一趨勢,結合具體的業務場景,從數據思維的角度出發,剖析各業務環節中數據處理的策略、算法,并運用Python代碼呈現翔實的案例,構建出一個完整的數據分析體系。
黃文青 ·數據庫 ·7.7萬字
本書從實際應用的角度出發,介紹了概率與數理統計分析中的一些基本概念,以及在MATLAB環境下進行的實例應用。主要內容包括:MATLAB基礎知識、數理統計基礎、數據處理和統計繪圖、參數估計、假設檢驗、方差分析、數據擬合和回歸分析、聚類分析。本書適合作為高等院校統計學相關課程的教材,也可以作為廣大從事數據處理與分析人員的參考用書。
魏霖靜 ·數據庫 ·7.4萬字
隨著醫學研究和信息技術的快速發展,多元數據分析方法廣泛應用于醫學各個領域。R是一款優秀的開源軟件,有著實用的統計計算與可視化功能。本書使用R語言,結合精選的醫學實例介紹常用多元統計分析方法。統計分析方法只有在實際應用中才能得到直接、生動的驗證。本書強調實戰和應用,盡量淡化統計公式的推導和計算過程。通過本書的學習,讀者能熟練使用R語言及相關包實現多元統計計算,還能更深入地理解多元數據分析方法。本書可作為醫學院校高年級本科生或研究生的多元統計分析課程教材,亦可作為其他專業讀者和科研工作者從事科研活動的參考資料。
趙軍 戴靜毅編著 ·數據庫 ·7.4萬字
數據挖掘算法為大數據與人工智能的核心,掌握數據挖掘各算法的編程實現,有助于提升大數據的實踐運用能力。本書詳細闡述了數據挖掘常用算法與編程實現,同時,本書以多個經典的數據挖掘賽題為案例,詳細論述了數據預處理、特征選擇、可視化、算法選擇等全流程數據挖掘過程的編程實現,有助于提升讀者面對實際數據問題時靈活運用各類算法能力。
丁兆云 沈大勇 徐偉 周鋆 ·數據庫 ·4.7萬字
數據湖倉是一個現代化的開放式架構,擁有當今熱門的開源數據技術的廣度和靈活性。本書從初學者的角度出發,通過對數據湖倉重要概念的剖析,對數據湖倉的相關知識進行深入淺出的講解。全書共18章,對數據湖倉的基礎知識、數據工程、業務價值、數據集成等方面進行深入探討,同時展望數據架構的演化趨勢,使讀者能夠領會數據湖倉的精髓,最終輕松、全面地管理數據湖倉項目。本書適合數據架構師、業務人員和系統開發人員,以及對數據管理、數據分析感興趣的讀者閱讀。
(美)比爾·恩門等 ·數據庫 ·4.6萬字
本書是一本全面介紹數據庫管理的書籍。基礎介紹篇介紹了數據庫、SQL、MySQL以及數據類型等概念,并介紹了MySQL的安裝和查詢;實踐入門篇詳細介紹了數據庫的創建、查詢、插入、修改和刪除等語句的使用方法;中高級篇深入介紹了MySQL關鍵字、運算操作、日期函數、視圖、操作符等,同時介紹了如何對數據庫文件進行備份和恢復;應用實戰篇以核酸數據庫系統為例,介紹業務流程、系統流程、分布式系統、Redis、核酸數據庫系統的設計與實現、搜索引擎,以及使用PHP程序調用數據庫等內容。本書內容新穎、圖文并茂、實例豐富、通俗易懂,可供互聯網開發人員、數據庫運營人員以及培訓機構等相關人員閱讀,亦可作為初學者的入門教材。
林富榮編著 ·數據庫 ·3.5萬字
《零距離接觸云計算》通過生動有趣的漫畫和深入淺出的文字,形象、生動地向讀者介紹了云計算的興起、云計算的關鍵技術、云計算巨頭之爭、云計算帶給我們的影響和改變、云計算的安全、云計算離不開大數據等內容。本書圖文并茂,用趣味漫畫詮釋科普知識,傳達全新的科學學習理念,激發讀者的好奇心和想象力,養成科學的思維方法,適合所有對新科技感興趣的讀者閱讀。
王正偉 ·數據庫 ·2.5萬字
本書共5篇,分為14章介紹了PowerBI的基本操作、數據導入、數據整理、數據建模、數據可視化分析、數據發布等相關技能。第1篇為基礎入門篇(第1-3章),主要針對初學者,從零開始,系統且全面地講解了PowerBI的入門知識點、基本操作及數據的輸入和連接操作。第2篇為數據處理篇(第4-6章),介紹了PowerBI數據的整理操作、表格中行/列數據的管理,以及PowerBI數據的高級處理、M函數的使用等。第3篇為數據分析篇(第7-9章),介紹了PowerBI數據的建模操作及DAX語言的入門和進階操作等。第4篇為數據可視化篇(第10-12章),介紹了PowerBI數據的可視化呈現過程及如何對報表數據進行分析和發布等。第5篇為案例實戰篇(第13-14章),通過兩個綜合應用案例,講解了如何將PowerBI靈活地應用于實際工作中。
鳳凰高新教育編著 ·數據庫 ·0字
網站合作:傅女士 fuli.a@yuewen.com
雙新用戶(設備和賬號都新為雙新用戶)下載并登錄后1-20天最多可免費領取20本會員/單訂書且可免費讀10天
Copyright (C) 2025 www.cqxianglaokan.com All Rights Reserved 上海閱文信息技術有限公司 版權所有 粵公網安備 44030002000001號 ???? 增值電信業務經營許可證:粵B2-20090059???? 互聯網ICP備案號: 粵B2-20090059-5 ???? 舉報電話:010-59357051 營業執照 網絡文化經營許可證:滬網文 (2023) 3296-228號 網絡出版服務許可證:(署)網出證(滬)字第055號????互聯網宗教信息服務許可證:滬(2023)0000015
QQ閱讀手機版