并行數據挖掘及性能優化:關聯規則與數據相關性分析
大數據推動了各行各業的迅猛發展,各領域呈現出新產品、新技術、新服務和新的發展業態,但“信息豐富而知識貧乏”的現象仍然存在。逾越數據與知識之間的鴻溝,需要強有力的分析工具和分析方法的支撐。現有的關聯規則挖掘算法,因其時空復雜性和I/O代價高,難以適應大數據分析任務。本書充分利用Hadoop、Spark等集群系統的強大數據處理能力,論述了支持大數據分析的關聯規則并行挖掘算法與集群系統性能優化,并探討了其在智能制造領域的應用。本書可供從事數據挖掘、機器學習及并行計算等相關專業的科研人員參考,也可作為高等院校計算機、大數據專業的高年級本科生與研究生的學習參考書。
·9.6萬字