并行數(shù)據(jù)挖掘及性能優(yōu)化:關(guān)聯(lián)規(guī)則與數(shù)據(jù)相關(guān)性分析
大數(shù)據(jù)推動(dòng)了各行各業(yè)的迅猛發(fā)展,各領(lǐng)域呈現(xiàn)出新產(chǎn)品、新技術(shù)、新服務(wù)和新的發(fā)展業(yè)態(tài),但“信息豐富而知識(shí)貧乏”的現(xiàn)象仍然存在。逾越數(shù)據(jù)與知識(shí)之間的鴻溝,需要強(qiáng)有力的分析工具和分析方法的支撐。現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘算法,因其時(shí)空復(fù)雜性和I/O代價(jià)高,難以適應(yīng)大數(shù)據(jù)分析任務(wù)。本書(shū)充分利用Hadoop、Spark等集群系統(tǒng)的強(qiáng)大數(shù)據(jù)處理能力,論述了支持大數(shù)據(jù)分析的關(guān)聯(lián)規(guī)則并行挖掘算法與集群系統(tǒng)性能優(yōu)化,并探討了其在智能制造領(lǐng)域的應(yīng)用。本書(shū)可供從事數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)及并行計(jì)算等相關(guān)專(zhuān)業(yè)的科研人員參考,也可作為高等院校計(jì)算機(jī)、大數(shù)據(jù)專(zhuān)業(yè)的高年級(jí)本科生與研究生的學(xué)習(xí)參考書(shū)。
·9.6萬(wàn)字