大數(shù)據(jù)平臺(tái)異常檢測(cè)分析系統(tǒng)的若干關(guān)鍵技術(shù)研究
大數(shù)據(jù)技術(shù)生態(tài)體系中的各類技術(shù)構(gòu)件本身沒有可自省的安全機(jī)制,構(gòu)件間使用的RPC協(xié)議也沒有安全機(jī)制,大數(shù)據(jù)平臺(tái)的安全性面臨著巨大挑戰(zhàn),如何高效、快速地檢測(cè)大數(shù)據(jù)平臺(tái)中的應(yīng)用異常對(duì)提高大數(shù)據(jù)平臺(tái)的安全性具有重要意義。本書在介紹相關(guān)研究工作及相關(guān)基礎(chǔ)內(nèi)容之后,主要針對(duì)大數(shù)據(jù)平臺(tái)的應(yīng)用層日志數(shù)據(jù),研究了平臺(tái)異常的檢測(cè)與分析問題,構(gòu)建了大數(shù)據(jù)平臺(tái)異常的離線檢測(cè)分析的方法體系及實(shí)時(shí)檢測(cè)的機(jī)制。研究了基于數(shù)據(jù)流二重概念漂移檢測(cè)的增量學(xué)習(xí)、分布式日志的最大頻繁序列模式挖掘算法、基于最大頻繁模式的動(dòng)態(tài)規(guī)則庫(kù)構(gòu)建算法、基于Web會(huì)話流的分布式實(shí)時(shí)異常定位算法、基于最大信息系數(shù)的在線異常檢測(cè)算法、基于聚類分析的離線異常檢測(cè)算法、基于相鄰請(qǐng)求的動(dòng)態(tài)時(shí)間閾值會(huì)話識(shí)別算法、基于會(huì)話特征相似性模糊聚類的SFAD異常檢測(cè)算法、基于貝葉斯粒子群的異常檢測(cè)算法、平臺(tái)異常時(shí)的推測(cè)式任務(wù)調(diào)度策略、基于實(shí)時(shí)負(fù)載的推測(cè)式任務(wù)調(diào)度算法。分析了大數(shù)據(jù)平臺(tái)異常檢測(cè)分析(RADA)系統(tǒng)在實(shí)現(xiàn)時(shí)所采用的大數(shù)據(jù)技術(shù)與組件技術(shù)選型,針對(duì)RADA系統(tǒng)進(jìn)行了深入的結(jié)構(gòu)化分析,介紹了基于融合架構(gòu)的RADA系統(tǒng)概要設(shè)計(jì),研究了RADA系統(tǒng)的詳細(xì)設(shè)計(jì)與實(shí)現(xiàn)方法,完整地總結(jié)了大數(shù)據(jù)平臺(tái)異常的實(shí)時(shí)檢測(cè)技術(shù)與分析RADA系統(tǒng)的關(guān)鍵技術(shù)。
·12.6萬(wàn)字