面向現(xiàn)代服務(wù)業(yè)大數(shù)據(jù)的高效數(shù)據(jù)管理研究
大數(shù)據(jù)需要滿足基本的3V特性,即數(shù)據(jù)容量大(價(jià)值密度較低)、數(shù)據(jù)類型繁雜和時(shí)效性要求高。大容量和低價(jià)值密度特性決定了存儲(chǔ)系統(tǒng)在通過分布式架構(gòu)提升存儲(chǔ)能力的同時(shí)也要格外注重?cái)?shù)據(jù)存儲(chǔ)的性價(jià)比,具有較低單位數(shù)據(jù)量存儲(chǔ)價(jià)格的磁盤類設(shè)備仍舊極具競爭力。較高的時(shí)效性要求和大數(shù)據(jù)類型繁雜特性則對存儲(chǔ)系統(tǒng)的高性能和適應(yīng)性方面提出了更大的挑戰(zhàn),也預(yù)示著存儲(chǔ)級(jí)別大數(shù)據(jù)管理在存儲(chǔ)系統(tǒng)性能提升過程中的地位愈加重要。總體而言,自人類進(jìn)入大數(shù)據(jù)時(shí)代,大數(shù)據(jù)存儲(chǔ)在高性能研究領(lǐng)域正發(fā)生著深刻的變革,主要體現(xiàn)在兩個(gè)大的方面:一方面是存儲(chǔ)系統(tǒng)基礎(chǔ)設(shè)施本身的性能提升,主要包括存儲(chǔ)介質(zhì)和存儲(chǔ)體系結(jié)構(gòu)的進(jìn)化與改善,以及緊密依附于具體介質(zhì)和架構(gòu)的緩存管理、預(yù)取等核心存儲(chǔ)技術(shù)的優(yōu)化。存儲(chǔ)系統(tǒng)基礎(chǔ)設(shè)施的高性能優(yōu)化體現(xiàn)出一種通用性和底層依賴性的特征,其核心是面向底層存儲(chǔ)設(shè)備和存儲(chǔ)系統(tǒng)的,缺乏對大數(shù)據(jù)本身結(jié)構(gòu)優(yōu)化的相關(guān)研究。另一方面則從大數(shù)據(jù)本身及其管理出發(fā),研究提升存儲(chǔ)系統(tǒng)性能和效率的模型與方法,由于此類研究更具針對性,其涉及的大數(shù)據(jù)種類繁多、應(yīng)用類型廣泛,為此本書采用具有典型大數(shù)據(jù)特征的軌跡大數(shù)據(jù)作為研究對象,并從軌跡大數(shù)據(jù)壓縮和軌跡大數(shù)據(jù)檢索(訪問)兩個(gè)與存儲(chǔ)性能直接相關(guān)的方面出發(fā),研究了云架構(gòu)下高性能軌跡大數(shù)據(jù)壓縮框架和時(shí)空融合檢索算法。通過相關(guān)研究,本書構(gòu)建了大數(shù)據(jù)背景下高性能存儲(chǔ)系統(tǒng)與管理技術(shù)的核心研究內(nèi)容體系,并給出了相應(yīng)的典型研究成果,為高性能大數(shù)據(jù)存儲(chǔ)系統(tǒng)的研究領(lǐng)域和研究方向提供了有益的借鑒。
·15.6萬字