Hive大數(shù)據(jù)存儲與處理
本書以廣電大數(shù)據(jù)案例為主線,系統(tǒng)介紹數(shù)據(jù)倉庫Hive存儲和初步處理方法的相關(guān)知識。本書條理清楚、重點(diǎn)突出,內(nèi)容循序漸進(jìn)、由淺入深。本書共8章,包括廣電大數(shù)據(jù)用戶畫像需求分析、部署開發(fā)環(huán)境、廣電用戶數(shù)據(jù)存儲、廣電用戶基本數(shù)據(jù)簡單查詢、廣電用戶賬單與訂單數(shù)據(jù)查詢進(jìn)階、廣電用戶收視行為數(shù)據(jù)查詢優(yōu)化、廣電用戶數(shù)據(jù)清洗及數(shù)據(jù)導(dǎo)出,以及廣電用戶數(shù)據(jù)存儲與處理的程序開發(fā)。本書大部分章包含實(shí)訓(xùn)和課后習(xí)題,通過練習(xí)和操作實(shí)踐,幫助讀者鞏固所學(xué)的內(nèi)容。本書可以作為高等院校數(shù)據(jù)科學(xué)或大數(shù)據(jù)相關(guān)專業(yè)的教材,也可以作為大數(shù)據(jù)愛好者的自學(xué)用書。
·8.8萬字