- 一本書讀懂大數據(全彩圖解版)
- 馬兆林
- 1035字
- 2019-02-25 15:34:04
第1章 大數據時代:不可逆轉的大趨勢
全面認識大數據
隨著網絡的普及,“大數據”這個字眼在人們的視線中出現的頻率越來越高。大數據給人們帶來的神奇感,以及人們對大數據的追捧,讓大數據在人們今后的商業領域、生活領域中的地位如芝麻開花一般。但是對于大多數人來說,對大數據的了解僅僅是皮毛而已,真正能將大數據在生活中應用自如的人還是少之又少的,因此對大數據的使用并沒有達到路人皆知、人人皆用、人人會用的階段。那么究竟什么是大數據呢?
簡單來說,大數據實際上就是巨量資料的一種學術稱謂,它具體指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。


那么,這么一個“巨量資料”是憑借什么潛質,受到人們越來越多的追捧以及青睞呢?這還得歸功于大數據的四大特點。我們將其簡稱為4V:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
1.Volume(大量):到目前為止,人類所生產出來的全部印刷材料的數據總量為200PB(1TB=1024G,1PB=210TB,合43008000G),而歷史上全人類說過的所有的話的數據量大約是5EB(1EB=210PB,合225792000G)。現在,個人計算機硬盤的容量一般為TB量級,某些大企業的數據量已經驚人地達到EB量級。
2.Velocity(高速):例如我們要存儲1PB的數據,假設帶寬(網速)能達到1G/s,電腦24小時不間斷運行且容量足夠,將其存入電腦需要12天完成。大數據通過云計算在短短的20分鐘之內便可以完成。
3.Variety(多樣):結構化數據和非結構化數據構成了數據的多樣性。以往的結構化數據是以文本為主來對數據進行存儲,現在的諸如音頻、視頻、圖片、網絡日志、地理位置信息、購物記錄、搜索記錄等非結構化數據越來越多。
4.Value(價值):如果我們能夠合理利用數據,能夠進行正確、準確的數據分析,那么它將會為我們帶來很高的價值回報。在歐洲的一些發達國家,政府管理部門通過合理使用大數據,改進效率之后節約了超過14900億美元的經費。
大數據在各大領域的使用中占得一席高地,它采用的是一種什么樣的戰略戰術呢?事實上,大數據技術的戰略意義并不僅僅局限于對龐大的數據信息的掌握,而在于對這些含有意義的數據進行專業化處理。簡單來說,這好比是一種產業,要想使這種產業能夠真正意義上帶來盈利,那么如何提高對數據的“加工能力”并實現數據“增值”便是問題的關鍵。

除此之外,大數據還具有一大技術特色,它可以依托云計算分布式處理、分布式數據庫和云存儲、虛擬化技術,來對海量數據進行分布式挖掘。因此,大數據與云計算是密不可分的。值得注意的是,大數據在處理海量數據的時候必須用分布式架構,單臺計算機是斷然不能完成這樣浩繁的工作的。