- 區塊鏈+大數據:突破瓶頸,開啟智能新時代
- 楊永強 蔡宗輝 劉雅卓
- 1847字
- 2019-11-12 14:02:15
1.1.1 云計算
云計算是指通過從云端來獲取所需要的服務內容,所謂“云端”就是指網絡資源。一般來說,“云”中的資源是可以無限擴展的,使用者可以隨時按需獲取和使用這些資源,也可以隨時擴展資源內容,然后按照對資源的使用情況付費。由于云計算的這種特性類似于日常生活中的水電資源服務,因此它也被稱作IT基礎設施。
如果將云計算的概念擴大化,把它擴張到服務領域,那么所有通過網絡來滿足用戶需求并且易擴展的服務都可以稱作云計算,這種服務可以是互聯網相關的硬件、軟件,也可以是存儲、下載等其他服務。
云計算的典型應用就是蘋果iCloud。在iCloud上,蘋果用戶不僅可以上傳各種資料以節省硬盤空間,還能夠同步不同蘋果設備中的文件、日程等,如果用戶在某一臺設備上對云端的資料進行了修改,iCloud還能夠幫助用戶同步到其他蘋果設備并對舊文件進行備份以備用戶需要。iCloud為用戶提供了免費的5 G云端硬盤空間,如果用戶有需求,可以付費擴容并享受更多服務。
從iCloud的使用模式可以看出,云計算服務提供了一種分布式架構——多個智能終端共同同步云端資料,而大數據的應用處理必然無法依靠單獨的計算機,必須使用分布式架構,因此云計算剛好能夠為大數據處理提供便利條件。
從技術上看,大數據和云計算的關系就像一枚硬幣的正反兩面一樣相輔相成、密不可分。依托云計算的分布式架構和云端存儲、虛擬化技術,大數據能夠充分發揮它對海量數據的挖掘能力。從整體上看,云計算為大數據處理提供了計算資源的底層架構,是上層數據分析處理軟件的基礎。
那么,云計算為何能夠幫助大數據將龐大的數據信息轉化成經濟效益呢?這里主要包括以下四個方面的原因,如圖1-1所示。

圖1-1 云計算幫助大數據的具體表現
1.作為提取大數據的前提
在數據量不斷增長的信息社會,獲得足夠多的數據才是企業從大數據中獲得利益的前提。而想要提取出大數據,來自于各種云端強大的云計算能力必不可少。云端不僅為提取大數據提供了足夠的硬盤空間,還能夠以較低的成本提取盡量多的數據資源,這一點在大數據產品普遍偏貴的條件下顯得尤為重要。
2.過濾無效數據
在大數據的初次收集中,有接近90%的數據屬于無效數據,這是由互聯網數據本身的特點決定的。既然無法保證數據全部有效,那么就必須找到一種技術過濾掉無效數據。一般來說需要重點過濾掉的無效數據有兩大類,一是大量的臨時緩存信息,二是公司防火墻外的網絡數據。
由于云計算可以按照需求進行擴展計算和存儲資源,所以經過一定的設計后云計算就可用來過濾這些無效數據,常見的公有云就是用于過濾來自公司防火墻外部的無效網絡數據的最佳工具。
3.可高效分析數據
云計算能夠為大數據計算提供分布式軟件處理方式,用以高效快速地進行數據分析。如果將公有云和私有云結合,就可以在數據分析完成后利用私有云將數據分析結果導入公司內部,方便公司進行下一步的運營決策。
4.助力企業管理虛擬化
隨著市場更新的速度也來越快,企業管理模式也追求突破有形界限的虛擬化管理,希望在有限的資源條件下實現資源效率的最大化。由于云計算就是硬件資源的虛擬化,因此當企業運用大數據分析結果指導決策時,如果加上云平臺的使用,就能夠通過云端應用決策指導所需軟件,將決策順利轉化到企業現有的管理系統中,助力企業管理虛擬化。
從美國國家標準與技術研究院對云計算的定義來看,云計算是一種按使用量付費的服務模式。由于它能夠快速為用戶提供資源,減少交互所需步驟和時間,用于計算時能夠實現每秒1014次的運算速度,可用來模擬核爆炸、預測市場等。
從用途上看,云計算的應用潛力和大數據不謀而合,云計算與大數據如同手心手背的關系,二者相輔相成。云計算的存在,為大數據技術挖掘數據背后的價值提供了平臺。
簡單來說,大數據擁有三層架構體系,包括數據存儲體系、數據處理體系和數據分析體系。數據存儲體系是大數據收集并存儲數據資源的支撐;數據處理體系包括無效數據的過濾和基礎建模等工作;數據分析體系則會根據具體情況做出結論預測,產生相應價值。
云計算能夠從存儲到處理再到分析給大數據技術提供全面的技術支持,云計算的并行計算和分布式計算能力都在大數據體系中具有不可或缺的重要作用。除了技術層面,云計算還能夠利用其分布式架構的特點,極大地降低企業在挖掘數據背后價值時的成本投入。
云計算通過自身和大數據的重合特點以及強大的運算能力為大數據技術提供了發展的平臺。雖然云計算概念比大數據概念提出得早,但正是大數據的出現讓云計算的優勢有了發揮的空間。與此同時,云計算和大數據結合也為大數據提供了牢固的基石,讓大數據能夠在技術上充分發揮數據的價值。