- 供應鏈大數據:理論、方法與應用
- 代四廣 曹玉姣等編著
- 2190字
- 2024-04-15 11:46:53
1.1.3 大數據分析
大數據包括結構化、半結構化和非結構化數據,非結構化數據越來越成為數據的主要部分。據IDC的調查報告顯示:企業中80%的數據都是非結構化數據,這些數據每年都按指數增長60%。
企業如何從海量數據中獲取信息?在以云計算為代表的技術創新大幕的襯托下,這些原本看起來很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據開始為人類創造更多的價值。大數據分析技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換而言之,如果把大數據分析看作一種產業,那么這種產業實現盈利的關鍵在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
適用于大數據分析的技術,包括大規模并行處理(MPP)數據庫、數據挖掘、分布式文件系統、分布式數據庫、云計算平臺、互聯網和可擴展的存儲系統。
隨著云時代的來臨,大數據分析常和云計算聯系到一起。實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的計算機分配工作。大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式架構,它的特色在于對海量數據進行分布式數據挖掘,但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術。
相較于傳統的數據分析,大數據分析技術有效結合了各種信息技術的優勢,在技術方面具有規模化、數字化和網絡化特點,在服務方面具有自主化、個性化、智能化等特點。其主要特點表現為以下幾個方面。
1)數據分析結果具有不確定性。利用大數據技術收集到的信息都是已經存在的相關數據,并對此進行分析,同時還要預測后續的一系列問題,雖然數據分析的準確性相對較高,但是依舊存在著預測不準確的情況,因此應用大數據技術具有不確定性的特點。
2)需要大量用戶的參與。大數據下數據處理需要更多的信息支撐,大數據信息、信息服務以及知識體系都需要數據信息的支撐,因此需要用戶提供更多的數據信息,這直接影響大數據分析的結果。
3)大數據具有自主性的特點,可以根據用戶的需求來提供相應的服務。
4)大數據是一種綠色服務。作為一種與各種先進的信息處理技術相結合的服務體系,從數據資源的提取和處理來看,大數據技術可以看作是綠色服務。
大數據時代,大數據的分析呈現出如下主要趨勢。
(1)數據的資源化
資源化是指大數據成為企業和社會關注的重要戰略資源,并已成為大家爭相搶奪的新焦點。因而,企業必須提前制訂大數據營銷戰略計劃,搶占市場先機。
(2)與云計算的深度結合
大數據離不開云處理,云處理為大數據提供了彈性可擴展的基礎設備,是產生大數據的平臺之一。自2013年開始,大數據技術已開始和云計算技術緊密結合,預計未來兩者的關系將更為密切。除此之外,物聯網、移動互聯網等新興計算形態,也將一同助力大數據革命,讓大數據營銷發揮出更大的影響力。
(3)科學理論的突破
隨著大數據的快速發展,就像計算機和互聯網一樣,大數據很有可能是新一輪的技術革命。隨之興起的數據挖掘、機器學習和人工智能等相關技術,可能會改變數據世界里的很多算法和基礎理論,實現科學技術上的突破。
(4)數據科學和數據聯盟的成立
未來,數據科學將成為一門專門的學科,被越來越多的人所熟知。各大高校將設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位。與此同時,基于數據這個基礎平臺,也將建立起跨領域的數據共享平臺,之后,數據共享將擴展到企業層面,并且成為未來產業的核心一環。
(5)數據泄露泛濫
未來幾年數據泄露事件的增長率也許會達到100%,除非數據在其源頭就能夠得到安全保障。可以說,在未來,每個企業都有可能面臨數據攻擊,無論其是否已經做好安全防范。而所有企業,無論規模大小,都需要重新審視如今的安全定義。在財富500強企業中,超過50%將會設置首席信息安全官這一職位。企業需要從新的角度來確保自身以及客戶數據在創建之初便獲得安全保障,而并非在數據保存的最后一個環節。
(6)數據管理成為核心競爭力
數據管理成為核心競爭力,直接影響財務表現。當“數據資產是企業核心資產”的概念深入人心之后,企業對于數據管理便有了更清晰的界定,將數據管理作為企業核心競爭力,持續發展,戰略性規劃與運用數據資產,成為企業數據管理的核心。數據資產管理效率與主營業務收入增長率、銷售收入增長率顯著正相關;此外,對于具有互聯網思維的企業而言,數據資產競爭力所占比重為36.8%,數據資產的管理效果將直接影響企業的財務表現。
(7)數據質量是BI(商業智能)成功的關鍵
采用自助式商業智能工具進行大數據處理的企業將會脫穎而出。其中,要面臨的一個挑戰是多數據源會帶來大量低質量數據。想要成功,企業就需要理解原始數據與數據分析之間的差距,從而消除低質量數據并通過BI獲得更佳決策。
(8)數據生態系統復合化程度加強
大數據的世界不只是一個單一的、巨大的計算機網絡,而是一個由大量活動構件與多元參與者元素所構成的生態系統,即由終端設備提供商、基礎設施提供商、網絡服務提供商、網絡接入服務提供商、數據服務使用者、數據服務提供商、觸點服務、數據服務零售商等一系列的參與者共同構建的生態系統。而今,這樣一套數據生態系統的基本雛形已然形成,接下來的發展將趨向于系統內部角色的細分(即市場的細分)、系統機制的調整(即商業模式的創新)、系統結構的調整(即競爭環境的調整)等,從而使得數據生態系統復合化程度逐漸增強。
- 服裝表演組織與編導(第2版)
- 楊鳳池《咨詢心理學》(第2版)筆記和習題(含考研真題)詳解
- 黑龍江大學俄語學院《俄語5》學習指南【詞匯短語+課文精解+全文翻譯+練習答案】
- 高等分析化學
- 生物統計輔導與題解
- 王次炤《藝術學基礎知識》筆記和習題(含考研真題)詳解
- 國際關系學院國際關系與國際法專業(含723國際關系與國際法專業基礎、813國際關系與國際法專業綜合)歷年考研真題及詳解
- 王守仁《英國文學選讀》(第2版)課后習題詳解
- 2020年遼寧公務員錄用考試專項教材:言語理解與表達【考點精講+典型題(含歷年真題)詳解】
- 韓德培《環境保護法教程》(第6版)筆記和課后習題詳解
- 新一代計算機體系結構
- 學前教育專業幼兒舞蹈基礎訓練
- 首都師范大學870發展心理學[專業碩士]歷年考研真題及詳解
- 信號與線性系統輔導與題解
- 物理化學