- 數據可視化基礎與應用
- 劉佳等主編
- 2045字
- 2024-06-25 17:41:07
1.2 數據可視化的作用和意義
1.數據可視化的作用
數據可視化的作用包括記錄信息、分析推理、信息傳播與協同。
(1)記錄信息
自古以來,記錄信息的有效方式之一是用圖形的方式描述各種具體或抽象的事物。圖1-5(a)所示內容是我國的結繩記事,這種方式用不同粗細的繩子打成不同距離的結,其中的結有大有小,每種結法、距離大小以及繩子粗細表示不同的含義。圖1-5(b)所示內容是甲骨文記事,甲骨文因鐫刻、書寫于龜甲與獸骨上而得名。經過加工和刮磨的龜甲和獸骨由專門負責的卜官保管,卜官在它們的邊緣部位刻寫上記述這些甲骨的來源和保管情況的記事文字。圖1-5(c)所示內容是竹簡記事,古人將文字刻在竹子做的木片上用來記錄發生的事情。

圖1-5 我國古代的記事方式
田徑賽場上的裁判員通過圖1-6所示的圖可以清晰、準確、迅速地判定運動員的名次和成績。

圖1-6 田徑賽運動員的沖刺
(2)分析推理
數據可視化極大地降低了數據理解的復雜度,有效地提升了信息認知的效率。這有助于人們更快地分析和推理出有效信息。1854年,英國倫敦爆發了一場霍亂,John Snow醫生繪制了一張街區地圖,如圖1-7所示,這就是著名的“倫敦鬼圖”。該圖分析了霍亂患者的分布與水井分布之間的關系,John Snow發現在一口井的供水范圍內患者明顯偏多,據此找到了霍亂爆發的根源——一個被污染的水泵。

圖1-7 倫敦鬼圖
(3)信息傳播與協同
俗話說“百聞不如一見”“一圖勝千言”。圖1-8展示了中國智能手機的出貨量數據,我們從中可以直觀地感受到2020—2021年手機出貨量的變化情況。

圖1-8 2020Q4—2021Q4中國智能手機出貨量及增長率
圖1-9所示為雅虎郵箱處理數據量的示意圖形。雅虎郵箱每小時處理的電子郵件總量為1.2TB,這些郵件若打印出來,大約需要644245094張A4紙。這是一個很大的數據,但到底有多大?若644245094張紙被首尾對接,則可以繞地球4圈多。由此,我們就能深刻地感受到雅虎郵箱處理的數據量之大。

圖1-9 雅虎郵箱處理數據量的示意圖形
隨著計算機技術的普及,數據無論從數量上還是從維度層次上都變得日益繁雜。面對海量而復雜的數據,各個科研機構和商業組織普遍遇到以下問題。
① 大量數據不能被有效利用,棄之可惜,想用卻不知如何下手。
② 數據展示模式繁雜晦澀,無法快速甄別有效信息。
數據可視化就是將海量數據經過抽取、加工、提煉,通過可視化方式展示出來,從而改變傳統的文字描述識別模式,達到更高效地掌握重要信息和了解重要細節的目的。
數據可視化在數據分析中的作用主要體現在以下幾個方面。
① 動作更快。使用圖表來總結復雜的數據,可以確保對關系的理解要比那些混亂的報告或電子表格更快。可視化提供了一種非常清晰的交互方式,從而能夠更快地理解和處理這些信息。
② 以建設性方式提供結果。數據可視化工具能夠用一些簡短的圖形描述復雜的信息。通過可交互的圖表界面,各種不同類型的數據可被輕松理解。例如,許多企業通過收集消費者行為數據,再使用數據可視化來監控關鍵指標,從而更容易發現各種市場變化和趨勢。例如,一家服裝企業發現,在西南地區,深色西裝和領帶的銷量正在上升,這促使該企業在全國范圍內推銷這兩類產品。通過這種策略,這家企業遠遠領先于那些尚未注意到這一潮流的競爭對手。
③ 理解數據之間的聯系。在市場競爭環境中,找到業務和市場之間的相關性是至關重要的。例如,一家軟件公司的銷售總監在條形圖中看到,他們的旗艦產品在西南地區的銷售額下降了8%,銷售總監可以深入了解問題出現在哪里,并著手制訂改進計劃。通過這種方式,數據可視化可以讓管理人員立即發現問題并采取行動。
2.數據可視化的意義
在DIKW模型所定義的數據轉化為智慧的流程中,可視化借助人眼快速的視覺感知和人腦的智能認知能力,可以清晰有效地傳達、溝通并輔助數據分析的作用。現代的數據可視化技術綜合運用計算機圖形學、圖像處理、人機交互等技術,將采集或模擬的數據變換為可識別的圖形符號、圖像、視頻或動畫,并以此呈現對用戶有價值的信息。用戶通過對可視化的感知,使用可視化交互工具進行數據分析,獲取知識,并進一步提升為智慧。
對數據可視化的適用范圍存在不同的觀點。例如,有專家認為數據可視化是可視化的子類,主要處理統計圖形、抽象的地理信息或概念型的空間數據。現在的主流觀點將數據可視化看成傳統的科學可視化和信息可視化的泛稱,即處理對象可以是任意數據類型、任意數據特性,以及異構異質數據的組合。大數據時代的數據復雜性更高,如數據的流模式獲取、非結構化、語義的多重性等。
數據可視化的作用在于視物致知,即從看見物體到獲取知識。對于復雜、大尺度的數據,已有的統計分析或數據挖掘方法往往是對數據的簡化和抽象,隱藏了數據集真實的結構,而數據可視化則可還原乃至增強數據中的全局結構和具體細節。當然,數據可視化經常會陷入兩個誤區:一是為了實現其獲取知識的功能而令人感到枯燥乏味:二是為了畫面美觀而采用復雜的圖形。如果將數據可視化看成藝術創作過程,則數據可視化需要達到真、善、美的均衡,達到有效地挖掘、傳播與溝通數據中蘊涵的信息、知識與思想,實現設計與功能之間的平衡。從這個意義上說,數據可視化體現出寬物善知的作用。