官术网_书友最值得收藏!

1.2 數據可視化簡介

1.2.1 數據可視化的意義

數據分析是面向決策問題,通過收集相關數據,從數據中獲取信息并總結知識的過程。數據分析是為了輔助決策,為決策者提供相關的信息和知識。通常,數據以一定形式進行表達,如以位置、大小、長度、寬度、高度、顏色、形狀等直觀可見的方式表達,也有經過一些轉換和間接方式呈現,如通過匯總、旋轉、切片和切塊等手段展示出來。這些直接和間接方式,都需要依靠圖、表等工具進行視覺上的展示,即進行數據可視化。

相比于包含歷史記錄、標記等的傳統可視化,數據可視化重點關注數據科學和數據分析。在技術方面,隨著數據量的激增,傳統的可視化不能適應海量、多源、異構、動態、高維數據的挑戰,而數據可視化綜合了可視化、計算機圖形學、人機交互等理論與方法。在展示方面,傳統的可視化科學性不太強,有些時候以草圖和示意圖形式出現,而數據可視化強調科學標準圖示的輸出,將數據映射為可識別的圖形、圖像、視頻或動畫等形式,更吸引眼球,呈現出更精準、更有價值的信息。用戶可以通過對數據可視化的感知,借用數據可視化交互手段或工具進行數據分析,進而獲取知識[5]。數據可視化借助人類的視覺感知與認知能力,可以有效地傳達豐富的、極易被隱藏的信息,對人類分析數據和解決實際問題起到輔助作用。

現代數據可視化除了將數據進行圖形可視顯示,在有些場景下還需從數據中發現規律并獲取新模式,進而通過可視化形式進行展示。現代管理決策需要從海量數據中獲取潛在有用的知識。傳統統計方法和數據挖掘方法往往對數據進行簡化和抽象,在一定程度上進行了壓縮解析,隱藏了數據集中的真實細節。而新的數據可視化則可以還原乃至增強數據中的全局結構和計算轉換過程的細節。因此,數據可視化經常與統計學、數據挖掘、大數據分析等結合起來,利用數據可視化,洞見模式和知識。

1.2.2 數據可視化的作用

在大數據時代,數據可視化技術作用明顯,主要包括觀測與跟蹤數據、分析數據、輔助理解數據、增強數據吸引力[6]等。

1.觀測與跟蹤數據

數據可視化能進行歷史數據的跟蹤。圖1-5為截至2020年年底全國人口統計圖,我們可以觀測歷次人口普查數據情況。該圖通過柱形直觀反映了人口多少及變化,尤其是相對情況。

圖1-5 歷次人口普查數據

資料來源:國家統計局《2020年第七次全國人口普查主要數據》。

數據可視化也能對平面數據進行跟蹤,如百度平臺展示的氣溫數據圖,動態地展示了各省級行政區氣溫。

2.分析數據

圖1-6為用戶參與數據可視化分析的過程。從圖中可以看出數據可視化是連接數據和用戶的橋梁,可視化能夠將數據更直觀地展現在用戶面前,提高用戶分析數據和獲取信息的效率[6]

圖1-6 用戶參與數據可視化分析的過程

資料來源:林子雨.大數據技術原理與應用:概念、存儲、處理、分析與應用[M].3版.北京:電子工業出版社,2021.

3.輔助理解數據

為了輔助理解PageRank中網頁重要程度的變化,可以利用如圖1-7所示的數據可視化方式來展示計算過程。其中,圓圈表示網頁,箭頭符號表明網頁間的連接關系,三角標識標注當前計算焦點,而圓圈大小則可以直觀顯示網頁的重要程度,即圓圈直徑越大,對應的網頁重要程度越大。

圖1-7 PageRank的計算過程

4.增強數據吸引力

圖1-8為同樣文字的不同可視化展示方式。圖1-8a和圖1-8b字母組合、各字母的形狀和展示位置都一樣,但由于圖1-8b將所有的字母“A”用粗體顯示。所以,觀測者可以更快速地定位圖1-8b中字母“A”的位置,輔助統計字母“A”的數量。這就是數據可視化的魅力所在。

圖1-8 同樣文字的不同可視化展示方式

1.2.3 數據可視化的分類

通常,數據可視化處理的數據為科學數據和半結構化或非結構化數據,因此,數據可視化在廣義上可以分為科學可視化和信息可視化兩類。科學數據往往是一些可以進行空間描述的數據,即有坐標或者測量數據、仿真數據,如通過計算機模擬等手段獲取的數據,通過X射線、CT、核磁共振、超聲等手段獲取的影像數據。信息可視化處理的對象是一些半結構化或非結構化的數據,如社交網絡、網頁、文本等。

1.科學可視化

科學可視化是可視化領域相對比較成熟的一個領域[7],其基礎理論和方法比較成型,早期關注三維世界現象,數據通常表達為立體或平面形式,常用三維或二維空間形式呈現[8]

科學可視化可分為標量場可視化、向量場可視化、張量場可視化三類[5]

(1)標量場可視化(Scalar Field Visualization)。標量(或作純量),也被稱為“無向”的量,是指那些只具有數值大小而無方向性的物理量,為單一數值,多個標量值構成標量場。如CT照片實際上是一個二維數據標量場,照片的灰度表示密度。將這些數據按一定順序排列起來,就構成一個三維數據標量場。

標量場可以表示成含有標量值的函數,即fxyz)。可視化函數f的方法有三種:第一種是將數值直接映射為顏色等,如用顏色表示污染嚴重程度等;第二種方法是將f的點集進行連線或連面,如地圖中的等高線;第三種是將標量數據場看成媒介,如利用光源透射該媒介以顯示內部結構。

(2)向量場可視化(Vector Field Visualization)。數學中的向量也稱為歐幾里得向量、幾何向量、矢量,是指具有大小和方向的量。在物理學和工程學中,幾何向量更常被稱為矢量。向量場的每一個采樣點是一維向量(一維數組),向量場可視化主要關注其中蘊含的流體模式和關鍵特征區域。向量場可視化主要應用于計算流體動力學中速度場的可視化。任何涉及流的領域都可以采用向量場可視化,如人口的流動等。

向量場可視化有三種方法。第一種為粒子對流法,可以模擬粒子流動,通過獲取軌跡模擬流體模式,包括流線、流面、流體、跡線等具體方法。第二種為影像展示法,即通過向量場轉換為紋理圖像。第三種為圖標編碼標識,即通過簡易圖標,如線條、箭頭、方向標志符等標識向量場信息。

(3)張量場可視化(Tensor Field Visualization)。張量概念是向量概念的推廣,標量可看作0階張量,向量可看作1階張量。張量是一個可用來表示在一些向量、標量和其他張量之間線性關系的多線性函數。

張量場可視化方法分為三類:基于紋理、幾何、拓撲的方法。紋理的方法是將張量場轉換為靜態或者動態圖像,即將張量轉換為向量,從而用向量場可視化方法處理。幾何的方法是刻畫某類張量場屬性的幾何表達,其中的圖標法采用某種幾何形式表達單個張量,如橢球和超二次曲面;也可以使用超流線法(Hyper Streamline)將張量轉換為向量,再用向量場可視化方法處理,如二階對稱張量的主特征方向。拓撲的方法是計算張量場的拓撲特征,將感興趣區域劃分為具有相同屬性的子區域,并建立對應的圖結構,實現拓撲簡化、拓撲跟蹤和拓撲顯示。

2.信息可視化[3]

信息可視化是通過人類的視覺能力來理解抽象信息的含義,從而加強人類的認知活動。計算機圖形學助推信息可視化發展,但相比于傳統的計算機圖形學,信息可視化可以增強認知能力,通過可視化圖形呈現數據中隱含的信息和規律,建立符合人們認知規律的心理映像。

信息可視化面向半結構化或非結構化數據,關注抽象、高維數據。其分析方法與分析數據的類型緊密相關,通常有以下分類。

(1)多維數據可視化(Multidimensional Data Visualization)。多維數據可視化可以處理多變量的高維數據,將其在二維平面上呈現出來。多維數據可視化通常將數據降維到低維空間,使用相關聯的多視圖來展現不同維度。多維可視化的方法包括基于幾何圖形、基于圖標、基于像素、基于層次結構、基于圖結構及多方法混合等。

(2)圖形數據可視化(Graphical Data Visualization)。圖形是由元素和元素之間連接組成的數據的抽象表現。社交網和地圖都是圖形數據可視化的具體例子。通常,圖形數據可視化可分為靜態圖形數據可視化和動態圖形數據可視化。靜態圖形數據可視化主要有基于節點鏈接的圖形可視化方法和矩陣可視化方法,這些方法比較直觀,且表現力強。動態圖形數據可視化是用自然的方式來說明隨時間變化事物發生的改變。有人已經通過動畫技術對動態圖形進行了無數次的可視化嘗試,然而,維持一個意境地圖并不能幫助我們深入了解動畫動態圖。因此,如何用靜態的方式呈現動態圖是一種可行的嘗試,即以靜態方式編碼時間維度,其中時間軸和組圖是兩種較常見的選擇。

(3)時空數據可視化(Spatiotemporal Data Visualization)。時間和空間是描述事物的兩個主要因素,時空數據和地理信息數據的可視化顯得至關重要。時空數據可視化面向的對象是帶有時間與地理位置標簽的數據,通常面向線性和周期性兩種特征,可以使用不同的可視化方法。對于地理信息數據可視化來說,合理地選擇和布局地圖上的可視化元素,呈現更多的信息要素是關鍵。

(4)文本數據可視化(Textual Information Visualization)。隨著網絡的發展,特別是社交媒體的深度應用,大量的非結構化在線信息等內容數據不斷增長,形成海量的文本數據。人們對于視覺的感知和認知速度遠遠高于文本。通過文本數據可視化技術可以將文本中蘊含的語義特征(例如詞頻與重要度、邏輯結構、主題聚類、動態演化規律等)直觀地展示出來。文本數據可視化方法可分為靜態和動態兩種。靜態文本數據可視化方法主要有基于特征的文本數據可視化和基于主題的文本數據可視化。動態文本數據可視化試圖展示隨時間變化的文本內容演化模式,如使用云圖、主題詞裂變圖等方式。

主站蜘蛛池模板: 天祝| 营山县| 榆林市| 西乌珠穆沁旗| 太和县| 安义县| 宝山区| 丁青县| 郴州市| 杭锦旗| 沙洋县| 普兰店市| 托克逊县| 苏州市| 曲水县| 舞阳县| 西城区| 尚志市| 浦江县| 丽江市| 石家庄市| 武陟县| 贵南县| 扬州市| 清新县| 乌恰县| 芮城县| 尤溪县| 望城县| 梁平县| 镇原县| 喀喇沁旗| 扬州市| 彝良县| 始兴县| 桑日县| 清镇市| 惠州市| 分宜县| 大埔县| 石城县|