官术网_书友最值得收藏!

  • 數(shù)據(jù)可視化
  • 蔣國銀等編著
  • 12字
  • 2024-06-18 18:33:15

CHAPTER 1
第1章
數(shù)據(jù)可視化概述

1.1 可視化簡(jiǎn)介

1.1.1 可視化的意義

人類主要依靠視覺、聽覺、味覺等途徑來獲取外在世界的信息,而視覺是最重要的途徑之一。視覺是指通過人眼來感知外在世界,同時(shí)接收和處理外界信息。雖然人眼具有高帶寬的并行處理能力,對(duì)于一般的數(shù)字、文本等符號(hào)能夠達(dá)到較好的識(shí)別效果,但是人眼對(duì)可視化符號(hào)的感知速度更快,而且有助于人類進(jìn)行潛意識(shí)加工[1]。通常,人類執(zhí)行高效搜索的過程只能保持幾分鐘,并且信息越豐富,越容易耗費(fèi)大量的注意力。通過可視化手段可以保存待處理信息,彌補(bǔ)人腦有限記憶的不足,同時(shí)也能吸引關(guān)注,高效傳遞信息。

1.1.2 可視化的功能

可視化(Visualization)是一種利用圖形進(jìn)行信息交流的方法表示[2]。可視化過程是指將復(fù)雜的信息以圖形的形式呈現(xiàn)出來,讓這些信息更容易、更快速地被人理解。因此,它也是一種放大人類感知的圖形化表示手段[3]。可視化技術(shù)是對(duì)所需表達(dá)內(nèi)容進(jìn)行可視化表達(dá)以增強(qiáng)認(rèn)知的技術(shù)。

通常,可視化具有以下幾個(gè)功能。

1.信息記錄與保存

古今中外,草圖是記錄與保存大量歷史信息的最好方式。最早,古人采用結(jié)繩記事,通過在不同粗細(xì)的繩子上結(jié)成不同距離、不同大小的結(jié)來記錄事物。雖然結(jié)繩記事的方式不能直接反映出記錄的事物,但通過結(jié)法、結(jié)的大小、距離大小以及繩子粗細(xì)可以表達(dá)出不同的信息。草圖不僅能直觀地描述事物,如達(dá)·芬奇對(duì)人頭蓋骨的可視化,而且多幅連續(xù)漸變的圖能反映事物周期變化,如伽利略關(guān)于月亮周期的繪圖。當(dāng)然,現(xiàn)代的繪畫和圖形圖像形式更為多樣,內(nèi)容更為豐富,能更加詳細(xì)地記錄歷史信息的方方面面。

2.信息推理與分析

可視化能擴(kuò)充人腦記憶,幫助人腦形象地理解和分析任務(wù),顯著提升信息分析的效率。將信息以可視化的形式呈現(xiàn)給受眾,可以引導(dǎo)受眾通過可視化結(jié)果進(jìn)行合理的推理和分析,進(jìn)而得到有用的信息。這種直觀的信息感知機(jī)制,大大降低了受眾對(duì)對(duì)象感知和理解的復(fù)雜程度。如湖泊藻類生長(zhǎng)的可視化場(chǎng)景,能幫助受眾理解藻類蔓延的路徑和速度等信息,以輔助分析消除和控制藻類蔓延的關(guān)鍵點(diǎn)和時(shí)長(zhǎng)等。

3.信息傳播與擴(kuò)散

一般認(rèn)為,“百聞不如一見”“一圖勝千言”,可視化圖形能簡(jiǎn)潔明了地讓受眾理解并傳播信息,也能抓住受眾“眼球”,對(duì)信息進(jìn)行擴(kuò)散。例如,在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的當(dāng)下,電子商務(wù)平臺(tái)充分使用圖片和視頻等可視化形式展示和推廣商品,如在酒店產(chǎn)品及服務(wù)的在線展示中,一張好的圖片或一段視頻展示勝過長(zhǎng)篇的文字性介紹。

1.1.3 可視化的分類

可視化的目標(biāo)在于幫助感知者洞悉蘊(yùn)藏于事物中的知識(shí)和規(guī)律。從展示時(shí)間變化來看,可視化可分為動(dòng)態(tài)和靜態(tài)的形式;從展示形式來看,可視化可分為直接和間接的形式;從信息傳遞方式來看,可視化可分為探索性和解釋性的形式。

1.從展示時(shí)間變化來看

(1)動(dòng)態(tài)可視化。動(dòng)態(tài)可視化是隨時(shí)間流動(dòng)而改變形態(tài)的可視化形式,通過動(dòng)態(tài)的圖像和視頻等方式展示。這種動(dòng)態(tài)方式可以呈現(xiàn)出信息隨時(shí)間的變化,用幀的形式進(jìn)行可視化對(duì)象的形態(tài)展示,即動(dòng)態(tài)成像方式。隨著幀數(shù)變多,動(dòng)態(tài)變化越細(xì)致,時(shí)間粒度越小,就形成了一種動(dòng)畫或視頻的可視化展示方式。動(dòng)態(tài)可視化的表現(xiàn)形式豐富多樣,具有極強(qiáng)的包容性,也可以采用多種形式混搭,尤其隨著交互技術(shù)的出現(xiàn),可以以交互形式進(jìn)行動(dòng)態(tài)可視化展示。

(2)靜態(tài)可視化。靜態(tài)可視化是對(duì)對(duì)象的某一個(gè)時(shí)間點(diǎn)上的形態(tài)、屬性等方面進(jìn)行展示,相當(dāng)于動(dòng)態(tài)可視化某一時(shí)刻點(diǎn)上的一個(gè)截面,可以通過圖、表或混合的方式進(jìn)行展示。其中:圖形可以展示對(duì)象的形態(tài),如線條型、平面圖、立體圖、多維空間圖等;表格可以用于展示對(duì)象的多個(gè)屬性和內(nèi)容,如二維表、三維表、多維表等;圖表或者圖文等混合方式結(jié)合了圖形、表格、文字等多方面的優(yōu)勢(shì),可以綜合展示對(duì)象的形態(tài)、屬性等。

2.從展示形式來看

(1)直接可視化。直接可視化是將對(duì)象表面的屬性和內(nèi)容進(jìn)行直接展示,能最直接表現(xiàn)出對(duì)象的原始形態(tài)和特征,讓受眾獲得最直觀的印象。這種形式通常利用圖、表等直接輸出,技術(shù)上比較容易實(shí)現(xiàn)且成本較低。

(2)間接可視化。相比于直接可視化,間接可視化是將對(duì)象部分屬性進(jìn)行合并或者變換以展示對(duì)象的某些特點(diǎn)或者特征。屬性合并是將對(duì)象的多個(gè)屬性用一個(gè)屬性進(jìn)行替代,以達(dá)到降維的目的,如將多個(gè)成績(jī)用平均績(jī)點(diǎn)或者成績(jī)等級(jí)來替換。屬性變換是將對(duì)象的屬性數(shù)據(jù)類型或者取值進(jìn)行某種變換,如將字符型變換成數(shù)值型,將百分制成績(jī)分?jǐn)?shù)變換為績(jī)點(diǎn)等。

3.從信息傳遞方式來看

(1)探索性可視化。有時(shí)候,觀察者不容易直接從對(duì)象的屬性和內(nèi)容中獲取所需要的信息,但是可以通過可視化的手段進(jìn)行呈現(xiàn)和展示,以輔助發(fā)現(xiàn)對(duì)象的特征、趨勢(shì)或異常,如罪犯特征、犯罪時(shí)間趨勢(shì)等。這種可視化技術(shù)通常配合數(shù)據(jù)挖掘技術(shù)一起運(yùn)用。

(2)解釋性可視化。解釋性可視化是一種在視覺呈現(xiàn)階段,依據(jù)已知的信息或知識(shí),以可視化的方式將它們傳遞給受眾的形式。相比于探索性可視化,解釋性可視化更為直觀,但表達(dá)的潛在信息相對(duì)較少。

1.1.4 可視化的發(fā)展史[4]

1.17世紀(jì)前:早期地圖與圖表

最早的可視化萌芽出現(xiàn)在幾何圖、恒星和其他天體的位置表,以及幫助導(dǎo)航和探索的地圖制作中。公元前200年,古埃及的測(cè)量師在規(guī)劃城鎮(zhèn)時(shí)使用了坐標(biāo)的概念,地球和天體的位置也是由類似于經(jīng)緯度的符號(hào)確定的。

圖1-1 勻加速公式

圖1-2 勻加速運(yùn)動(dòng)構(gòu)形

14世紀(jì),尼科爾·奧雷斯姆(Nicole Oresme)提出了關(guān)聯(lián)值制表和繪制值的想法,隨后不久尼科爾提出了距離與速度的理論圖,即勻加速定理,如圖1-1和圖1-2所示。

到了16世紀(jì),精確觀測(cè)和測(cè)量物理量、地理位置及天體位置的技術(shù)和儀器得到了很好的發(fā)展。1617年,斯涅耳(W.Snell)首創(chuàng)三角測(cè)量法(見圖1-3),此后繪制地圖的視覺呈現(xiàn)方式更加精確。這些早期探索構(gòu)成了可視化的開端。

圖1-3 三角測(cè)量法

2.17世紀(jì):幾何學(xué)與坐標(biāo)系

到了17世紀(jì),最重要的問題之一是與時(shí)間、距離和空間的物理測(cè)量有關(guān)的問題。在使用測(cè)量和估計(jì)誤差理論以及概率論等理論解決這些問題的同時(shí),誕生并發(fā)展了幾何學(xué)和坐標(biāo)系等可視化方法。

3.18世紀(jì):新的圖形形式

到了18世紀(jì),隨著統(tǒng)計(jì)理論的發(fā)展,收集重要數(shù)據(jù)的基礎(chǔ)逐漸完善以及圖形表示思想的逐漸確立,制圖者開始嘗試在地圖上顯示新的數(shù)據(jù)表示,等高線和等值線由此被發(fā)明。物理量的專題映射也在此階段建立完成。到了18世紀(jì)末,首次地質(zhì)、經(jīng)濟(jì)和醫(yī)學(xué)數(shù)據(jù)專題制圖嘗試成功。

4.19世紀(jì)上半葉:現(xiàn)代圖形的開端

隨著之前設(shè)計(jì)和技術(shù)創(chuàng)新的發(fā)展,到了19世紀(jì)上半葉,統(tǒng)計(jì)圖形和專題制圖出現(xiàn)了爆炸式增長(zhǎng)。在統(tǒng)計(jì)圖形學(xué)中,條形圖、柱形圖、線形圖和時(shí)間序列圖、等高線圖、散點(diǎn)圖等所有的現(xiàn)代數(shù)據(jù)顯示形式都被發(fā)明了。專題地圖學(xué)中的地圖是從單一地圖發(fā)展而來的,綜合地圖集則描繪了經(jīng)濟(jì)、社會(huì)、道德等各種數(shù)據(jù)主題,并介紹了各樣新穎的象征形式。在此期間,描述和分析天氣、潮汐等自然和物理現(xiàn)象的圖形也開始出現(xiàn)在科學(xué)出版物上,圖1-4為1833年出版的利茲霍亂地圖。

圖1-4 1833年出版的利茲霍亂地圖

5.19世紀(jì)下半葉:統(tǒng)計(jì)圖形的黃金時(shí)代

到了19世紀(jì)下半葉,可視化技術(shù)發(fā)展的所有條件都已經(jīng)建立起來了。人們認(rèn)識(shí)到數(shù)字信息對(duì)社會(huì)規(guī)劃、工業(yè)化、商業(yè)和運(yùn)輸?shù)闹匾裕瑲W洲各國紛紛設(shè)立國家統(tǒng)計(jì)局。為理解大量數(shù)據(jù),高斯和拉普拉斯開創(chuàng)了統(tǒng)計(jì)理論,并由格雷和奎特萊特?cái)U(kuò)展到社會(huì)領(lǐng)域。19世紀(jì)下半葉可謂可視化發(fā)展的黃金時(shí)代。

6.20世紀(jì)上半葉:現(xiàn)代黑暗時(shí)代

到了20世紀(jì)初,圖形創(chuàng)新很少;20世紀(jì)30年代中期,社會(huì)科學(xué)中量化和統(tǒng)計(jì)模型的興起取代了19世紀(jì)末人們對(duì)可視化的熱情。對(duì)可視化的發(fā)展來說,這是一個(gè)必要的休眠期、應(yīng)用期和普及期,而不是創(chuàng)新期。在這一時(shí)期,統(tǒng)計(jì)圖形成為主流,圖解法也進(jìn)入了英語教科書。

7.20世紀(jì)下半葉:新的曙光

隨著計(jì)算機(jī)科學(xué)和技術(shù)的發(fā)展,數(shù)據(jù)可視化具有了新的活力,人們可以利用計(jì)算機(jī)技術(shù)在電腦屏幕上繪制出各種圖形及圖表,可視化技術(shù)開啟了全新的發(fā)展階段。20世紀(jì)70年代至80年代,人們開始嘗試將靜態(tài)數(shù)據(jù)用多維定量數(shù)據(jù)的靜態(tài)圖來表示;20世紀(jì)80年代中期,動(dòng)態(tài)統(tǒng)計(jì)圖表開始出現(xiàn)。20世紀(jì)末,靜態(tài)統(tǒng)計(jì)圖和動(dòng)態(tài)統(tǒng)計(jì)圖開始逐漸結(jié)合,試圖實(shí)現(xiàn)動(dòng)態(tài)的交互式可視化。

8.21世紀(jì):數(shù)據(jù)可視化

21世紀(jì),隨著現(xiàn)代互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,人們開始將可視化技術(shù)和數(shù)據(jù)挖掘、計(jì)算機(jī)圖形學(xué)等結(jié)合起來,借助HTML5、JavaScript等技術(shù)動(dòng)態(tài)地、可交互地展示高維數(shù)據(jù),輔助用戶將紛繁復(fù)雜甚至不完整的數(shù)據(jù)進(jìn)行數(shù)據(jù)可視化,以便快速挖掘出有用的信息、做出決策,并形成了可視分析學(xué)這門新的學(xué)科。

主站蜘蛛池模板: 合作市| 杂多县| 界首市| 文山县| 莎车县| 崇文区| 新竹市| 灵宝市| 云浮市| 登封市| 绥化市| 车险| 乐都县| 喀什市| 华宁县| 南充市| 蓬溪县| 清镇市| 甘肃省| 瓮安县| 贵定县| 辉县市| 瓦房店市| 郎溪县| 互助| 贵阳市| 元谋县| 常熟市| 亚东县| 民勤县| 古丈县| 遂昌县| 霍山县| 新竹县| 元氏县| 吉林市| 锦州市| 遂川县| 梓潼县| 荥经县| 娄底市|