官术网_书友最值得收藏!

1.4 大數(shù)據(jù)可視化

數(shù)據(jù)可視化是關(guān)于數(shù)據(jù)之視覺表現(xiàn)形式的研究;其中,這種數(shù)據(jù)的視覺表現(xiàn)形式被定義為一種以某種概要形式提取出來的信息,包括相應(yīng)信息單位的各種屬性和變量。本節(jié)將對數(shù)據(jù)可視化的概念、數(shù)據(jù)可視化方法、數(shù)據(jù)可視化分類等方面做簡要介紹。

1.4.1 什么是數(shù)據(jù)可視化

數(shù)據(jù)可視化旨在借助于圖形化手段,清晰有效地傳達與溝通信息。但是這不意味著,數(shù)據(jù)可視化就一定因為要實現(xiàn)其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端復(fù)雜。為了有效地傳達思想,美學形式與功能需要齊頭并進,通過直觀地傳達關(guān)鍵的方面與特征,從而實現(xiàn)對于相當稀疏而又復(fù)雜的數(shù)據(jù)集的深入洞察。然而,設(shè)計人員往往并不能很好地把握設(shè)計與功能之間的平衡,從而創(chuàng)造出華而不實的數(shù)據(jù)可視化形式,無法達到其主要目的,也就是傳達與溝通信息。

數(shù)據(jù)可視化與信息圖形、信息可視化、科學可視化以及統(tǒng)計圖形密切相關(guān)。當前,在研究、教學和開發(fā)領(lǐng)域,數(shù)據(jù)可視化乃是一個極為活躍而又關(guān)鍵的方面?!皵?shù)據(jù)可視化”這條術(shù)語實現(xiàn)了成熟的科學可視化領(lǐng)域與較年輕的信息可視化領(lǐng)域的統(tǒng)一。

1.4.2 數(shù)據(jù)可視化的工具與方法

1.常見的數(shù)據(jù)可視化工具

(1)Google Charts

谷歌的產(chǎn)品在數(shù)據(jù)行業(yè)是眾所周知的,谷歌圖表也是一個容易上手的工具,特別是對于初次使用的用戶。

例1-1Google Charts實例。

在Google Charts中輸入如下代碼:

運行以上程序代碼后,得到如圖1-3所示的圖形。

圖1-3 Geochat生成的圖形報表

(2)Datawrapper

這是一個在線工具,只要在線上傳資料和數(shù)據(jù),選擇需要的可視化形式,它便可以幫助你創(chuàng)建交互式數(shù)據(jù)可視化。圖1-4為使用Datawrapper生成的可視化圖表。

(3)RAW

RAW的好處包括它擁有大量現(xiàn)成的類型,使用戶可以清晰、便捷地展現(xiàn)信息。整個使用過程相當簡單:從一個電子表格或Web頁面中復(fù)制數(shù)據(jù),然后選擇數(shù)據(jù)可視化類型,最后拖動所要分析的數(shù)據(jù)到預(yù)先定義的分析類別中即可完成數(shù)據(jù)可視化。該平臺是開源的,所以可以提供自定義布局,或者使用其他的設(shè)計,圖1-5為Raw形成的數(shù)據(jù)可視化。

圖1-4 Datawrapper生成的數(shù)據(jù)可視化

圖1-5 Raw的數(shù)據(jù)可視化

(4)Infogram

Infogram是另一款適合新手的工具。它可以鏈接可視化信息圖表與實時大數(shù)據(jù)。即使要在浩如星海的圖表、地圖、視頻等可視化模板中選擇想要的一款,也只需幾個簡單步驟便可實現(xiàn)。圖1-6為Infogram的操作界面。

2.常見的數(shù)據(jù)可視化方法

(1)2Darea

這種方法使用地理空間數(shù)據(jù)可視化技術(shù),往往與事件在某塊特定區(qū)域的位置相關(guān)。2Darea數(shù)據(jù)可視化的一個例子包括點分布圖,該圖可以顯示某個區(qū)域中的犯罪等信息。

(2)Temporal

時間可視化是以線性方式展現(xiàn)數(shù)據(jù)。時間數(shù)據(jù)可視化的關(guān)鍵是有一個開始和一個結(jié)束的時間點。時間可視化的例子可以是一個連接的散點圖,它可以展現(xiàn)諸如某一區(qū)域的溫度等信息。

圖1-6 Infogram的操作界面

(3)Multidimensional

可以通過多維方法將數(shù)據(jù)在兩個或多個維度上展現(xiàn)。這是最常用的方法之一。多維可視化的一個例子是餅圖,它可以展示如政府支出之類的信息。

(4)Hierarchical

層次法被用于呈現(xiàn)多組數(shù)據(jù)。這些數(shù)據(jù)的可視化通常在大群體內(nèi)嵌套小的群體。層次化數(shù)據(jù)可視化的例子可以是一個樹圖,它可以展示語言組團等信息。

(5)Network

數(shù)據(jù)也能以相互關(guān)聯(lián)的網(wǎng)絡(luò)形式被展現(xiàn)。這是另一種展現(xiàn)大量數(shù)據(jù)的常見方法。網(wǎng)絡(luò)數(shù)據(jù)可視化方法的一個例子可以是沖積關(guān)系圖,它可以展示如醫(yī)療行業(yè)的變化等信息。

1.4.3 數(shù)據(jù)可視化的建模

可視化建模(Visual Modeling)是利用圍繞現(xiàn)實想法組織模型的一種思考問題的方法。模型對于了解問題、與項目相關(guān)的每個人(如客戶、行業(yè)專家、分析師、設(shè)計者等)溝通、模仿企業(yè)流程、準備文檔、設(shè)計程序和數(shù)據(jù)庫來說都是有用的。建模促進了對需求的更好的理解、更清晰的設(shè)計、更加容易維護的系統(tǒng)。可視化建模就是以圖形的方式描述所開發(fā)的系統(tǒng)的過程??梢暬T试S你提出一個復(fù)雜問題的必要細節(jié),并過濾不必要的細節(jié)。它也提供了一種從不同的視角觀察被開發(fā)系統(tǒng)的機制。

1.4.4 數(shù)據(jù)可視化分類

數(shù)據(jù)可視化分為:科學可視化、信息可視化、可視分析學這三個主要分支。

(1)科學可視化(Science Visualization)

面向的領(lǐng)域主要是自然科學,如物理、化學、氣象氣候、航空航天、醫(yī)學、生物學等各個學科,這些學科需要對數(shù)據(jù)和模型進行解釋、操作與處理,旨在尋找其中的模式、特點、關(guān)系以及異常情況。

(2)信息可視化(Information Visualization)

信息可視化處理的對象是抽象的、非結(jié)構(gòu)化數(shù)據(jù)集(如文本、圖表、層次結(jié)構(gòu)、地圖、軟件、復(fù)雜系統(tǒng)等)。與科學可視化相比,信息可視化更關(guān)注抽象、高維數(shù)據(jù)。此類數(shù)據(jù)通常不具有空間中位置的屬性,因此要根據(jù)特定數(shù)據(jù)分析的需求,決定數(shù)據(jù)元素在空間中的布局。因為信息可視化的方法與所針對的數(shù)據(jù)類型緊密相關(guān),所以通常按數(shù)據(jù)類型分為如下幾類。

● 時空數(shù)據(jù)可視分析。

● 層次與網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)可視化。

● 文本和跨媒體數(shù)據(jù)可視化。

● 多變量數(shù)據(jù)可視化。

(3)可視分析學(Visual Analytics)

可視分析學,被定義為一門以可視交互界面為基礎(chǔ)的分析推理科學;綜合了圖形學、數(shù)據(jù)挖掘和人機交互等技術(shù),以可視交互界面為通道,將人的感知和認知能力以可視的方式融入數(shù)據(jù)處理過程,形成人腦智能和機器智能優(yōu)勢互補與相互提升,建立螺旋式信息交流與知識提煉途徑,完成有效的分析推理和決策;包含數(shù)據(jù)分析、交互、可視化。

主站蜘蛛池模板: 虞城县| 孝感市| 城步| 宁远县| 台山市| 会理县| 隆德县| 西乌珠穆沁旗| 自治县| 奉节县| 纳雍县| 海南省| 扶沟县| 孝义市| 且末县| 茶陵县| 二连浩特市| 余姚市| 竹北市| 大连市| 汝城县| 吉安县| 河北省| 宝鸡市| 柳河县| 罗平县| 磐安县| 班戈县| 双牌县| 盐边县| 镇巴县| 和静县| 德令哈市| 乌拉特前旗| 阿城市| 新泰市| 巫溪县| 成都市| 冷水江市| 江油市| 漳浦县|