- 圖表會(huì)說(shuō)話:Excel數(shù)據(jù)可視化之美
- (葡)若熱·卡蒙伊斯
- 2056字
- 2021-05-18 16:44:07
抽象概念
如果一幅圖形景觀畫(huà)不包含具有物理形狀的真實(shí)物體,而只包含抽象概念的表征(例如通貨膨脹率或人口密度),那怎樣做才能讓這些概念可見(jiàn)呢?現(xiàn)在答案似乎已經(jīng)很明顯了,但幾個(gè)世紀(jì)以來(lái),將抽象概念與特征隨底層數(shù)據(jù)變化的幾何形狀關(guān)聯(lián)起來(lái)卻并不容易。
我們可以回憶一下在學(xué)校時(shí)學(xué)過(guò)的知識(shí),由維度來(lái)區(qū)分的四種幾何圖元:點(diǎn)(無(wú)維度)、線(一維)、面或平面(二維)、體(三維)。
當(dāng)使用維度數(shù)作為視覺(jué)顯示分類標(biāo)準(zhǔn)時(shí),就可以得到四個(gè)類別:圖表、網(wǎng)絡(luò)圖、地圖,以及一個(gè)特殊的類別——體積可視化。圖 1.6 總結(jié)了它們的主要特點(diǎn) 2。
2換句話說(shuō),表示一個(gè)物體所需的最小維度數(shù)。可以使用面(一張餅圖)或線(條形圖中的一個(gè)長(zhǎng)條),這些都是設(shè)計(jì)選擇,因?yàn)槟闼枰木褪且粋€(gè)點(diǎn)。同樣地,用來(lái)表示網(wǎng)絡(luò)圖的最小單位是線,而點(diǎn)和面可以用作設(shè)計(jì)選擇。
圖 1.6 各種幾何圖元類型與視覺(jué)表征
圖表
圖表(chart)中所使用的基本幾何圖元是點(diǎn),在二維空間中用一對(duì)坐標(biāo)——橫坐標(biāo)()和縱坐標(biāo)(
)來(lái)表示,原點(diǎn)位于左下角(圖 1.7)。坐標(biāo)值向右和向上增加,向左和向下減小。當(dāng)缺少其中一個(gè)坐標(biāo)值(或者具有固定值)時(shí),點(diǎn)就會(huì)沿著相對(duì)的軸分布。當(dāng)使用不同的度量時(shí),需要對(duì)這段描述進(jìn)行相應(yīng)的調(diào)整:在時(shí)間序列(圖 1.8)中,從左往右的時(shí)間點(diǎn)離現(xiàn)在越來(lái)越近。
圖 1.7 圖表是在二維平面上繪制的一組數(shù)據(jù)點(diǎn)
圖 1.8 威廉·普萊費(fèi)爾繪制的折線圖
資料來(lái)源:WikimediaCommons
請(qǐng)注意,圖表(chart)這個(gè)詞有多種含義,可以包括表、地圖、圖形或網(wǎng)絡(luò)圖。圖形(graph)具有更嚴(yán)格的定義,是一個(gè)或多個(gè)變量的視覺(jué)表現(xiàn)形式。盡管圖形的英文可能會(huì)與另一個(gè)數(shù)學(xué)專業(yè)領(lǐng)域——圖論相混淆,但我非常肯定的一點(diǎn)是,真正應(yīng)該使用的詞匯是圖形而不是圖表。可惜的是,30 多年前微軟決定在 Excel 中使用圖表一詞,現(xiàn)在如果叫“Excel 圖形”就會(huì)感覺(jué)有點(diǎn)兒不合適,而必須要說(shuō)“Excel 圖表”。由于本書(shū)的目標(biāo)讀者是 Excel 用戶,因此在本書(shū)中將使用“圖表”一詞,并將其定義為可以從 Excel 圖表庫(kù)中找到或衍生出的視覺(jué)對(duì)象。
更抽象地說(shuō),圖表就是將數(shù)據(jù)表轉(zhuǎn)化為坐標(biāo),然后應(yīng)用設(shè)計(jì)轉(zhuǎn)換使其形象化這一過(guò)程的產(chǎn)品。很快你就會(huì)明白這是什么意思了。
在將數(shù)據(jù)表值轉(zhuǎn)化為數(shù)據(jù)點(diǎn)并在平面上將其畫(huà)出來(lái)之后,就會(huì)生成一個(gè)數(shù)據(jù)點(diǎn)云,從而可以得到數(shù)據(jù)點(diǎn)之間相對(duì)距離的精確表示。這是我們后面所要做的所有事情的基礎(chǔ),因?yàn)楫?dāng)我們看到并比較數(shù)據(jù)點(diǎn)之間的距離或者其到坐標(biāo)軸之間的距離時(shí),就會(huì)開(kāi)始發(fā)生很多事情。怎樣處理這些數(shù)據(jù)點(diǎn)云呢?我們基本上會(huì)通過(guò)一些方式使其可見(jiàn),例如使用線來(lái)將這些點(diǎn)連接起來(lái),生成折線圖等。這些補(bǔ)充圖元對(duì)于閱讀圖表以及圖表的有效性至關(guān)重要。
網(wǎng)絡(luò)圖
線(line)是顯示網(wǎng)絡(luò)圖所用的主要幾何圖元(圖 1.9),它表示了數(shù)據(jù)點(diǎn)之間的連接。我們?nèi)匀恍枰诙S平面上畫(huà)出數(shù)據(jù)點(diǎn),但它們的坐標(biāo)是靈活的,可以改變坐標(biāo)來(lái)更好地表示這種關(guān)系。盡管在網(wǎng)絡(luò)圖可視化過(guò)程中點(diǎn)和線都同樣有意義,但在網(wǎng)格分析中觀察關(guān)系以及發(fā)現(xiàn)有意義的行為(中心、模式、異常值等)是首要目標(biāo)。
圖 1.9 使用 NodeXL 創(chuàng)建的簡(jiǎn)單的網(wǎng)絡(luò)圖
網(wǎng)絡(luò)圖表示法的一個(gè)經(jīng)典案例就是倫敦地鐵圖。其中的地理位置參考信息是模糊的,人們通常使用地鐵站數(shù)而不是公里數(shù)來(lái)衡量距離。
地圖
地圖也可以使用點(diǎn)和線,但它對(duì)于區(qū)域的使用將它與圖表和網(wǎng)絡(luò)圖區(qū)分開(kāi)來(lái)。地圖是視覺(jué)顯示中最豐富多彩的形式,也是我們使用時(shí)間最長(zhǎng)的一種形式(圖 1.10)。
圖 1.10 用點(diǎn)、線和面積繪制的圖:瓦胡島地圖
資料來(lái)源:Open Street Map
體積的可視化
大多數(shù)的可視化是在二維平面(如一張紙或屏幕)上進(jìn)行的。當(dāng)仿真技術(shù)允許對(duì)三維數(shù)據(jù)圖進(jìn)行瀏覽時(shí),可能就會(huì)進(jìn)入一個(gè)現(xiàn)在還沒(méi)有到來(lái)的新時(shí)代。這不僅僅是技術(shù)問(wèn)題,也是知覺(jué)問(wèn)題。在三維空間中,一個(gè)物體可能會(huì)隱藏在另一個(gè)物體之后(遮擋)。人類的知覺(jué)將距離因素考慮進(jìn)來(lái)之后,就不太擅長(zhǎng)比較物體的大小了。比如,某輛車是真的比另一輛更大,還是只因?yàn)榍罢唠x我們更近呢?
我們可以使用仿 3D 技術(shù)。科學(xué)可視化就經(jīng)常使用仿 3D 技術(shù)來(lái)進(jìn)行物理對(duì)象建模。不幸的是,當(dāng)應(yīng)用到抽象概念上時(shí),結(jié)果并不理想。我們所得到的就是很多 3D 可視化,其中的第三個(gè)維度是沒(méi)有意義、無(wú)關(guān)痛癢的,只是裝飾性的。在本書(shū)后面的內(nèi)容中我們還將討論這一點(diǎn)。
因此,我們不會(huì)為三維可視化預(yù)留容量,而是會(huì)為表現(xiàn)真實(shí)世界的對(duì)象或未直接連接到數(shù)據(jù)表的對(duì)象預(yù)留容量。例如,這種表現(xiàn)形式通常出現(xiàn)在報(bào)紙或雜志上,用來(lái)說(shuō)明事故是如何發(fā)生的。不管是單獨(dú)使用還是與其他形式的可視化相結(jié)合,它們的效果都不錯(cuò)。我們通常將其稱為插圖(illustration),但這個(gè)稱呼太籠統(tǒng)了。我更喜歡稱之為體積可視化,因?yàn)樗鼈兠枋隽艘粋€(gè)物理對(duì)象或現(xiàn)實(shí)。
Excel 中的可視化
圖表、網(wǎng)絡(luò)圖、地圖和體積可視化都具有一些共同的可視化特點(diǎn),但它們又各不相同,以至于幾乎不可能將它們結(jié)合在一個(gè)工具中。眾所周知,圖表是像 Excel 這樣的電子表格軟件所提供的主要可視化類型。
在 Excel 中也可以制作基本的網(wǎng)絡(luò)圖和地圖,但這需要做大量的工作,還可能需要購(gòu)買(mǎi)插件。對(duì)于這樣的軟件來(lái)說(shuō),也會(huì)感到很不“自然”,盡管這一點(diǎn)在 Excel 2016 中已經(jīng)開(kāi)始有所改變。這也是我們?cè)诒緯?shū)中專注于圖表的原因,盡管你應(yīng)該知道,圖表只是數(shù)據(jù)可視化所有可能形式中的一種。
- ANSYS 14熱力學(xué)·電磁學(xué)·耦合場(chǎng)分析自學(xué)手冊(cè)
- 架構(gòu)之美
- Photoshop CC摳圖+修圖+調(diào)色+合成+特效標(biāo)準(zhǔn)培訓(xùn)教程(全視頻微課版)
- AutoCAD 2014中文版完全自學(xué)手冊(cè)
- ImageMagick Tricks
- Oracle Siebel CRM 8 User Management: LITE
- PowerPoint 2019從入門(mén)到精通(移動(dòng)學(xué)習(xí)版)
- Windows Phone 7 Silverlight Cookbook
- Photoshop CC入門(mén)與進(jìn)階
- SolidWorks 2019快速自學(xué)寶典
- Photoshop網(wǎng)店美工實(shí)例教程(第2版 全彩微課版)
- Spark Cookbook 中文版
- SolidWorks 2020中文版從入門(mén)到精通
- Photoshop CC入門(mén)與提高
- 剪映真?zhèn)鳎?8招玩轉(zhuǎn)短視頻剪輯