官术网_书友最值得收藏!

第1篇 大數據基本定義

第1章 可視分析基礎與框架

1.1 可視化簡介

人眼作為高帶寬的感覺處理器,擁有極強的模式識別和信號處理能力。人類對視覺符號的感知速度比數字和文本高多個數量級??梢暬╲isualization)利用人類視覺感知能力,對數據進行交互式表達,以增強對數據的認知??梢暬膽媚康牟⒎莾H僅是繪制可視化結果本身,而是使用可視化結果讓人洞悉某個物體或事物的規律,包含發現、決策、解釋、分析、探索和學習等。因此可視化可以當作一種工具,來提高人們完成某些任務的效率。

可視化的作用可以體現在多個方面,包括信息記錄、支持信息的推理和分析,以及信息傳播與協同。

①信息記錄:是可視化最初也是最重要的作用,可視化結果通??芍苯幼鳛閳D像結果保存下來。

②信息的推理和分析:在可視化結果中,信息以視覺方式呈現給用戶。這種直觀的信息感知機制直接擴充了人腦的記憶,極大降低了數據理解和分析的復雜度。在包含多源異構的上下文信息時,可視化也可以通過清晰展示證據的方式,幫助用戶進行數據關聯、理解和推理。

③信息傳播與協同:俗語說“百聞不如一見”“一圖勝千言”。除了真實的視頻和照片之外,目前可視化作為一種傳達數據中內涵的復雜信息的方式,廣泛存在于各種面向大眾的媒體中,例如基本統計圖表、信息圖或是交互式可視化系統。在達到信息共享的同時,可視化也支持不同用戶間的信息共享、共同論證、協作處理和修正等功能。最著名的例子有Fold.It在線網絡游戲等。

從歷史發展角度看,可視化大致經歷了以下幾個大階段。

①17世紀之前:人類使用繪畫和手工制品等形式制作可視化作品,代表方式有幾何圖表和地圖等。

②17世紀:隨著物理理論和測量設備的發展,制圖學理論也隨之發展壯大,基于真實測量數據的可視化方法也開始出現。

③18世紀:抽象概念圖在地理、經濟、醫學等領域的發明和應用,使得當時的圖表設計開始逐漸向現代的可視化形式靠近。18世紀是統計圖形學的繁榮時期,包括折線圖、柱狀圖、餅圖等在內的基礎圖表均發明在這一時期。

④19世紀:隨著基礎圖表在內的可視化工具的發明和完善,統計數據可視化工具逐漸成為數據表達的基礎方式之一。同時,在社會學、地理學、醫學等學科的統計數據逐漸增多,統計圖表開始大量應用于各學科的日常工作之中。

⑤20世紀:20世紀前50年是可視化領域創新發展的低潮期,但統計圖形除了在專業學科內得到應用外,在政府、商業等日常生活領域也開始得到普及。人們開始意識到統計圖表能夠為學科發展、工程實踐和日常事務領域帶來發現新知識、洞悉數據內涵的機會。自20世紀60年代開始,Jacques Bertin等現代統計圖形和可視化領域的奠基人進行了創造性的工作,加上計算機的出現,開啟了可視化迅猛發展的時代,如70年代的多維數據可視化方法、John Tukey提出的探索式數據分析基本框架等。自80年代開始,隨著個人計算機和圖形交互界面的發展,交互式可視化開始成為可視化方向的主流。1987年美國首次召開了科學可視化方面的專業會議,會議報告正式命名并定義了“科學可視化”這一術語,認為可視化有助于統一計算機圖形學、圖像處理、計算機視覺、計算機輔助設計、信號處理和人機界面中的相關問題。除科學可視化外,自90年代開始的信息可視化也逐漸獨立成為與科學可視化并列的研究學科。

信息可視化主要面向抽象、結構或非結構化的數據集合,如表格數據、文本、層次結構數據、圖結構數據、多媒體數據(圖像、視頻)等?,F代信息可視化方法發展自統計圖表,同時與圖形學、視覺設計等學科相關,表現形式主要為二維平面展示。信息可視化的核心資源限制因素包括三方面:計算機的數據處理能力、顯示區域和人類的認知能力。由于在不同場景下這三種資源的分配均有不同,因此信息可視化的核心挑戰可描述為:如何在給定的數據處理能力、顯示區域和認知資源下,設計出能夠支持某種分析任務的最優的可視化和交互方案。為了解決這一挑戰性問題,近幾十年來很多學者致力于提出信息可視化的設計基本框架,其中最具代表性的有流水線模型和Tamara Munzner提出的“What-Why-How”分析框架。

主站蜘蛛池模板: 台安县| 商河县| 电白县| 永州市| 遂宁市| 沂南县| 马公市| 高碑店市| 库尔勒市| 巴里| 安平县| 隆子县| 通榆县| 湾仔区| 安徽省| 聂荣县| 利津县| 阿图什市| 南木林县| 昭平县| 大宁县| 中阳县| 柳河县| 枣庄市| 汝州市| 雅安市| 年辖:市辖区| 永登县| 卢龙县| 靖宇县| 长子县| 叶城县| 客服| 巴南区| 荣成市| 卢氏县| 蓬安县| 宜昌市| 崇仁县| 娄烦县| 武清区|