- 大數據可視分析方法與應用
- 陳為 巫英才 鮑虎軍等
- 643字
- 2020-05-07 14:46:14
2.1 多媒體數據可視分析簡介
多媒體內容一般包括文本、圖像、視頻和音頻等。可視化領域中對多媒體數據的分析主要集中在文本和圖像兩個方面。文本可視化工作旨在設計出直觀的文本可視表征形式以輔助人們對大規模文本數據集的分析。為適應不同的分析任務,文本可視化有多種多樣的可視化布局,包括基于云的可視化(cloud-based visualization)、基于流的可視化(flow-based visualization)、基于樹狀結構的可視化(tree-based visualization)和基于投影的可視化(projection-based visualization)。以基于云的可視化為例,字云(word cloud)是其中一項具有代表性的工作,主要用于對文本內容進行概括性的分析。在面對海量的文本數據時,人們往往難以快速地了解其中包含的主要內容。針對這個問題,可視化學者們創造出了字云,通過把文本數據中的關鍵詞可視化出來,并用單詞的大小編碼單詞的出現頻率,為用戶提供了一個直觀的概述和總結,加速了對文本數據的了解和概括。
圖像數據的可視化工作旨在研究如何利用可視化的直觀性和有效性幫助用戶從包含成千上萬張圖片的數據集中挖掘出有趣的圖片和特征。目前主要采用的可視化形式包括散點圖(scatter plot)、樹狀圖(treemaps)和節點鏈接圖(node-link diagram)。以散點圖為例,Yang等人根據圖像向量化的表征,使用了多維尺度分析方法(multidimensional scaling)將高維的圖像投影到二維平面上,通過散點圖將大量的圖片數據以有組織的形式展現給用戶,并將自動化算法提取出的圖像關鍵詞作為文本注釋用以指導用戶的瀏覽和搜索操作。這個工作成功地利用了散點圖的直觀性,并結合自動化圖像處理算法促進了用戶對圖像數據的分析和理解。
2.2節將從文本數據可視化和圖像數據可視化兩方面進行介紹。
- 嵌入式系統應用
- WOW!Illustrator CS6完全自學寶典
- CSS全程指南
- Microsoft System Center Confi guration Manager
- Building a BeagleBone Black Super Cluster
- Salesforce Advanced Administrator Certification Guide
- FANUC工業機器人配置與編程技術
- Hands-On SAS for Data Analysis
- Building Google Cloud Platform Solutions
- 人工智能:智能人機交互
- 中老年人學電腦與上網
- 計算機應用基礎學習指導與練習(Windows XP+Office 2003)
- Flash CS3動畫制作
- 服務器配置與應用(Windows Server 2008 R2)
- 中老年人學數碼照片后期處理