- 數(shù)字媒體應用教程
- 沈大林 萬忠
- 3235字
- 2019-11-04 10:32:47
1.1.3 數(shù)字媒體的關鍵技術
數(shù)字媒體技術是一門多學科的綜合技術,涉及許多相關技術,簡介如下。
1.數(shù)據(jù)壓縮技術
數(shù)據(jù)壓縮技術包括算法和實現(xiàn)視頻及音頻壓縮的國際標準、專用芯片和其他硬件與軟件等。數(shù)據(jù)壓縮技術的發(fā)展,使得實時傳輸大容量的圖像、音頻和視頻數(shù)據(jù)成為可能。一幅640×480像素分辨率的彩色圖像,數(shù)據(jù)量約為7.37Mbit/幀以上。例如,(640×480)像素×3基色/像素×8bit/基色=7.3728Mbit),如果是視頻(運動圖像),要以每秒30幀的速度播放,則視頻信號的傳輸速度為221.2Mbit/s,存放于650MB光盤中只能播出23s。對于音頻信號,若達到電話聲音質量,每秒采樣數(shù)據(jù)8bit/樣本;若達到高保真(Hi-Fi)立體聲(如CD唱盤),則每秒采樣數(shù)據(jù)44.1KB,若量化為16bit兩通道立體聲,則650MB光盤只能存放1h的數(shù)據(jù)(44.1kHz×16bit/樣本×2聲道=1.4Mbit/s),其傳輸速率為1.4Mbit/s。多媒體數(shù)字信號因其不僅數(shù)據(jù)量大而需要較大的,而且要求存儲空間大和傳輸速度快,因此,視頻、音頻信號的數(shù)據(jù)壓縮與解壓縮技術是多媒體的關鍵技術。壓縮與解壓縮技術的關鍵是圖像信息的壓縮,特別是視頻圖像信息的壓縮。
壓縮可分為兩種類型:一種是不失真的壓縮,一種是失真的壓縮。不失真的壓縮固然受到歡迎,但其研究應用難度較大。根據(jù)“特征選取”學說,一種好的特征選取方法有可能比一般的數(shù)據(jù)壓縮方法更加適用。失真的壓縮技術正是基于這一認識,以丟棄一部分信息為代價,保留最主要的最本質的信息。
數(shù)據(jù)的壓縮可以看成是一種變換,數(shù)據(jù)的解壓縮則被認為是一種反變換,這種變換的方法,又稱為編碼技術。數(shù)據(jù)編碼技術大致經(jīng)歷了兩個發(fā)展階段:1977—1984年為基礎理論研究階段;1985—1995年為實用化階段。目前最流行的關于壓縮編碼的國際標準有彩色靜止圖像的壓縮方式JPEG、彩色運動圖像的壓縮方式MPEG及電視電話/會議電視編碼方式H.261。
(1)JPEG標準:JPEG標準主要適用于壓縮靜止的彩色和單色多灰度的圖像,一般用于彩色打印機、灰度和彩色掃描儀、部分型號的傳真機。JPEG標準分為基本壓縮系統(tǒng)、擴展系統(tǒng)(在基本系統(tǒng)上增加了算術編碼、漸進構造等特性)和分層的漸進方法(通過濾波建立了一個分辨率逐漸降低的圖像序列)3個系統(tǒng)。JPEG標準采用了混合編碼方法。其基礎是離散余弦變換(DCT)和霍夫曼變換,這是一種失真的有損壓縮算法,即圖像質量和壓縮比有關,壓縮比越大,圖像質量損失越多。由于JPEG算法中要進行大量計算,因此需要配備專用的快速JPEG信號處理器,以減輕計算機CPU的負擔。
(2)MPEG標準:MPEG英文原意為“運動圖像專家小組”。由于ISO/IEC11172壓縮編程標準是由該運動圖像專家小組于1990年制定的,因此將該標準稱為MPEG標準。該標準又分為3個,其中MPEG-1用于普通電視,MPEG-2用于數(shù)字電視,MPEG-4為多媒體應用標準。MPEG標準具體包含MPEG視頻、MPEG音頻和MPEG系統(tǒng)(視頻與音頻同步)3部分。
MPEG視頻是標準的核心部分。它采用幀內和幀間相結合的壓縮方法,以離散余弦變換(DCT)和運動補償兩項技術為基礎,最終獲得了100∶1的數(shù)據(jù)壓縮率(MPEG-1)。
MPEG音頻壓縮算法則根據(jù)人耳的屏蔽濾波功能,利用“某些頻率的音響在重放其他頻率的音頻時便聽不到”這樣一個特性,將人耳完全或基本上聽不到的音頻信號壓縮,使音頻信號的壓縮比達到8∶1或更多,同時音質逼真,可以與CD唱片媲美。
按照MPEG標準,MPEG數(shù)據(jù)流包含系統(tǒng)層和壓縮層數(shù)據(jù)。系統(tǒng)層含有定時信號、圖像和聲音的同步信息、多路分配等信息,壓縮層包含經(jīng)壓縮后的實際的圖像和聲音數(shù)據(jù),該數(shù)據(jù)流傳輸速率為1.5Mbit/s(MPEG-1)。
在實用化階段,壓縮技術在很多方面有了新的進展;1989年,工程師們制出了第一塊具有壓縮技術的大規(guī)模集成電路芯片。
2.數(shù)據(jù)媒體存儲技術
數(shù)據(jù)媒體存儲技術包括多媒體數(shù)據(jù)庫技術和海量數(shù)據(jù)存儲技術。多媒體數(shù)據(jù)庫的特點是數(shù)據(jù)類型復雜、信息量大,光盤、U盤、移動硬盤和云存儲技術的發(fā)展,大大帶動了多媒體數(shù)據(jù)庫技術及大容量數(shù)據(jù)存儲技術的進步。此外,數(shù)據(jù)媒體中的聲音和視頻圖像都是與時間有關的信息,在很多場合都要求實時處理(壓縮、傳輸、解壓縮);同時,多媒體數(shù)據(jù)的查詢、編輯、顯示和演播,都向多媒體數(shù)據(jù)庫技術提出了更高的要求。
3.專用芯片技術
大規(guī)模集成電路的發(fā)展,使得多媒體計算機的運算速度和內存容量大幅度提高。
多媒體計算機專用芯片一般分為兩種類型:一種是具有固定功能的芯片;一種是可編程的處理器。具有固定功能的芯片,主要用于圖像數(shù)據(jù)的壓縮處理,主要的半導體廠商有C-cube等公司。可編程的處理器不僅需要快速/實時地完成視頻和音頻信息的壓縮和解壓縮,還要完成圖像的特技效果(如淡入淡出、馬賽克、改變比例等)、圖像處理(圖形的生成和繪制)、音頻信息處理(濾波和抑制噪聲)等項功能。目前,主要生產(chǎn)廠商有Intel公司等。
4.輸入/輸出技術
多媒體輸入/輸出技術涉及各種媒體外設以及相關的接口技術,包括媒體轉換技術、識別技術、媒體理解技術和綜合技術。
(1)媒體轉換技術:是指改變媒體的表現(xiàn)形式,如當前廣泛使用的視頻卡、音頻卡都屬于媒體轉換設備。
(2)媒體識別技術:是對信息進行一對一的映像過程。例如,語音識別是將語音映像為一串字、詞或句子;觸摸屏是根據(jù)觸摸屏上的位置識別其操作要求。
(3)媒體理解技術:是對信息進行更進一步的分析處理和理解信息內容,如自然語言理解、圖像理解、模式識別等。
(4)媒體綜合技術:是把低維信息表示映像成高維模式空間的過程,例如語音合成器就可以把語音的內部表示綜合為聲音輸出。
5.云計算和云存儲技術
云計算(Cloud Computing)是分布式計算技術的一種,它的基本概念是通過互聯(lián)網(wǎng)將龐大的計算處理程序自動分拆成無數(shù)個較小的子程序,再交由多部服務器組成的龐大系統(tǒng)通過搜尋、分析計算之后將處理結果返回給用戶。透過這項技術,網(wǎng)絡服務提供者可以在數(shù)秒之內處理數(shù)以千萬計以上的信息,達到和超級計算機相同效能的服務。
最簡單的云計算技術在網(wǎng)絡服務中已經(jīng)隨處可見,例如搜尋引擎、網(wǎng)絡信箱等,使用者只要輸入簡單的指令,就可以獲得大量信息。未來的手機、GPS等設備都可以通過云計算技術來發(fā)展出更多的應用服務。
云存儲是在云計算概念上的延伸和發(fā)展來的一個新的概念,是指通過集群應用、網(wǎng)格技術或分布式文件系統(tǒng)等功能,將網(wǎng)絡中大量各種不同類型的存儲設備通過應用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和訪問功能的一個系統(tǒng)。當云計算系統(tǒng)運算和處理的核心是大量數(shù)據(jù)的存儲和管理時,云計算系統(tǒng)中就需要配置大量的存儲設備,那么云計算系統(tǒng)就轉變成為一個云存儲系統(tǒng),所以云存儲是一個以數(shù)據(jù)存儲和管理為核心的云計算系統(tǒng)。
6.網(wǎng)絡和移動通信技術
(1)網(wǎng)絡技術:因特網(wǎng)(Internet)是一個通過網(wǎng)絡設備把世界各國的計算機相互連接在一起的計算機網(wǎng)絡,人們將其看成是信息高速公路的起點。人們可以通過連入因特網(wǎng),盡情享用其提供的服務和信息資源。因特網(wǎng)上已經(jīng)開發(fā)了很多應用,歸納起來可分成兩類:一類是以文本為主的數(shù)據(jù)通信,包括文件傳輸、電子郵件、遠程登錄、網(wǎng)絡新聞和電子商務等;另一類是以圖像、聲音和電視為主的通信,通常把上述兩類內容稱為多媒體網(wǎng)絡技術。
萬維網(wǎng)(WWW)亦稱Web,是在因特網(wǎng)上運行的全球性分布式信息系統(tǒng)。它的主要特點是將因特網(wǎng)上的現(xiàn)有資源全部通過超鏈接互連起來,用戶能夠在因特網(wǎng)上查找到已經(jīng)建立的WWW服務器的一切站點提供的超文本、超媒體資源文檔,這些文檔中包括文本、圖像、聲音、動畫、視頻等數(shù)據(jù)類型。
(2)移動通信技術:移動通信是移動體之間或移動體與固定體之間的通信,通信雙方有一方或兩方處于運動中的通信,移動體可以是人,也可以是汽車、火車、輪船等在移動狀態(tài)中的物體。采用的頻段遍及低頻、中頻、高頻、甚高頻和特高頻。目前的移動通信已經(jīng)發(fā)展到第三代移動通信系統(tǒng)(3G)和第四代移動通信系統(tǒng)(4G)。第三代移動通信系統(tǒng)最基本的特征是智能信號處理技術,支持話音和多媒體數(shù)據(jù)通信,它可以提供前兩代產(chǎn)品不能提供的各種寬帶信息業(yè)務,如高速數(shù)據(jù)、慢速圖像與電視圖像等。第四代移動通信系統(tǒng)是最新的移動通信系統(tǒng),它集3G與WLAN于一體,能夠傳輸高質量視頻圖像,圖像的質量與高清晰度電視不相上下;該系統(tǒng)能夠以100Mbit/s的速度下載,比撥號上網(wǎng)快2000倍,上傳的速度也能達到20Mbit/s,并幾乎能滿足所有用戶對于無線服務的要求。
- Getting Started with React
- 小創(chuàng)客玩轉圖形化編程
- PostgreSQL for Data Architects
- Java加密與解密的藝術(第2版)
- Serverless架構
- AppInventor實踐教程:Android智能應用開發(fā)前傳
- 編程菜鳥學Python數(shù)據(jù)分析
- 微服務從小白到專家:Spring Cloud和Kubernetes實戰(zhàn)
- Swift語言實戰(zhàn)晉級
- PHP與MySQL權威指南
- Python期貨量化交易實戰(zhàn)
- 玩轉.NET Micro Framework移植:基于STM32F10x處理器
- MongoDB Cookbook(Second Edition)
- Learning iOS Penetration Testing
- Java性能權威指南