- 智能圖像處理與分析識別
- 宋麗梅 王紅一主編
- 851字
- 2023-11-07 16:38:43
1.5 數(shù)字圖像處理的機(jī)遇與挑戰(zhàn)
進(jìn)入21世紀(jì),隨著計算機(jī)技術(shù)的迅猛發(fā)展和相關(guān)理論的不斷完善,數(shù)字圖像處理技術(shù)在許多應(yīng)用領(lǐng)域受到廣泛重視,并取得了重大的開拓性成就。在人工智能和思維科學(xué)的大背景下,圖像處理正向著高速化、高分辨率化、立體化、多媒體化、智能化和標(biāo)準(zhǔn)化的方向發(fā)展,涌現(xiàn)了眾多的圖像處理理論和算法。但與人類識別圖像的能力相比,計算機(jī)對圖像的處理能力尚存在很多不足。
在討論圖像處理面臨的嚴(yán)峻挑戰(zhàn)的主要原因之前,有必要先解釋一下機(jī)器是如何“看到”圖像的。當(dāng)我們?nèi)祟愑^看圖像時,會感知物體、人物或景觀。而當(dāng)機(jī)器“查看”圖像時,它們看到的只是代表單個像素的數(shù)字。也就是說數(shù)字圖像處理的全部就是以某種方式處理這些數(shù)字。
圖像處理并不是一件容易的事情,可以總結(jié)為以下幾方面原因:
1)信息損失。數(shù)字化過程中信息損失是造成計算機(jī)視覺難度的一個重要因素。圖像是從3D世界投影到2D平面上獲取到的信息,在此過程中會丟失大量信息,例如深度信息。
2)數(shù)據(jù)量大。圖像的數(shù)據(jù)量是巨大的,視頻數(shù)據(jù)則會更大,雖然技術(shù)上的進(jìn)步使得處理器和內(nèi)存不足問題得到了良好的解決,但是數(shù)據(jù)處理的效率仍有待提高。
3)伴隨噪聲。任何測量過程中都存在噪聲,圖像的數(shù)字化過程中的噪聲也不可避免。這就需要使用相應(yīng)的數(shù)學(xué)工具和方法對含有噪聲的視覺感知結(jié)果進(jìn)行分析和處理,從而較好地復(fù)原真實(shí)視覺數(shù)據(jù)。
4)圖像理解困難。人類可以對圖像內(nèi)容進(jìn)行理解和解釋,但對于機(jī)器來說,這絕對是計算機(jī)視覺環(huán)境中最難處理的事情。當(dāng)人類觀看圖像時,會用積累的知識和記憶(稱為先驗(yàn)知識)來分析它。但機(jī)器沒有這種能力,它們不了解人類的世界,不了解其中固有的復(fù)雜性,以及人類在數(shù)千年的文明中創(chuàng)造的眾多工具、商品、設(shè)備等。賦予機(jī)器對圖像的理解能力,是圖像處理、機(jī)器視覺與人工智能學(xué)科研究者們不斷努力的目標(biāo)。
總之,圖像處理領(lǐng)域還存在很多難題亟待解決,既是機(jī)遇也是挑戰(zhàn)。在研究圖像處理技術(shù)時,可以加強(qiáng)對視覺特性、心理學(xué)特性等方面的進(jìn)一步研究,借鑒其他學(xué)科的理論、技術(shù)和方法,完善圖像處理的理論和技術(shù)體系。
- 設(shè)計色彩
- 勞動關(guān)系與勞動法模擬試題集
- 普通心理學(xué)
- 高光譜遙感圖像特征提取與分類
- 新媒體環(huán)境下青少年網(wǎng)絡(luò)使用情況調(diào)查及引導(dǎo)對策研究報告
- 多維度商務(wù)英語思辨會話=Multi-dimensional & Critical Conversation in Business English
- 校園心理劇團(tuán)體心理輔導(dǎo)與咨詢
- 中級財務(wù)會計
- 汪戎《管理學(xué)》筆記和課后習(xí)題詳解
- 大學(xué)生必知的場景語言技巧
- 土地關(guān)系與農(nóng)村社會
- 影視動畫后期非線性編輯(Premiere Pro CC)
- 汽車運(yùn)用工程(第2版)
- 行業(yè)會計比較模擬實(shí)訓(xùn)
- 汽車設(shè)計