- 基于粒計(jì)算模型的圖像處理
- 郝曉麗
- 1984字
- 2020-04-29 16:26:50
1.6 主要?jiǎng)?chuàng)新
本章從粒計(jì)算的角度出發(fā),提出了粒度格矩陣空間模型,用以模擬粒與粒之間的關(guān)系。該模型集粗糙集、模糊集和商空間理論為一體,重新定義了粒計(jì)算模型。它不僅能對(duì)知識(shí)和信息進(jìn)行不同層次和粗細(xì)程度的粒化,還體現(xiàn)了粒化后粒與粒之間的關(guān)系,從而更好地挖掘內(nèi)在知識(shí)。在解決問題時(shí),可以根據(jù)具體的情況,利用粒度格矩陣空間模型中粒與粒之間的空間結(jié)構(gòu),實(shí)現(xiàn)不同粒和粒層之間的跳躍和往返,從而提供了一種知識(shí)發(fā)現(xiàn)和描述的新方法。該模型在后續(xù)的章節(jié)中充分證明了其在知識(shí)發(fā)現(xiàn)、聚類、圖像分割、視頻處理等領(lǐng)域得到了有效的應(yīng)用。
本書的主要?jiǎng)?chuàng)新點(diǎn)如下。
①基于商空間理論、粗糙集方法及模糊集理論等理論基礎(chǔ),提出了新的粒計(jì)算模型,即粒度格矩陣空間模型。該模型不僅延承了粗糙集和商空間的“等價(jià)類”和“商集”等基于劃分的概念,還吸收了模糊集處理不精確問題的方法,同樣具有在模糊空間下處理問題的能力。該模型的提出架起了關(guān)系、粒、矩陣?yán)碚撘约皥D論之間的橋梁,為模糊集、粗糙集和商空間等理論的統(tǒng)一提供了簡(jiǎn)單可行的算法模型。
②提出了基于新模型的完備和不完備信息系統(tǒng)的知識(shí)發(fā)現(xiàn)算法。該算法分別以完備和不完備信息系統(tǒng)為研究對(duì)象,將常規(guī)的知識(shí)約簡(jiǎn)轉(zhuǎn)化為矩陣的數(shù)值運(yùn)算過程,提供了一種有別于傳統(tǒng)方法的新的運(yùn)算規(guī)則,該運(yùn)算途徑有利于對(duì)復(fù)雜的對(duì)象進(jìn)行處理,如聚類問題和圖像分割問題。通過舉例證明了該算法和現(xiàn)有的幾種常規(guī)知識(shí)約簡(jiǎn)算法的等價(jià)性。
③提出了基于新模型的動(dòng)態(tài)聚類算法。該算法針對(duì)不同性質(zhì)的樣本點(diǎn),采用“動(dòng)態(tài)粒度”的思想對(duì)其進(jìn)行層次聚類。該算法是基于新模型的知識(shí)發(fā)現(xiàn)算法在聚類問題上的應(yīng)用,它從應(yīng)用的角度驗(yàn)證了新模型的可行性和有效性。
④提出了基于新模型的圖像分割算法。該算法基于圖像分割問題與粒度劃分的統(tǒng)一性,將圖像轉(zhuǎn)化為具有分層結(jié)構(gòu)的知識(shí)體系,構(gòu)造了多個(gè)單元粒度層,通過各單元粒度層分割的粒度合成取得最終的分割效果。實(shí)驗(yàn)證明,該算法在邊緣細(xì)化的處理上有明顯的效果。
⑤提出了融合粒空間的多特征顯著區(qū)域檢測(cè)方法。借鑒矩形粒對(duì)比顯著圖有效得到顯著目標(biāo)的位置和邊緣信息,而球形粒對(duì)比顯著圖有著更為完整的紋理和內(nèi)容信息,以矩形粒對(duì)比顯著圖為基準(zhǔn),與球形粒相融合,檢測(cè)圖像的顯著區(qū)域,該方法計(jì)算量小、用時(shí)短,準(zhǔn)確率和查全率均高于現(xiàn)存算法。
⑥提出了一種基于多粒度特征融合的自適應(yīng)雙閾值鏡頭檢測(cè)算法。通過選取HSV顏色粒度特征和LBP紋理粒度特征作為視頻幀的主要特征,既描述了視頻圖像的全局內(nèi)容,又充分利用了圖像的局部細(xì)節(jié)信息,并通過權(quán)值將2個(gè)特征粒度融合為統(tǒng)一粒度空間來計(jì)算幀間差,運(yùn)用自適應(yīng)設(shè)定的閾值,更好地區(qū)別突變鏡頭和漸變鏡頭。
⑦提出了一種基于CUDA模型的粒信息熵的關(guān)鍵幀提取算法。利用幀粒互信息熵提取圖像幀特征,并運(yùn)用SUSAN算子完成幀粒特征的邊緣匹配,結(jié)合CPU+GPU并行編碼的方式加速計(jì)算過程,從而縮短提取關(guān)鍵幀所用的時(shí)間開銷。
⑧提出了基于DCT與NCIE的關(guān)鍵幀多級(jí)提取方法。通過將視頻幀從像素域轉(zhuǎn)換到頻率域,采用DCT算法對(duì)視頻幀提取相關(guān)系數(shù)作為圖像特征;再將鏡頭類型區(qū)分為動(dòng)態(tài)鏡頭和靜態(tài)鏡頭。針對(duì)靜態(tài)鏡頭,提取中間一幀作為關(guān)鍵幀;針對(duì)動(dòng)態(tài)鏡頭,采用非線性相關(guān)信息熵(NCIE)的度量方法對(duì)鏡頭幀進(jìn)行相似性度量,并進(jìn)一步細(xì)分成若干子鏡頭,然后從子鏡頭中選擇最接近平均信息熵的一幀作為關(guān)鍵幀。
⑨提出了基于Adaboost的多階段優(yōu)化人臉檢測(cè)算法。以經(jīng)典Adaboost算法為基礎(chǔ),分別在算法學(xué)習(xí)、算法檢測(cè)過程中對(duì)其進(jìn)行優(yōu)化,提出前后端自判斷機(jī)制用以縮減誤報(bào)。在分類器判斷待檢測(cè)窗口之前,設(shè)置前端誤報(bào)縮減機(jī)制,通過邊緣能量檢測(cè)刪除非感興趣子窗口;在Adaboost算法檢測(cè)后,通過基于粗糙粒的膚色檢測(cè)和邊緣蒙版過濾構(gòu)成的“過濾器”,在窗口內(nèi)再次篩選人臉,進(jìn)一步縮減誤報(bào)。
⑩針對(duì)目前的人眼跟蹤方法對(duì)人眼部分遮擋、人臉尺度變化和頭部旋轉(zhuǎn)等情況過于敏感,經(jīng)常因丟失目標(biāo)而導(dǎo)致跟蹤失敗的情況,提出了一種基于Kalman濾波器和改進(jìn)CamShift算法的雙眼跟蹤方法。運(yùn)用Kalman濾波器預(yù)測(cè)當(dāng)前幀圖像中雙眼的位置,根據(jù)雙眼的顏色分布特征運(yùn)用改進(jìn)Camshift迭代算法在估計(jì)的鄰域范圍內(nèi)搜索雙眼目標(biāo),再根據(jù)雙眼分布的對(duì)稱性和旋轉(zhuǎn)不變性校正搜索到的雙眼窗口,并更新Kalman濾波器和人眼模板。該算法避免了遮擋和背景對(duì)雙眼的影響,對(duì)人臉尺度變化、人眼部分遮擋和頭部旋轉(zhuǎn)都有較強(qiáng)的頑健性,在人眼微睜甚至完全閉合的情況下可以準(zhǔn)確跟蹤到人眼狀態(tài)。
?提出了融合雙韋伯特征的深度置信網(wǎng)絡(luò)表情識(shí)別算法。采用雙韋伯特征算子對(duì)圖像進(jìn)行初次特征提取,將初次特征輸入深度置信網(wǎng)絡(luò)模型,進(jìn)行更高層次的特征抽象。提取結(jié)果融合了局部特征和全局特征的優(yōu)勢(shì),改善了韋伯特征在提取面部表情時(shí)整體紋理結(jié)構(gòu)信息不足、深度學(xué)習(xí)對(duì)圖像局部紋理構(gòu)建不全等弊端。將雙韋伯特征作為深度置信網(wǎng)絡(luò)的輸入減少了對(duì)冗余信息的學(xué)習(xí)和計(jì)算,使深度學(xué)習(xí)的速度得到明顯提高,且韋伯特征與深度置信網(wǎng)絡(luò)的特征融合,提高了分類器表情識(shí)別的準(zhǔn)確率。
- 軟件項(xiàng)目管理(第2版)
- 小創(chuàng)客玩轉(zhuǎn)圖形化編程
- PHP程序設(shè)計(jì)(慕課版)
- Mastering C# Concurrency
- GitLab Repository Management
- Processing互動(dòng)編程藝術(shù)
- PHP+MySQL+Dreamweaver動(dòng)態(tài)網(wǎng)站開發(fā)實(shí)例教程
- Yii Project Blueprints
- 圖數(shù)據(jù)庫(kù)實(shí)戰(zhàn)
- INSTANT Silverlight 5 Animation
- C++編程兵書
- Go語言開發(fā)實(shí)戰(zhàn)(慕課版)
- IBM Cognos TM1 Developer's Certification guide
- Training Systems Using Python Statistical Modeling
- 軟件測(cè)試技術(shù)