- 機器人感知技術(shù)
- 李新德 朱博 談英姿編著
- 2093字
- 2023-11-10 17:13:01
1.1.3 語義層環(huán)境感知技術(shù)
近二十年,語義層環(huán)境感知技術(shù)得到研究人員的廣泛關(guān)注,相關(guān)論文的數(shù)量統(tǒng)計情況如圖1-3所示(使用谷歌學(xué)術(shù)搜索引擎,同時搜索關(guān)鍵字“robot”“semantic”和“perception”得出),由圖可見,該領(lǐng)域研究呈穩(wěn)定、快速增長態(tài)勢。

圖1-3 語義層環(huán)境感知論文數(shù)量統(tǒng)計圖
語義層環(huán)境感知技術(shù)指在機器人系統(tǒng)中顯式地對環(huán)境要素(如布局、結(jié)構(gòu)和物體等)有關(guān)的語義信息建模,從而使機器人能夠顯式地從環(huán)境中獲取相應(yīng)的語義知識,并對環(huán)境形成“認識”,是構(gòu)建語義地圖的基礎(chǔ)。此類技術(shù)涉及的一個核心概念是“語義知識”,盡管對“語義知識”的釋義在機器人領(lǐng)域并不統(tǒng)一,但是相關(guān)研究在兩方面達成基本共識:一是機器人內(nèi)部需要有知識的顯式表達,二是表達中的符號需要與物理環(huán)境中的物體、參數(shù)或者事件等關(guān)聯(lián)。相關(guān)研究的難點在于如何使機器人和人內(nèi)部的兩種完全不同的感知機制在語義層面發(fā)生一定程度的契合。語義感知結(jié)果有時將直接用于人機交互、操作等任務(wù),而有時用于在機器人內(nèi)部形成類似傳統(tǒng)地圖的環(huán)境模型,此類模型通常稱作“語義地圖”。“語義地圖”作為對傳統(tǒng)度量地圖和拓撲地圖的補充,能夠為機器人推理、規(guī)劃和執(zhí)行相關(guān)任務(wù)提供更豐富的信息,也是目前的研究熱點。
“語義”所涵蓋的具體含義非常廣泛(如物體、物理量、建筑結(jié)構(gòu)、關(guān)系、行為等),人可以從直觀上理解的對象均可歸為“語義”范疇。因此,能使機器人在與環(huán)境交互過程中顯式地表現(xiàn)出類人的概念(語義)生成行為的技術(shù),即可將其視為語義層環(huán)境感知技術(shù)。從機器人研究角度看,一些傳統(tǒng)技術(shù),如物體識別技術(shù)和動態(tài)目標(biāo)識別技術(shù),也能夠提供對于機器人所處環(huán)境意義上的理解,也可視為語義層環(huán)境感知技術(shù)。這些傳統(tǒng)技術(shù)很多已形成理論體系,本節(jié)不再贅述。本節(jié)僅對機器人領(lǐng)域中出現(xiàn)的一些有代表性的語義技術(shù)進行介紹。
一些研究關(guān)注人工設(shè)計局部特征,如Lowe受生物視覺模型啟發(fā)提出的尺度不變特征變換SIFT(一種對尺度、平移、旋轉(zhuǎn)變換具有魯棒不變性的特征),Valgren提出加速穩(wěn)健特征(SURF特征),以及各種自動學(xué)習(xí)得到的深度特征、高層抽象特征等,都被廣泛應(yīng)用于機器人領(lǐng)域。在此過程中,人們逐步認識到局部特征粒度過細,不足以描述更大尺度場景或目標(biāo)對象,因此更多依賴于全局特征描述或中間特征描述來解決粗語義粒度的認知問題。
一些研究關(guān)注對環(huán)境構(gòu)成形態(tài)的感知。通過簡單的對話交互,D'Este等人[37]設(shè)計的機器人能夠?qū)W習(xí)與物體及物體屬性相關(guān)的詞匯,以及多物體間的關(guān)系概念。Swadzba等人[38]受心理語言學(xué)研究的啟發(fā)提出一種分層空間模型,機器人可以利用它提取位于中間層有意義的場景結(jié)構(gòu)。
一些研究涉及對建筑結(jié)構(gòu)的感知。Goron等人[39]利用3D激光掃描系統(tǒng)捕捉室內(nèi)矩形狀結(jié)構(gòu)對應(yīng)的語義信息,這類結(jié)構(gòu)包括墻壁、門和窗戶等;Nüchter等人[40]提出一種采用3D激光掃描儀的語義建圖系統(tǒng),該系統(tǒng)不僅可以建立環(huán)境的3D幾何地圖,而且可對一些建筑結(jié)構(gòu)(如墻壁、地板等)和復(fù)雜物體進行語義標(biāo)注,生成3D語義地圖。
一些研究能夠在直接或間接實現(xiàn)物體感知的基礎(chǔ)上構(gòu)建語義物體地圖(Semantic Object Map)。Jeong等人[41]將已知物體作為路標(biāo),并以基于視覺的相對定位過程作為擴展卡爾曼濾波器的過程模型(Process Model),使得在編碼器不可用的場合下機器人仍可以魯棒地構(gòu)建環(huán)境的語義地圖。Tenorth等人[42]提出一種名為KNOWROB-MAP的系統(tǒng),該系統(tǒng)可以將物體識別和建圖系統(tǒng)的輸出同物體知識庫中的知識相連接,進而形成一種帶有關(guān)聯(lián)知識的語義物體地圖。Rusu等人[43]提出一種家居環(huán)境中面向操作的3D語義物體地圖,并提出從密集3D深度數(shù)據(jù)中自動獲取該地圖的方法。Mozos等人[44]提出一種使機器人能夠通過萬維網(wǎng)學(xué)習(xí)典型辦公家具的一般模型,進而對實際環(huán)境中的未知家具實例進行分類和定位,由此可建立語義地圖。Civera等人[45]對傳統(tǒng)無語義的單目SLAM(Monocular SLAM)進行推廣,在其基礎(chǔ)上疊加對3D物體的識別,所提出的算法在室內(nèi)實時地實現(xiàn)了語義SLAM。Li等人[46]設(shè)計出一種新穎的語義建圖方法,其通過可穿戴傳感器識別人的動作,利用動作與家具類型的關(guān)聯(lián)模型確定家具類型,進而實現(xiàn)語義建圖。Kim等人[47]使用Kinect作為環(huán)境傳感器,利用室內(nèi)環(huán)境的特殊結(jié)構(gòu)來加速對重復(fù)物體的3D提取和識別過程,實現(xiàn)對室內(nèi)環(huán)境的理解,由此可構(gòu)建語義物體地圖。一些物體感知的常用方法參見文獻[48]和[49]。
一些研究關(guān)注對環(huán)境中場所的感知,相關(guān)技術(shù)在文獻[50]中做了詳細闡述,受篇幅所限不再贅述。值得注意的是,有時感知到的場所可以作為具有明確語義的拓撲節(jié)點出現(xiàn)在拓撲地圖中,形成所謂的“語義拓撲地圖”(如前述文獻[32]中研究工作),這類地圖同時具備拓撲地圖和語義地圖的性質(zhì),相關(guān)研究應(yīng)當(dāng)予以重視。
隨著人們對語義內(nèi)涵的深入理解,一些新穎的研究內(nèi)容也相繼出現(xiàn),如卡內(nèi)基梅隆大學(xué)的Gupta等人[51]提出一種更加以人為中心的室內(nèi)場景理解范式,這種方法預(yù)測人在場景中的工作空間(Workspace),即可達姿態(tài)集合,可視為在行為語義層面上實現(xiàn)對場景的理解。除此之外,隨著機器人可感知的語義類別增多,多類語義的有效表達問題受到一些研究人員的關(guān)注,如Wang等人[52]提出一種用于描述室內(nèi)環(huán)境的語義地圖表達方法,其基于的實體類型包括物體(如桌子)、建筑結(jié)構(gòu)(如墻)和場所標(biāo)簽(如房間)等。目前,從物體的功能性角度以及從人和物體之間的交互行為角度來認知物體的方法受到了廣泛關(guān)注。
- 張永剛、董學(xué)文《文學(xué)原理》筆記和典型題(含考研真題)詳解
- 服裝機械原理(第5版)
- 復(fù)雜動力網(wǎng)絡(luò)的同步分析與控制
- AIGC與電商營銷技能實戰(zhàn)(慕課版)
- 發(fā)酵工程與設(shè)備實驗實訓(xùn)
- 旅游行業(yè)英語
- 王守仁《英國文學(xué)選讀》(第3版)課后習(xí)題詳解
- 建筑設(shè)計初步
- 機械工程概論
- 基于ARM Cortex-M4的單片機原理與實踐
- 2020年高等教育學(xué)考研題庫(章節(jié)題庫+模擬試題)
- 傳感網(wǎng)應(yīng)用開發(fā)(微課版)
- 靜力學(xué)
- 煤熱解的耦合技術(shù)一體化
- 全媒體運營:AIGC版(微課版)