- 智能語(yǔ)音處理
- 張雄偉 孫蒙 楊吉斌
- 512字
- 2020-11-05 10:07:10
3.1 引言
在實(shí)際生活中,可以直接對(duì)很多現(xiàn)象和變化進(jìn)行觀(guān)測(cè),并得到一系列的觀(guān)測(cè)值。例如氣溫觀(guān)測(cè)、人體血壓或心率監(jiān)測(cè)等。利用這些觀(guān)測(cè)值,可以知道天氣的冷暖、血壓的高低和心率的快慢。但是,有很多的因素或變量是無(wú)法與觀(guān)測(cè)值一一對(duì)應(yīng)的。例如,在室內(nèi)可以通過(guò)測(cè)量空氣濕度知道天氣是否干燥(潮濕)、舒適,但是卻無(wú)法直接判斷室外有沒(méi)有在下雨。這時(shí),空氣濕度是一個(gè)可觀(guān)測(cè)量,是否下雨是一個(gè)不可觀(guān)測(cè)的隨機(jī)變量,但兩者之間存在著一定的概率關(guān)系。
在統(tǒng)計(jì)理論中,通常將不可觀(guān)測(cè)到的變量稱(chēng)為隱變量。為了能夠挖掘隱變量包含的信息,需要建立隱變量模型,并利用可觀(guān)測(cè)變量的樣本對(duì)隱變量做出推斷。
語(yǔ)音中包含了非常豐富的信息,但是通過(guò)麥克風(fēng)可以直接觀(guān)測(cè)到的只是語(yǔ)音波形。處理語(yǔ)音信息需要將隱藏在波形中的語(yǔ)義信息、說(shuō)話(huà)人信息、情感信息、語(yǔ)種信息、方言信息提取出來(lái),需要采用適當(dāng)?shù)碾[變量模型來(lái)對(duì)這些信息進(jìn)行建模,以建立起它們與波形之間的描述關(guān)系。因此,隱變量模型在語(yǔ)音信息處理中被廣泛應(yīng)用。
本章將以語(yǔ)音信息處理中廣泛使用的高斯混合模型(Gaussian Mixture Model,GMM)[1]、隱馬爾可夫模型(Hidden Markov Model,HMM)[2-3]和高斯過(guò)程隱變量模型(Gaussian Process Latent Variable Model,GPLVM)[4]為代表,介紹隱變量模型的基本概念和主要研究問(wèn)題。
- 機(jī)器視覺(jué)自動(dòng)檢測(cè)技術(shù)
- 2019年華北五省(市、自治區(qū))大學(xué)生機(jī)器人大賽:人工智能與機(jī)器人創(chuàng)意設(shè)計(jì)賽論文集
- 計(jì)算機(jī)視覺(jué)中的深度學(xué)習(xí)
- 劫持
- 生成式AI實(shí)戰(zhàn)
- 解碼智能時(shí)代2021:前沿趨勢(shì)10人談
- 妙用DeepSeek:創(chuàng)意落地速通指南
- 人工不智能:計(jì)算機(jī)如何誤解世界(見(jiàn)識(shí)叢書(shū)52)
- Python3智能數(shù)據(jù)分析快速入門(mén)
- 人工智能:改變未來(lái)的顛覆性技術(shù)
- 因果推斷導(dǎo)論
- 大型語(yǔ)言模型實(shí)戰(zhàn)指南:應(yīng)用實(shí)踐與場(chǎng)景落地
- 深度學(xué)習(xí)與圖像識(shí)別:原理與實(shí)踐
- 一本書(shū)讀懂智能家居核心技術(shù)
- 智能革命:迎接人工智能時(shí)代的社會(huì)、經(jīng)濟(jì)與文化變革