官术网_书友最值得收藏!

  • 智能語(yǔ)音處理
  • 張雄偉 孫蒙 楊吉斌
  • 512字
  • 2020-11-05 10:07:10

3.1 引言

在實(shí)際生活中,可以直接對(duì)很多現(xiàn)象和變化進(jìn)行觀(guān)測(cè),并得到一系列的觀(guān)測(cè)值。例如氣溫觀(guān)測(cè)、人體血壓或心率監(jiān)測(cè)等。利用這些觀(guān)測(cè)值,可以知道天氣的冷暖、血壓的高低和心率的快慢。但是,有很多的因素或變量是無(wú)法與觀(guān)測(cè)值一一對(duì)應(yīng)的。例如,在室內(nèi)可以通過(guò)測(cè)量空氣濕度知道天氣是否干燥(潮濕)、舒適,但是卻無(wú)法直接判斷室外有沒(méi)有在下雨。這時(shí),空氣濕度是一個(gè)可觀(guān)測(cè)量,是否下雨是一個(gè)不可觀(guān)測(cè)的隨機(jī)變量,但兩者之間存在著一定的概率關(guān)系。

在統(tǒng)計(jì)理論中,通常將不可觀(guān)測(cè)到的變量稱(chēng)為隱變量。為了能夠挖掘隱變量包含的信息,需要建立隱變量模型,并利用可觀(guān)測(cè)變量的樣本對(duì)隱變量做出推斷。

語(yǔ)音中包含了非常豐富的信息,但是通過(guò)麥克風(fēng)可以直接觀(guān)測(cè)到的只是語(yǔ)音波形。處理語(yǔ)音信息需要將隱藏在波形中的語(yǔ)義信息、說(shuō)話(huà)人信息、情感信息、語(yǔ)種信息、方言信息提取出來(lái),需要采用適當(dāng)?shù)碾[變量模型來(lái)對(duì)這些信息進(jìn)行建模,以建立起它們與波形之間的描述關(guān)系。因此,隱變量模型在語(yǔ)音信息處理中被廣泛應(yīng)用。

本章將以語(yǔ)音信息處理中廣泛使用的高斯混合模型(Gaussian Mixture Model,GMM)[1]、隱馬爾可夫模型(Hidden Markov Model,HMM)[2-3]和高斯過(guò)程隱變量模型(Gaussian Process Latent Variable Model,GPLVM)[4]為代表,介紹隱變量模型的基本概念和主要研究問(wèn)題。

主站蜘蛛池模板: 鹤峰县| 新蔡县| 华池县| 东阳市| 泸水县| 苍溪县| 安陆市| 长海县| 苍南县| 陇南市| 诏安县| 南汇区| 泾源县| 平和县| 宁陵县| 河间市| 石门县| 宜丰县| 涞源县| 汶川县| 额济纳旗| 东方市| 纳雍县| 玉龙| 桦川县| 安仁县| 沂水县| 仙游县| 舞钢市| 喀什市| 积石山| 顺平县| 繁昌县| 济宁市| 宜昌市| 祁东县| 洱源县| 师宗县| 镇康县| 都江堰市| 大理市|