Kaldi語音識別實戰(zhàn)
剛剛過去的十年是語音技術(shù)發(fā)展的黃金十年。2010年前后,從谷歌公司發(fā)布第一個語音搜索應(yīng)用、蘋果公司發(fā)布第一個語音助手Siri開始,語音技術(shù)的發(fā)展轉(zhuǎn)瞬進入了快車道。語音技術(shù)的基礎(chǔ)算法不斷推陳出新,語音任務(wù)Benchmark持續(xù)被刷新;語音產(chǎn)品的應(yīng)用也從一開始很小眾的語音輸入,逐漸滲透到人們生活的方方面面。語音產(chǎn)業(yè)飛速發(fā)展,傳統(tǒng)的語音技術(shù)教材已經(jīng)滿足不了該領(lǐng)域從業(yè)者的迫切需求。本書以目前流行的開源語音識別工具Kaldi為切入點,深入淺出地講解了語音識別前沿的技術(shù)及它們的實踐應(yīng)用。本書的作者們擁有深厚的學(xué)術(shù)積累及豐富的工業(yè)界實戰(zhàn)經(jīng)驗。本書適合語音技術(shù)相關(guān)研究人員及互聯(lián)網(wǎng)從業(yè)人員學(xué)習(xí)參考。
·14.2萬字