- Kaldi語音識別實戰
- 陳果果等
- 290字
- 2020-06-05 16:56:39
3 數據整理
本章介紹如何為Kaldi的訓練環境準備數據和其他資源文件。在使用語音識別工具訓練聲學模型時,一個新手的常見問題就是如何準備訓練數據。這里面包含兩個問題,第一個是如何選擇訓練數據,第二個是如何將數據整理成工具可以支持的格式。如果數據格式不正確或不規范,則可能導致訓練過程無法進行,或者訓練出來的模型性能極差。Kaldi的通用腳本將工具整合在一起,避免了工具誤用帶來的問題,但同時,也要求使用者保證數據格式的正確。不同數據來源的格式千差萬別,本章還將講解如何構建符合Kaldi腳本規范的數據資源文件,包括數據文件夾data和語言文件夾data/lang,并以Librispeech為例,詳解如何劃分訓練數據,以及各種資源文件的內容及其用途。