- 大語言模型:原理、應用與優(yōu)化
- 蘇之陽 王錦鵬 姜迪 宋元峰
- 411字
- 2024-12-18 17:06:22
1.1.3 傳統(tǒng)語言模型的應用
傳統(tǒng)語言模型輸出的概率通常作為一個標識單詞序列“合法性”的先驗打分,在語音識別、拼寫檢查、機器翻譯、光學字符識別、手寫識別中都會發(fā)揮關鍵作用。如果用X表示應用中的輸入,Y表示應用中的輸出,這些問題可以建模為如下數(shù)學問題:

其中,P(X|Y)是與具體應用相關的模型,P(Y)為針對Y的語言模型。
例如,在語音識別中,X表示輸入的音頻信號,Y表示識別出來的文本。P(X|Y)一般被稱為聲學模型(Acoustic Model),主要用于衡量識別出來的文本的發(fā)音和音頻的相似程度。P(Y)則為語言模型,用于衡量識別出來的文本是否符合語言的使用慣例,聲學模型和語言模型一起發(fā)揮作用,產(chǎn)生質(zhì)量較好的識別結(jié)果。在機器翻譯中,X表示源語言書寫的文本,Y表示目標語言書寫的文本。P(X|Y)一般被稱為翻譯模型(Translation Model),主要用來衡量兩種語言書寫的文本是否具有相似的含義。語言模型P(Y)的作用與在語音識別中的作用相同,衡量目標語言的文本是否符合該語言的使用慣例。
推薦閱讀
- 人工智能安全
- 智能算法理論與實踐
- 智能優(yōu)化算法:基于生物行為模型的案例分析與設計
- 神經(jīng)網(wǎng)絡與深度學習:基于MATLAB的仿真與實現(xiàn)
- 新一代人工智能:無代碼人工智能開發(fā)平臺實踐
- 人機共生
- 基于信息增強的圖神經(jīng)網(wǎng)絡學習方法研究
- 深度學習
- 大模型項目實戰(zhàn):Agent開發(fā)與應用
- 人人都是設計師:設計基礎+Midjourney+ChatGPT
- PVCBOT超簡單機器人設計與制作(第2版)
- 聯(lián)邦學習
- 人工智能核心:神經(jīng)網(wǎng)絡(青少科普版)
- 大型語言模型實戰(zhàn)指南:應用實踐與場景落地
- 一本書讀懂智能家居核心技術