- 大語言模型:原理、應(yīng)用與優(yōu)化
- 蘇之陽 王錦鵬 姜迪 宋元峰
- 993字
- 2024-12-18 17:06:23
1.2.3 大模型的應(yīng)用
傳統(tǒng)語言模型和大模型的應(yīng)用有著明顯的區(qū)別。如上所述,傳統(tǒng)語言模型主要用于計算一段單詞序列的概率,我們將這一應(yīng)用方式定義為“測量”。而大模型側(cè)重于根據(jù)上下文信息產(chǎn)生新的內(nèi)容,我們將這一應(yīng)用方式定義為“生成”。如果把傳統(tǒng)語言模型比作測量用的尺子,大模型則更像是可以產(chǎn)生各種布匹的織布機(jī),兩者在應(yīng)用上有著巨大的差別,但是又在基本的構(gòu)成元素上有著很強(qiáng)的關(guān)聯(lián)性。
大模型可以應(yīng)用于許多領(lǐng)域,這里介紹一些大模型的典型應(yīng)用。如圖1-4所示,搜索引擎可以使用大模型來提供更直接、更貼近人類語言交互的答案。這些模型可以幫助搜索引擎更好地理解用戶的查詢,并返回更加準(zhǔn)確、詳細(xì)的結(jié)果。除此之外,大模型可以用于改善聊天機(jī)器人(Chatbot)的效果,可以更加準(zhǔn)確地理解用戶的意圖,并生成更為相關(guān)的回復(fù),從而提供更好的客戶體驗。在軟件開發(fā)領(lǐng)域,大模型可以幫助軟件開發(fā)人員生成軟件代碼,提高軟件系統(tǒng)的研發(fā)效率。在法律領(lǐng)域,大模型可以進(jìn)行法律釋義,并提供更好的法律建議,從而幫助從業(yè)人員更好地理解法律文本。如今,大模型的應(yīng)用已經(jīng)百花齊放,在非常多的領(lǐng)域和行業(yè)中重塑著產(chǎn)品和體驗。

圖1-4 大模型與搜索引擎相結(jié)合
值得一提的是,除了上述常見的功能,大模型還具有領(lǐng)域綁定的特性,即通過一些提示信息來扮演特定領(lǐng)域的角色的能力。例如,為了讓大模型扮演唐朝詩人李白的角色,我們可以在對話的一開始插入一條問候語:“嗨,我是詩人李白。”在接下來的交互中,用戶即可與李白的角色進(jìn)行交流,如圖1-5所示。利用大模型的這個能力進(jìn)行商業(yè)化探索的一個典型案例是character.ai[1]。在這個平臺上,用戶可以創(chuàng)建“虛擬人物”,然后將其發(fā)布到社區(qū)與其他人聊天。其中,許多角色是歷史或者現(xiàn)實生活中的名人;有些是為了特定任務(wù)而制作的,如協(xié)助寫作或扮演游戲角色。用戶可以與一個虛擬角色聊天,或組織包含多個虛擬角色的討論組,或同時與虛擬角色或其他用戶聊天。

圖1-5 大模型的領(lǐng)域綁定
大模型的模型結(jié)構(gòu)及其思想對很多傳統(tǒng)的人工智能應(yīng)用都有啟發(fā)意義。例如,OpenAI提出的Whisper語音識別系統(tǒng)[7]基于Transformer架構(gòu),使用數(shù)十萬小時的多語言數(shù)據(jù)以及多種任務(wù)類型的數(shù)據(jù)進(jìn)行訓(xùn)練。Whisper與大模型的結(jié)構(gòu)非常類似,也支持多種不同的任務(wù),比如可以進(jìn)行多種語言的語音轉(zhuǎn)錄,以及將這些轉(zhuǎn)錄的文本翻譯成英語。類似地,OpenAI在2024年提出了基于Transformer架構(gòu)的文生視頻(Text-To-Video)模型Sora[2],該模型可以基于用戶輸入的文本生成對應(yīng)的高質(zhì)量視頻,并且支持多種時長、視角和清晰度。
- 機(jī)器人制作從入門到精通(第3版)
- 基于機(jī)器學(xué)習(xí)的行為識別技術(shù)研究
- 神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí):基于MATLAB的仿真與實現(xiàn)
- 機(jī)器人制作從入門到精通(第2版)
- 未來可期:與人工智能同行
- 人工智能導(dǎo)論(通識版)
- 深度思考:人工智能的終點與人類創(chuàng)造力的起點
- 會話式AI:自然語言處理與人機(jī)交互
- 人工不智能:計算機(jī)如何誤解世界(見識叢書52)
- 人工智能導(dǎo)論
- 機(jī)器人驅(qū)動與控制及應(yīng)用實例
- 機(jī)器學(xué)習(xí)實踐指南:案例應(yīng)用解析
- 深度學(xué)習(xí)與信號處理:原理與實踐
- 云計算:在智能交通系統(tǒng)中的應(yīng)用
- 推薦系統(tǒng):產(chǎn)品與算法解析