- AIGC智能營銷:4A模型驅(qū)動(dòng)的AI營銷方法與實(shí)踐
- 栗建
- 3485字
- 2025-03-13 17:59:33
1.2.2 主流的基礎(chǔ)模型
“基礎(chǔ)模型”一詞通常與“大語言模型”大致同義使用。這兩個(gè)術(shù)語之間的區(qū)別在于,大語言模型專門指專注于語言的系統(tǒng),而基礎(chǔ)模型則試圖確立一個(gè)基于功能的更廣泛概念。
這類模型是使用大規(guī)模數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練的人工智能模型,主要用于處理和理解自然語言。這些模型不受語言的限制,能夠執(zhí)行多種語言理解和內(nèi)容生成任務(wù),包括文本摘要、翻譯、問答、對(duì)話生成等。
大部分大語言模型首先在大量未標(biāo)記的文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,學(xué)習(xí)語言的特征。這個(gè)預(yù)訓(xùn)練階段不針對(duì)特定任務(wù),目的是讓模型學(xué)習(xí)到豐富的語言知識(shí),并具備語境(上下文)的聯(lián)系能力。之后,模型可以通過微調(diào),根據(jù)特定任務(wù)進(jìn)行輸入內(nèi)容的優(yōu)化。
2022年,OpenAI公司發(fā)布GPT-3.5,引發(fā)的現(xiàn)象級(jí)轟動(dòng)迅速席卷全球科技界。各家科技巨頭紛紛投入巨資研發(fā)并推出自己的大語言模型,這場(chǎng)競(jìng)賽正愈演愈烈。它不僅能夠更好地保證自己的數(shù)據(jù)安全,不受外部供應(yīng)商的約束,而且能夠幫助企業(yè)搶占未來流量的入口:大語言模型以及相關(guān)的應(yīng)用,將成為新的“搜索引擎”“社交媒體”和“辦公工具”。
當(dāng)前的大語言模型競(jìng)爭格局中,美國在基礎(chǔ)模型和圖像生成模型領(lǐng)域占據(jù)了領(lǐng)先地位,而中國緊隨其后,在基礎(chǔ)理論研究和基礎(chǔ)模型開發(fā)方面進(jìn)展迅猛。與此同時(shí),其他國家和地區(qū)也在積極參與這場(chǎng)競(jìng)賽,推出的大語言模型,雖然在全球競(jìng)爭中并不占優(yōu)勢(shì),但展現(xiàn)出了積極的發(fā)展態(tài)勢(shì)。
接下來,我們將重點(diǎn)介紹幾個(gè)在全球范圍內(nèi)應(yīng)用廣泛的大語言模型。
1.GPT
GPT由OpenAI公司開發(fā),目前已經(jīng)推出了多個(gè)版本,包括GPT-3.5、GPT-4、GPT-4-turbo、GPT-4o,以及一個(gè)多模態(tài)版本GPT-4 Vision(或記為GPT-4-V)。
GPT模型的發(fā)展可以追溯到2018年,從最初的GPT-1到最新的GPT-4,每一代模型的迭代都在規(guī)模和性能上產(chǎn)生了巨大飛躍。根據(jù)相關(guān)的報(bào)道,GPT-4的參數(shù)數(shù)量估計(jì)可能超過10000億。參數(shù)數(shù)量通常被用來衡量大語言模型的先進(jìn)性和潛在能力。更多的參數(shù)數(shù)量通常表明模型具有更大的容量來學(xué)習(xí)訓(xùn)練數(shù)據(jù)中的復(fù)雜模式和關(guān)系。這反過來又幫助大語言模型在內(nèi)容生成和任務(wù)處理上表現(xiàn)更好。
但是,需要注意的是,參數(shù)數(shù)量不是影響大語言模型能力的唯一因素,訓(xùn)練數(shù)據(jù)的質(zhì)量以及訓(xùn)練方法也起著重要作用。
GPT模型以其強(qiáng)大的知識(shí)更新能力和細(xì)粒度的輸出控制而聞名,能夠根據(jù)最新信息生成回答,并在回答中精確控制文本的細(xì)節(jié)和風(fēng)格,滿足多樣化的場(chǎng)景和需求。
GPT的應(yīng)用場(chǎng)景廣泛,包括自動(dòng)寫作、機(jī)器翻譯、語言理解等。GPT提供的通用API,開發(fā)者和企業(yè)能夠輕松集成和使用。微軟、Duolingo、Stripe、Descript、Dropbox和Zapier等公司都采用GPT模型來提升用戶體驗(yàn)和業(yè)務(wù)效率。
ChatGPT是基于GPT技術(shù)的聊天機(jī)器人,免費(fèi)版使用GPT-3.5,付費(fèi)版則可以使用GPT-4以及GPT-4o。我們?cè)趦?nèi)容創(chuàng)作、數(shù)據(jù)分析和策略制定等多個(gè)營銷領(lǐng)域?qū)hatGPT(基于GPT-4模型)進(jìn)行了深入測(cè)試,發(fā)現(xiàn)其在文本創(chuàng)作、創(chuàng)意支持、信息檢索、數(shù)據(jù)分析以及風(fēng)格轉(zhuǎn)換等方面顯著超越了其他大語言模型。此外,ChatGPT在理解用戶意圖、遵循指令以及輔助內(nèi)容生成方面的表現(xiàn)同樣卓越。
2.Claude
Claude是由Anthropic公司開發(fā)的一種大語言模型。Anthropic公司是由OpenAI團(tuán)隊(duì)的兩位前成員創(chuàng)立的,他們?cè)陂_發(fā)Claude時(shí)強(qiáng)調(diào)創(chuàng)建一個(gè)“更溫和、更可靠”的AI系統(tǒng)。Claude在安全性上更加嚴(yán)格,這極易導(dǎo)致用戶被封號(hào)。我們可以通過訪問poe.com來使用Claude的基本功能。
Claude模型的設(shè)計(jì)重點(diǎn)之一是提高模型的可靠性和安全性,確保其生成的內(nèi)容符合道德和安全標(biāo)準(zhǔn)。Anthropic通過在模型訓(xùn)練階段注入道德規(guī)范和安全機(jī)制來減少有偏見或有害內(nèi)容的生成。
Claude現(xiàn)在有Claude 2、Claude 3等多個(gè)版本。2024年3月4日發(fā)布的Claude 3系列包括Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku多個(gè)版本。其中旗艦?zāi)P虲laude 3 Opus在多項(xiàng)指標(biāo)上超過了GPT-4和Gemini 1.0 Ultra。
Claude模型特別擅長處理超長的文本序列,這對(duì)于理解復(fù)雜文檔和長篇內(nèi)容至關(guān)重要。我們對(duì)Claude 3 Opus進(jìn)行了長文本處理和測(cè)試,發(fā)現(xiàn)其在處理長文本、保持文本風(fēng)格、提高準(zhǔn)確性以及增強(qiáng)客觀性等方面超越了其他大語言模型。然而,在邏輯推理和創(chuàng)意生成方面,Claude 3 Opus的表現(xiàn)并不如GPT-4。
3.Gemini
Gemini是谷歌推出的一個(gè)大語言模型家族,包括多個(gè)版本,每個(gè)版本針對(duì)不同的應(yīng)用場(chǎng)景進(jìn)行了優(yōu)化。Gemini Ultra是該系列的旗艦?zāi)P停瑓?shù)數(shù)量為1750億,擅長處理復(fù)雜語言任務(wù)和多模態(tài)輸入。Gemini Pro是一個(gè)“輕量級(jí)”版本,參數(shù)數(shù)量為1370億,適合對(duì)速度有要求的應(yīng)用場(chǎng)景。Gemini還有一個(gè)應(yīng)用于移動(dòng)端設(shè)備的Gemini Nano,參數(shù)數(shù)量約為400億。
Gemini的一個(gè)顯著優(yōu)勢(shì)在于能夠訪問網(wǎng)絡(luò),通過谷歌搜索獲取并處理實(shí)時(shí)信息。根據(jù)我們的測(cè)試結(jié)果和使用體驗(yàn),Gemini在對(duì)時(shí)事新聞搜索和信息更新上,無論是中文還是英文內(nèi)容,表現(xiàn)都優(yōu)于其他大語言模型。
4.通義
阿里巴巴通義大模型是阿里巴巴集團(tuán)自主研發(fā)的大語言模型。通義系列模型涵蓋了從5億到720億參數(shù)的不同規(guī)模,以滿足不同場(chǎng)景的需求。根據(jù)通義千問自己的回答,阿里巴巴已發(fā)布全球首個(gè)突破100萬億參數(shù)的AI大模型。
通義支持多種語言,包括中文、英語、日語和韓語。通義能夠處理各種復(fù)雜的語言任務(wù),包括文本分類、問答系統(tǒng)、機(jī)器翻譯、情感分析等。
通義模型在阿里巴巴生態(tài)內(nèi)部得到了廣泛的應(yīng)用,涵蓋了電商搜索引擎、個(gè)性化推薦系統(tǒng)、客戶服務(wù)自動(dòng)化以及高質(zhì)量內(nèi)容生成等多個(gè)領(lǐng)域。它的集成不僅提升了用戶體驗(yàn),還提高了業(yè)務(wù)流程的效率,為阿里巴巴的多元化業(yè)務(wù)場(chǎng)景提供了強(qiáng)大的語言處理支持。
通義模型的文本風(fēng)格豐富多彩,語言表達(dá)生動(dòng)活潑,這使得它在營銷策略和營銷文本的創(chuàng)制方面尤為出色。它能夠根據(jù)不同的場(chǎng)景和需求,靈活調(diào)整語言風(fēng)格,從而更好地吸引目標(biāo)受眾的注意力。然而,在使用通義模型時(shí),我們也應(yīng)注意到,它在描述事實(shí)時(shí)可能會(huì)展現(xiàn)出一種偏向于電商領(lǐng)域的語言風(fēng)格。這意味著在生成的文本中,可能會(huì)出現(xiàn)較為頻繁的形容詞使用,以及對(duì)事實(shí)的某種程度上的夸張。
5.文心
文心是由百度自主研發(fā)的大模型,基于百度飛槳深度學(xué)習(xí)平臺(tái)構(gòu)建。百度也是在ChatGPT推出之后,在中國最先推出大語言模型的公司之一。
相關(guān)資料顯示,文心大模型的某些版本的參數(shù)總量達(dá)到了1.5萬億。文心4.0版本被報(bào)道使用了超過1萬個(gè)GPU的集群進(jìn)行訓(xùn)練。
文心大模型以其獨(dú)特的知識(shí)增強(qiáng)特性而著稱,這一核心特色使它能夠有效地從大規(guī)模知識(shí)庫和海量非結(jié)構(gòu)化數(shù)據(jù)中提取并融合信息,從而實(shí)現(xiàn)更高效、更精準(zhǔn)的學(xué)習(xí)過程。這種能力不僅提高了學(xué)習(xí)效率和效果,還確保了模型的行為具有良好的可解釋性。在智能客服、教育輔導(dǎo)、醫(yī)療咨詢等多個(gè)實(shí)際應(yīng)用場(chǎng)景中,知識(shí)增強(qiáng)特性使文心大模型能夠提供更加專業(yè)和準(zhǔn)確的服務(wù),這對(duì)于提升用戶體驗(yàn)和增強(qiáng)用戶信任度起到了關(guān)鍵作用。
當(dāng)我們向ChatGPT和通義千問詢問“知識(shí)增強(qiáng)”的含義時(shí),ChatGPT解釋稱,知識(shí)增強(qiáng)并非營銷噱頭,而是百度文心大模型的一個(gè)顯著優(yōu)勢(shì),它凸顯了模型在處理復(fù)雜和知識(shí)密集型任務(wù)時(shí)的高效性和先進(jìn)性。通義千問則表示,“知識(shí)增強(qiáng)”是百度文心大模型基于技術(shù)創(chuàng)新和實(shí)際應(yīng)用效果而提出的核心競(jìng)爭力之一,旨在克服傳統(tǒng)語言模型在處理知識(shí)密集型任務(wù)時(shí)遇到的限制,這一特性具有重大的技術(shù)和實(shí)用價(jià)值。
文心一言是一款類似于ChatGPT的聊天機(jī)器人,提供兩種版本供用戶選擇:文心3.5(免費(fèi)版)和文心4.0(付費(fèi)版)。這兩個(gè)版本都繼承了文心大模型的強(qiáng)大能力,能夠以靈活、互動(dòng)的方式與用戶進(jìn)行交流,提供信息查詢、知識(shí)分享和創(chuàng)意互動(dòng)等服務(wù)。
6.智譜
智譜大語言模型是由清華大學(xué)KEG(知識(shí)工程組)實(shí)驗(yàn)室和智譜AI公司合作研發(fā)的大型語言處理模型。
這款模型專注于中文場(chǎng)景,旨在提供強(qiáng)大且全面的自然語言處理能力,尤其是在中文理解、生成和應(yīng)用方面。智譜模型特別優(yōu)化了對(duì)中文語言結(jié)構(gòu)、文化背景和語境的理解能力,能夠更準(zhǔn)確地把握中文表達(dá)的微妙之處。智譜大語言模型在生成長篇文章、連續(xù)對(duì)話以及創(chuàng)意內(nèi)容方面表現(xiàn)出色。
但是經(jīng)過我們的測(cè)試,智譜大模型在英文理解和生成上的表現(xiàn)也不錯(cuò),在英文翻譯成中文方面的表現(xiàn)更是優(yōu)于其他模型。
智譜大模型可以讓開發(fā)者和研究者免費(fèi)使用,這不僅降低了技術(shù)門檻,還極大地促進(jìn)了創(chuàng)新和學(xué)術(shù)研究的開展。
智譜清言,作為智譜系列的聊天機(jī)器人應(yīng)用,為用戶提供了兩種版本:GLM-3版本和GLM-4版本。這兩款版本均向用戶免費(fèi)開放,使用戶能夠無障礙地體驗(yàn)和利用智譜大模型的強(qiáng)大能力,無論是在學(xué)術(shù)研究、技術(shù)開發(fā)還是日常交互中,都能享受到這一先進(jìn)語言處理工具帶來的便利。
智譜清言不僅是一款功能強(qiáng)大的聊天機(jī)器人應(yīng)用,它還內(nèi)置了類似于G P Ts的智能體功能中心。這一創(chuàng)新特性允許用戶根據(jù)自己的需求創(chuàng)建自定義的智能體,從而進(jìn)一步擴(kuò)展了智譜清言的應(yīng)用范圍。
我們依據(jù)寫作本書時(shí)可獲取的信息及最新動(dòng)態(tài)整理了一張對(duì)照表(見表1-3),對(duì)GPT、Claude、Gemini、通義、文心以及智譜等基礎(chǔ)模型進(jìn)行了橫向比較。需要提醒的是,隨著時(shí)間推移,相關(guān)信息可能會(huì)發(fā)生變動(dòng)。
表1-3 6種基礎(chǔ)模型比較

各大基礎(chǔ)模型都有其獨(dú)特之處,但也存在一定的局限性。在實(shí)際應(yīng)用中,可以根據(jù)具體需求和場(chǎng)景選擇適合的模型。同時(shí),各大模型在不斷迭代和優(yōu)化,而且未來可能還會(huì)有更多優(yōu)秀的大語言模型出現(xiàn)。
- 中國網(wǎng)絡(luò)營銷年鑒:案例卷
- 手把手教你做專業(yè)督導(dǎo):專賣店、連鎖店
- 圖說工業(yè)互聯(lián)網(wǎng):人機(jī)連接的智能工業(yè)新時(shí)代
- 市場(chǎng)營銷學(xué)
- 銀行公司業(yè)務(wù)營銷技巧與案例分析
- 私域流量池
- 重新定義銷售
- 制勝營銷:2015金麥獎(jiǎng)營銷案例精粹
- 農(nóng)產(chǎn)品系列3本套裝
- 眼動(dòng)追蹤:用戶體驗(yàn)優(yōu)化操作指南
- 一分鐘讀懂顧客心理學(xué)
- 快消品營銷實(shí)戰(zhàn)策略
- 品牌賦能:打造超級(jí)爆品的9大邏輯
- 電商平臺(tái)中綠色農(nóng)產(chǎn)品消費(fèi)者行為研究
- 品牌王道2