官术网_书友最值得收藏!

AI“+”什么

AI+ 3種能力

2024年3月,在“人工智能+”行動的指引下,商湯科技董事長兼首席執(zhí)行官(Chief Executive Officer,CEO)徐立創(chuàng)造性地提出“KRE能力架構(gòu)”(見圖1-4),并指出當(dāng)今大模型正在按照“知識”“推理”“執(zhí)行”三個(gè)層級進(jìn)化升級。面向各種知識問答任務(wù),知識層主要解決高頻、標(biāo)準(zhǔn)化的問題,即以前很多人問答過的知識內(nèi)容,準(zhǔn)確率很高;推理層重點(diǎn)解決長尾、碎片化、非標(biāo)準(zhǔn)化的問題;執(zhí)行層則將知識能力、推理能力、執(zhí)行能力融為一體,完成更為復(fù)雜的組合式軟硬件性任務(wù)。三個(gè)層級的能力如下。

圖1-4 “KRE能力架構(gòu)”

第一層,知識能力:整合并吸收人類歷史上積累的跨學(xué)科的全球知識,并將這些知識進(jìn)行歸納總結(jié)和融會貫通,提煉出普遍適用的概念、原則或結(jié)論的能力。語言文字是人類知識的重要表現(xiàn)形式,當(dāng)今大語言模型的學(xué)習(xí)速度極快,Epoch AI Research團(tuán)隊(duì)成員、加利福尼亞大學(xué)伯克利分校計(jì)算機(jī)科學(xué)專業(yè)的教授斯圖爾特·羅素等專家預(yù)測人類歷史上的“高質(zhì)量語言數(shù)據(jù)”,將在2024—2026年訓(xùn)練完,換句話說,大語言模型正在成為掌握人類歷史上幾乎全部知識的初級智慧載體,人們能夠通過與大語言模型交流,獲得歷史上的科學(xué)家、文學(xué)家、哲學(xué)家等的回答,大語言模型能跨多個(gè)領(lǐng)域回答專業(yè)性極高的復(fù)雜問題。

第二層,推理能力:能夠根據(jù)一個(gè)或多個(gè)已知前提條件,推導(dǎo)出新的結(jié)論的能力。大語言模型能夠基于世界知識“底座”,以“舊知”推理出“新知”,以及發(fā)現(xiàn)新的可能性,為人類“世界知識庫”提供知識增量。知識(歸納)層和推理層是AI生產(chǎn)力十分重要的兩層。目前大語言模型在端到端的復(fù)雜推理任務(wù)上與人類專家相比仍有差距,AI正在集中力量攻堅(jiān),當(dāng)具有可靠、精準(zhǔn)推理能力的大語言模型出現(xiàn)時(shí),其將在學(xué)術(shù)界、產(chǎn)業(yè)界等各領(lǐng)域?yàn)槿祟愄峁┻壿嫹治龇?wù)。

第三層,執(zhí)行能力:在和世界的互動中通過人類的反饋,掌握新知識的能力。正如毛澤東在《實(shí)踐論》中清晰闡釋了“認(rèn)識”和“實(shí)踐”的關(guān)系,通過對比人類“認(rèn)識+實(shí)踐”的模式,我們可以理解為什么大模型需要調(diào)用“執(zhí)行體”才能更加深入、全面、客觀地認(rèn)知世界規(guī)律——“執(zhí)行體”既可以是其他AI原生模型、傳統(tǒng)軟件,也可以是機(jī)器人、機(jī)械手、智能網(wǎng)聯(lián)汽車等硬件,大語言模型與后者的結(jié)合就是我們常說的“具身智能”。

《實(shí)踐論》指出:“只有人們的社會實(shí)踐,才是人們對于外界認(rèn)識的真理性的標(biāo)準(zhǔn)”。這也正是當(dāng)前大語言模型缺乏實(shí)踐出現(xiàn)“幻覺”的原因,即缺乏實(shí)踐檢驗(yàn)認(rèn)知、糾偏認(rèn)知。

實(shí)踐出真知,實(shí)踐是認(rèn)識的來源。比如,人們通過觀察和實(shí)踐,才能獲得對自然現(xiàn)象和社會現(xiàn)象的認(rèn)識,從而形成科學(xué)理論。

認(rèn)識對實(shí)踐具有反作用。比如,科學(xué)理論可以指導(dǎo)人們的實(shí)踐活動,提高實(shí)踐的效率和效果;同時(shí),實(shí)踐結(jié)果也可以修正和完善原有的理論。

認(rèn)識具有反復(fù)性、無限性、上升性。比如,在科學(xué)研究過程中,人們需要經(jīng)過反復(fù)實(shí)驗(yàn)和驗(yàn)證才能得出正確的結(jié)論;同時(shí),隨著實(shí)驗(yàn)條件和觀測技術(shù)的不斷改進(jìn),人們對于某一現(xiàn)象的認(rèn)識也會不斷深化。

知識在人類進(jìn)化史上有無與倫比的崇高地位,許多哲學(xué)家、科學(xué)家給予了知識極高的評價(jià),而思考是處理知識的過程。

在AI時(shí)代,語言文字是知識的表達(dá)方式之一,而數(shù)據(jù)是語言文字的載體,程序是處理數(shù)據(jù)的高效生產(chǎn)力工具。2023年12月,商湯科技基于自研大模型,推出AI編程助手“代碼小浣熊”(Raccoon),其覆蓋軟件需求分析、架構(gòu)設(shè)計(jì)、代碼編寫、軟件測試等環(huán)節(jié)(見圖1-5),滿足用戶的代碼編寫、數(shù)據(jù)分析、編程學(xué)習(xí)等各類需求,支持Python、Java、C++、SQL等90多種主流編程語言和主流集成開發(fā)環(huán)境(Integrated Development Environment,IDE)。用“KRE能力架構(gòu)”來分析“代碼小浣熊”產(chǎn)品自身的開發(fā)效率,即從需求分析、架構(gòu)設(shè)計(jì)、代碼編寫、軟件測試、部署上線、系統(tǒng)維護(hù)全流程來對比不同能力層的研發(fā)工作量,具體如下。

圖1-5 “代碼小浣熊”賦能軟件開發(fā)全生命周期(黃色子流程部分為人機(jī)協(xié)同環(huán)節(jié))

知識能力融入:讓基礎(chǔ)大模型掌握代碼庫,僅在開發(fā)環(huán)節(jié)用他人寫過的代碼來補(bǔ)全目標(biāo)開發(fā)程序,從“代碼小浣熊”的需求分析到最終產(chǎn)品的開發(fā)完成,總共需要投入100人天。[5]


[5] 人天:軟件業(yè)衡量開發(fā)工作的單位,即一個(gè)程序員工作一天的工作量。

推理能力融入:讓大模型深入軟件開發(fā)全過程,進(jìn)一步輔助需求分析與設(shè)計(jì)、用戶界面生成、測試用例生成等環(huán)節(jié),可節(jié)省30%的開發(fā)工作量,即只需要投入70人天。

執(zhí)行能力融入:如果使用“代碼小浣熊”2.0版本,調(diào)用強(qiáng)大的代碼解釋器(執(zhí)行體),處理各種專業(yè)性問題,從海量數(shù)據(jù)中篩選出需求、指定產(chǎn)品特征,并根據(jù)特征完成產(chǎn)品開發(fā),可節(jié)省80%的開發(fā)工作量,僅需要投入20人天即可完成產(chǎn)品的自主研發(fā)。大模型為什么需要調(diào)用代碼解釋器?因?yàn)樵诿鎸Ω鞣N數(shù)學(xué)問題時(shí),代碼解釋器能夠正確、可靠地給出答案,例如,在ChatGPT中輸入“請列出100以內(nèi)所有質(zhì)數(shù)兩兩相乘的結(jié)果”,以及“請列出100以內(nèi)所有質(zhì)數(shù)兩兩相乘后加1的結(jié)果”,它能夠正確地列出前者,但在處理后者時(shí)卻出現(xiàn)了錯(cuò)誤。兩個(gè)問題難度一樣,為什么會出錯(cuò)?原因在于基礎(chǔ)模型沒有見過這類問題,它在訓(xùn)練時(shí)儲備的世界知識無法直接給出答案,從而需要調(diào)用代碼解釋器,獲得正確答案。

主站蜘蛛池模板: 湖口县| 长春市| 那曲县| 南投县| 哈尔滨市| 商城县| 芜湖市| 兴化市| 张北县| 墨竹工卡县| 延寿县| 金平| 石屏县| 广州市| 岢岚县| 镇平县| 平乡县| 临洮县| 海门市| 惠水县| 车险| 武胜县| 珲春市| 兴仁县| 金华市| 佛冈县| 梁河县| 武山县| 宜丰县| 湖北省| 西乌珠穆沁旗| 江西省| 襄汾县| 鄂伦春自治旗| 洛宁县| 遂平县| 阳城县| 吉林省| 清原| 清涧县| 永城市|