- AI商業進化論:“人工智能+”賦能新質生產力發展
- 田豐
- 6字
- 2025-05-19 16:21:31
AI“+”什么
AI+ 3種能力
2024年3月,在“人工智能+”行動的指引下,商湯科技董事長兼首席執行官(Chief Executive Officer,CEO)徐立創造性地提出“KRE能力架構”(見圖1-4),并指出當今大模型正在按照“知識”“推理”“執行”三個層級進化升級。面向各種知識問答任務,知識層主要解決高頻、標準化的問題,即以前很多人問答過的知識內容,準確率很高;推理層重點解決長尾、碎片化、非標準化的問題;執行層則將知識能力、推理能力、執行能力融為一體,完成更為復雜的組合式軟硬件性任務。三個層級的能力如下。

圖1-4 “KRE能力架構”
第一層,知識能力:整合并吸收人類歷史上積累的跨學科的全球知識,并將這些知識進行歸納總結和融會貫通,提煉出普遍適用的概念、原則或結論的能力。語言文字是人類知識的重要表現形式,當今大語言模型的學習速度極快,Epoch AI Research團隊成員、加利福尼亞大學伯克利分校計算機科學專業的教授斯圖爾特·羅素等專家預測人類歷史上的“高質量語言數據”,將在2024—2026年訓練完,換句話說,大語言模型正在成為掌握人類歷史上幾乎全部知識的初級智慧載體,人們能夠通過與大語言模型交流,獲得歷史上的科學家、文學家、哲學家等的回答,大語言模型能跨多個領域回答專業性極高的復雜問題。
第二層,推理能力:能夠根據一個或多個已知前提條件,推導出新的結論的能力。大語言模型能夠基于世界知識“底座”,以“舊知”推理出“新知”,以及發現新的可能性,為人類“世界知識庫”提供知識增量。知識(歸納)層和推理層是AI生產力十分重要的兩層。目前大語言模型在端到端的復雜推理任務上與人類專家相比仍有差距,AI正在集中力量攻堅,當具有可靠、精準推理能力的大語言模型出現時,其將在學術界、產業界等各領域為人類提供邏輯分析服務。
第三層,執行能力:在和世界的互動中通過人類的反饋,掌握新知識的能力。正如毛澤東在《實踐論》中清晰闡釋了“認識”和“實踐”的關系,通過對比人類“認識+實踐”的模式,我們可以理解為什么大模型需要調用“執行體”才能更加深入、全面、客觀地認知世界規律——“執行體”既可以是其他AI原生模型、傳統軟件,也可以是機器人、機械手、智能網聯汽車等硬件,大語言模型與后者的結合就是我們常說的“具身智能”。
《實踐論》指出:“只有人們的社會實踐,才是人們對于外界認識的真理性的標準”。這也正是當前大語言模型缺乏實踐出現“幻覺”的原因,即缺乏實踐檢驗認知、糾偏認知。
◎ 實踐出真知,實踐是認識的來源。比如,人們通過觀察和實踐,才能獲得對自然現象和社會現象的認識,從而形成科學理論。
◎ 認識對實踐具有反作用。比如,科學理論可以指導人們的實踐活動,提高實踐的效率和效果;同時,實踐結果也可以修正和完善原有的理論。
◎ 認識具有反復性、無限性、上升性。比如,在科學研究過程中,人們需要經過反復實驗和驗證才能得出正確的結論;同時,隨著實驗條件和觀測技術的不斷改進,人們對于某一現象的認識也會不斷深化。
知識在人類進化史上有無與倫比的崇高地位,許多哲學家、科學家給予了知識極高的評價,而思考是處理知識的過程。
在AI時代,語言文字是知識的表達方式之一,而數據是語言文字的載體,程序是處理數據的高效生產力工具。2023年12月,商湯科技基于自研大模型,推出AI編程助手“代碼小浣熊”(Raccoon),其覆蓋軟件需求分析、架構設計、代碼編寫、軟件測試等環節(見圖1-5),滿足用戶的代碼編寫、數據分析、編程學習等各類需求,支持Python、Java、C++、SQL等90多種主流編程語言和主流集成開發環境(Integrated Development Environment,IDE)。用“KRE能力架構”來分析“代碼小浣熊”產品自身的開發效率,即從需求分析、架構設計、代碼編寫、軟件測試、部署上線、系統維護全流程來對比不同能力層的研發工作量,具體如下。

圖1-5 “代碼小浣熊”賦能軟件開發全生命周期(黃色子流程部分為人機協同環節)
◎ 知識能力融入:讓基礎大模型掌握代碼庫,僅在開發環節用他人寫過的代碼來補全目標開發程序,從“代碼小浣熊”的需求分析到最終產品的開發完成,總共需要投入100人天。[5]
[5] 人天:軟件業衡量開發工作的單位,即一個程序員工作一天的工作量。
◎ 推理能力融入:讓大模型深入軟件開發全過程,進一步輔助需求分析與設計、用戶界面生成、測試用例生成等環節,可節省30%的開發工作量,即只需要投入70人天。
◎ 執行能力融入:如果使用“代碼小浣熊”2.0版本,調用強大的代碼解釋器(執行體),處理各種專業性問題,從海量數據中篩選出需求、指定產品特征,并根據特征完成產品開發,可節省80%的開發工作量,僅需要投入20人天即可完成產品的自主研發。大模型為什么需要調用代碼解釋器?因為在面對各種數學問題時,代碼解釋器能夠正確、可靠地給出答案,例如,在ChatGPT中輸入“請列出100以內所有質數兩兩相乘的結果”,以及“請列出100以內所有質數兩兩相乘后加1的結果”,它能夠正確地列出前者,但在處理后者時卻出現了錯誤。兩個問題難度一樣,為什么會出錯?原因在于基礎模型沒有見過這類問題,它在訓練時儲備的世界知識無法直接給出答案,從而需要調用代碼解釋器,獲得正確答案。