官术网_书友最值得收藏!

譯者序 沒有誰天生就是AI工程師

何文斯

從 2022 年末開始,以 ChatGPT 為代表的新一輪AI熱潮 GenAI(生成式 AI)以前所未有的速度席卷全球。我們幾乎每周都可以看到 GenAI在各個領域的新用途:它可以回答各種問題、翻譯文章、撰寫報告、寫一段有創意的營銷文案、在編程項目中生成代碼,甚至能夠“看”到圖片并為我們解釋其所蘊含的深刻意義。

我相信,LLM 將在未來驅動一場技術變革,無論是以 GPT 為代表的閉源模型,還是以 DeepSeek 為代表的開源模型,都將推動LLM技術的快速普及。隨著算力的規模化提升,模型的訓練和推理成本都將大幅度下降。同時,多模態的演進、智能體架構的成熟,會促進AI領域產生大量的創新場景,這也將推動AI應用生態系統的爆發性增長。LLM 將重塑人類與技術的交互方式,催生出一個更加智能、高效的數字化世界。AI不僅是工具,更將成為新一代計算平臺的核心,驅動未來的創新浪潮。

全世界最大的代碼托管平臺 GitHub 在其報告中指出 1,2023 年的 GenAI項目數量同比增長了 248%。大量的開發人員正在學習 GenAI技術,并將新技術用于增強原有產品或者構建全新的AINative 應用程序 2。AI正在成為產品的核心組件。另外,與以往“傳統”的AI技術不同的是,LLM 使個人構建AI項目變得更加容易。據 GitHub 的報告統計,由個人主導的AI項目的數量同比增長了 148%,這一數字在近一年仍在快速增長。

1 數據參見“Octoverse: The state of open source and rise ofAIin 2023”。

2 AINative 應用程序是指從設計之初就內置了AI技術的應用程序。這類應用程序與傳統的應用程序不同,因為它們不是在現有框架上添加AI功能,而是將AI集成為其核心組成部分。

作為國內較早投身于 GenAI領域的產品經理和LLM應用技術的科普作者,我拿到這本書原稿的第一反應是,對于LLM驅動型應用程序的專業開發人員來說,這樣一本小冊子的知識量顯得不足,這是因為我將自己代入了讀者角色。實際上,這本書的目標讀者并非已經做過LLM驅動型應用程序開發的專業開發人員,他們中的大多數可能向 ChatGPT 等聊天機器人提過問題,但對LLM相關技術沒有太多關注,甚至可能一無所知。

在閱讀完這本書之后,我發現作者正是考慮到了這一點,才以初學者的視角,為讀者提供了清晰、全面的“最小可用知識”,目的是讓開發人員快速上手實踐,輕松體驗到獨立搭建第一個AI應用程序的樂趣。比如,書中的示例包括打造《塞爾達傳說:曠野之息》專家、開發 YouTube 視頻摘要生成器等,你完全可以將這本小冊子當成自己的LLM項目快速啟動手冊。

2022 年底,OpenAI經過一系列的工程技術處理,將 GPT 模型以一個自然語言交互應用形態(ChatGPT)推向市場。之后,領域從業者及愛好者才有了機會廣泛接觸和理解LLM及其背后的技術。比爾?蓋茨在 GatesNotes 網站上發表的一篇文章提到 3,LLM 將徹底改變每個人與計算機的交互方式,還將顛覆軟件行業,引發從鍵入命令轉向點擊圖標以來計算機領域最大的人機交互革命。在接下來的 5 ~ 10 年中,隨著AI服務成本的降低,人類將進入全民AI時代。AI將不再僅屬于少數技術人員,任何可以上網的人都將能夠擁有一個由AI技術驅動的個人助理。AI助理會更加個性化,它將了解你的個人和工作關系、愛好和日程,可以幫助你接收和發送電子郵件、安排旅游行程、預訂電影場次,為你的家庭理財配置提供建議等。在可預見的未來,掌握基本的AI知識將像現在掌握基本的計算機知識一樣成為每個人的必備技能,每個人都將或多或少地具備定義AI的能力。

3 參見“AIis about to completely change how you use computers”。

對初學者而言,進入一個全新的領域無疑需要克服心理上的恐懼,對于像機器學習、自然語言處理這些直覺上技術門檻很高的領域更是如此。但接下來我要講一個關于 OpenAI聯合創始人 Greg Brockman 的個人故事。

Greg Brockman 在 2019 年 7 月發表了一篇題為“How I became a machine learning practitioner”的博客文章,講述了自己學習機器學習技術的歷程。Greg 在加入 OpenAI之前是 Stripe 公司的首席技術官,雖然已經是一位技術“大牛”,但他直到加入 OpenAI3 年之后才開始以初學者的身份學習機器學習技術。在學習過程中,雖然有 OpenAI同事的幫助,但他也跟普通人一樣遇到了很多障礙和挫折,甚至自我懷疑,不過他最終還是堅持了下來。經過 9 個月的深入學習,Greg 成功地從傳統軟件工程師轉型為機器學習工程師。沒有誰天生就是AI工程師,即使是 OpenAI的聯合創始人也需要學習。我希望這個真實的故事能對正準備投身于AI領域的你有所幫助。

任何一項新技術都存在一條技術成熟度曲線,LLM 技術在當下尚未邁入生產成熟期。自 2023 年本書第1 版出版至 2025 年,GenAI技術以驚人的速度發展著。我不時感慨,在個人職業生涯中,我從沒有任何一個階段像現在一樣需要快速迭代知識。在日常工作中應用新的AI技術,一方面在很大程度上提高了我的生產力;但另一方面,因為每天不停歇地關注AI領域的最新進展,同時興奮地研究新技術,我的工作總量反而增加了。這既讓我感到興奮,又讓我深刻地感受到作為一名AI技術從業者所面臨的挑戰。

可以預見的是,在這本書上市之后,無論是 GenAI,還是基于LLM的應用程序開發,抑或是其他相關領域,都仍將繼續以不可思議的速度發展。這就意味著,無論是編寫一本技術書,還是成為相關技術領域的從業者,都需要抱著開放的心態,時刻擁抱新的變化,持續迭代自己的知識,更重要的是,樂于上手實踐。

回到這本書,兩位作者提供了非常清晰、系統的知識脈絡,為想學習使用LLM構建應用程序的 Python 開發人員提供了全面的技術指導。這本書對于LLM驅動型應用程序開發初學者非常友好,有助于快速了解 GPT 等模型的原理特性,并學習如何使用流行的編程語言 Python,以及當前最先進的開發框架(如 Assistants API、LangChain、LlamaIndex 等),快速構建基于AI技術的解決方案。最有幫助的是,本書系統梳理了LLM應用開發的原則及相關理念,并通過典型應用示例予以解釋,方便開發者在上手實踐的過程中理解。

通過這本書,你可以學到以下核心知識:

● GPT-4 和 GPT-3.5 的基本原理和優勢,以及它們的工作方式;

● 如何將這類模型集成到基于 Python 的自然語言處理應用中;

● 使用 OpenAI API 開發文本生成、問答、內容摘要等初級應用;

● 進階主題,包括提示工程、為特定任務微調模型、RAG、插件、LangChain、LlamaIndex、GPTs 以及智能助手等。

這本書原版第1 版上市于 2023 年 8 月,第2 版上市于 2024 年 7 月。在這近一年之間,OpenAI發布了 Assistants API、GPTs 應用商店,以及 GPT-4 Turbo with Vision、GPT-4o 和 GPT-4o mini 系列模型等相當多令人驚喜的更新。除此之外,圍繞LLM的技術工程三大范式(提示工程、微調、RAG)正在發生變化,市場上衍生的各類開發框架為開發者提供了便利,并幫助AI創新者從概念驗證走向生產,而第2 版著重體現了這部分內容。

雖然譯者已經仔細對書中的內容做了技術審校,但由于這一領域現象級的技術更替速度,這樣的工作仍難以保證當你拿到這本書時,書中所介紹的技術或引用的插圖還能代表最新進展。因此,我強烈建議你在閱讀過程中,結合 OpenAI的最新開發文檔來進行具體的開發實踐。

學習一個全新的領域需要動機、熱情、堅持和方法。能讀到這篇譯者序,說明你已經具備了最初的動機,可能是純粹的好奇心,也可能是提升職業技能的意愿,這已經是一個很好的起點了。

同為這個領域的學習者,我想與你分享 Y Combinator 的聯合創始人、《黑客與畫家》作者 Paul Graham 在其個人博客網站上發表的一篇文章——“Superlinear Returns”(《超線性回報》)。他在文章中提到,我們在學習過程中的投入與回報是超線性的。在開始閱讀這本書時——

● 你可能會對大量的術語和技術概念感到茫然無措;

● 你可能還需要查閱除這本書之外的其他資料;

● 你可能會擔心按照這樣的學習速度無論如何都達不到預期目標;

● ……

焦慮會時不時找上門,但請放心,為了獲得一個扎實的立足點,最初的努力雖不輕松,但絕對值得。隨著實踐的深入,這個過程會變得越來越容易。這就是“超線性回報”——隨著時間的投入,獎勵曲線會在后期急劇上升。

最后,祝愿你能早日寫出充滿創意的AI應用程序,并在這個探索過程中找到樂趣。

主站蜘蛛池模板: 安福县| 昌黎县| 延寿县| 田林县| 山东省| 宜宾县| 霍邱县| 壶关县| 镇巴县| 彭山县| 察哈| 通山县| 邯郸县| 南汇区| 炉霍县| 博乐市| 富锦市| 嘉鱼县| 琼结县| 深水埗区| 东港市| 德州市| 化州市| 合山市| 万州区| 贡嘎县| 资中县| 梁平县| 青河县| 白沙| 平陆县| 黄龙县| 玛沁县| 类乌齐县| 吉木萨尔县| 惠州市| 西丰县| 台东市| 贵港市| 兴和县| 和田县|