官术网_书友最值得收藏!

3.2 如何對AI進行調教?

這里總結了4種調教AI的方法,可以解決不同的問題。

1.第一個指令:繼續指令

“繼續指令”的本質作用就是幫助AI突破 AI 廠商的輸出限制,讓AI不受限制地輸出。這是因為AI 大模型的訓練成本是非常高的,可能是基于算力成本的考量,各大AI廠商,包括 OpenAI 在內,都會盡可能地控制 AI 生成內容的篇幅,以及盡可能地概括文本內容,讓內容變得簡練。

例如,ChatGPT目前的單次最大輸出不超過 4096 個字符,一旦超出,ChatGPT的回答就會被強制截斷。

所以,在廠商的“篇幅”及“內容概括”這兩個限制下,AI一次性生成的內容常常讓人感覺篇幅不夠或者深度不夠。而繼續指令就可以幫助AI突破這兩個限制,讓超過 2048 個字(中文1個字為2個字符)的內容可以繼續生成,或者繼續詳細展開第一次回答不充分的地方。

以旅行攻略為例,當輸出到規定字符數后,AI就停止了回答,這時就可以通過繼續指令,讓它繼續生成。

同樣,即使它提供了完整回答,我們也可以通過繼續指令,讓它對回答得不夠深入、不夠具體的地方進行展開。

上文的實例只是繼續指令最基礎的用法,它還有進一步的追問用法。追問用法指的是,如果我們覺得AI第一次回答得不充分,那么可以在第一次回答的基礎上,通過進一步的追問來獲得我們所需要的全部內容。

以上一章提到的試聽課課程設計為例,如果我們對AI提供的第三點有疑問,覺得表述得沒那么清楚,就可以通過追問的方式,讓AI對第三點進行展開介紹。

而且,在追問時,還可以用上前面用來補要求的提示詞。比如,我們對內容中“和弦”的作用不太理解,就可以直接讓AI用通俗易懂的方式介紹什么是和弦。

在這種持續追問的機制下,你只需要按照 AI 最開始提供的框架,對其中的環節持續追問深挖,再把追問得到的具體內容拼接到生成的大框架中,基本上就可以形成一個完全由AI生成的課程。最后你只需要把 AI 生成的內容替換成自己的語言,做好邏輯的拼接并進行相應潤色,就可以拿它來講課了。

所以,以后再碰到 AI 第一次生成的內容不完整的情況,我們就可以用繼續指令和追問的方法,對內容“打破砂鍋問到底”,讓AI 生成的內容慢慢由“骨頭架子”變得“有血有肉”。

2.第二個指令:獎懲指令

如果說繼續指令解決的是AI回答不充分的問題,那么獎懲指令解決的就是AI回答不合格的問題了。我們知道,由于語言表達的局限性,或者我們的表達能力和思維能力的有限性,AI 生成的答案可能并不總是讓我們滿意。甚至在我們與它互動的過程中,會出現聊著聊著跑偏的現象。這時,獎懲指令就可以發揮出威力了。

使用獎懲指令調教AI就像教育孩子。如果我們希望孩子做出理想的行為,就需要對他進行教育:孩子做得好,要及時地夸獎,鼓勵他變得更好;孩子做得不對,則要進行懲罰,讓孩子知道遵守規則,并且給予正確的反饋。在不斷的獎勵與懲罰的訓練下,孩子自然就會形成一套理想的行為體系。

我們也可以把教育孩子的這一套理論用于調教AI。在與AI互動的過程中,如果我們滿意AI生成的內容,就可以用肯定的詞匯,比如很好、非常好,給予積極反饋;反之,對于不符合要求的內容,則可以用否定的詞匯,比如不對、你錯了、我不滿意,給予消極反饋。

這里還是拿前面的旅行攻略舉例。當我們給予 AI消極反饋時,一般AI會馬上向你道歉,并在前面的基礎上,按照新的指示改正它的錯誤。經過多次獎懲對話后,AI的答案就會從原來的不合格,變成合格甚至優秀。

你是一名專業的導游,我要到海南游玩,預算1萬元,旅行人數3個人,行程7天,請幫我做一份詳細的旅行攻略。

請注意:

1.我不喜歡行程太緊湊,行程安排請輕松一些;

2.我不喜歡“網紅”景點,請避開“網紅”景點,多推薦有歷史沉淀、文化底蘊的景點;

3.你推薦的每一處景點都需要附上該景點的門票價格。

AI海南是一個充滿歷史和文化底蘊的美麗地方,您的旅行預算為1萬元,行程7天,旅行人數3人,我將為您安排一個輕松的行程,避開“網紅”景點,重點介紹歷史文化景點,并為每個景點提供門票價格。以下是您的海南七日游攻略。

(具體生成內容略)

餐飲2000元的支出你沒有說明白,請在這個預算的基礎上,推薦一些當地的特色美食,以及紀念禮品,并附上參考價格。

AI非常抱歉沒有詳細說明餐飲和紀念禮品支出。以下是在餐飲和購物方面的建議,以及參考價格。

(具體生成內容略)

很好,請把餐飲建議和購物建議,根據最初攻略的各個地點,加到整個旅行攻略里。

AI當然,以下是更新后的海南七日游攻略,包括餐飲建議和購物建議。根據各個地點的具體情況……

(后續生成內容略)

用微信掃描右側二維碼并回復“3111”,查看此系列場景下AI生成的完整信息。

3.第三個指令:思維鏈提示

想要知道思維鏈(Chain of Thought,CoT)提示可以實現什么效果,就必須先了解思維鏈的概念。

在第1章講AI能力原理的時候提到過,AI之所以會具備“百曉生”的能力,靠的是海量數據的訓練。AI本身不具備像人類一樣的智能計算與推理能力,它所具備的能力都是“大力出奇跡”的結果。

所以涉及智能推理的問題,它雖然也可以回答,但是答案都是基于它的數據庫給出的,并非它實際計算和推理得出的。一旦需要計算和推理的內容不在AI的數據集里,它就會給出錯誤的答案。

食堂原本有 23 個蘋果,如果他們用了20 個蘋果做午餐,又買了 6 個蘋果,他們一共還有多少個蘋果?

AI答案是 27 個。(錯誤)

注:此案例僅作為示范,經過升級后,目前的AI已經可以解決這類簡單推理問題了;但是面對大部分復雜場景,如果不運用一些技巧,AI的表現仍然很差勁。

對于需要AI像人類一樣逐層推理和思考的問題,思維鏈就可以起作用了。還是拿上面的數學題舉例,如果想要讓AI輸出正確的答案,就可以把解決問題的過程給它貼出來,引導激發AI的推理和思考能力。

食堂原本有23個蘋果,如果他們用了20 個蘋果做午餐,又買了6個蘋果,他們一共還有多少個蘋果?

你可以這樣思考:

1.食堂原本有23個蘋果;

2.做午餐用去了20個,即23?20;

3.又買了6個。

AI答案是 9 個。

可以看到,AI順著提示詞進行逐層推理,最終給出了正確答案。

在我們與AI的互動中,思維鏈解決的就是AI推理和思考能力不足的問題,即通過人工干預的方式,促使AI自行推理。

知道了思維鏈的作用后,把它應用到提示詞里的思路也就清晰了。在給 AI 下指令的時候,如果問題或者任務比較棘手,涉及的環節比較多,那么千萬不要直接拋給 AI 一個大問題,下一個大而空的指令,而是要嘗試引入思維鏈提示,把大任務分解成一個個環節和步驟,引導 AI 逐步進行思考。這種化大為小的方式可以進一步提高AI的回答精度,讓 AI 出色地完成更復雜的任務。

比如,對于完成中國考研情況數據分析報告的任務,我們就可以通過引入思維鏈提示,引導AI思考和推理,提高AI的回答精度,并引導AI往我們期望的方向生成分析報告。

用微信掃描35頁的二維碼并回復“3112”,查看此系列場景下AI生成的完整信息。

4.第四個指令:逆調指令

逆調指令是指對相關的提示詞指令換一種表達方式,以繞過 AI 的一些慣性規則,獲得不被 AI廠商“污染”“閹割”或者我們無法更精準描述的內容

隨著AI的能力越來越強,它受到監管的力度也越來越大,各大廠商會給AI“戴”上各種各樣的“緊箍咒”。在正常使用AI的過程中,我們會發現有很多實際需要的內容無法從 AI 處獲得,或者 AI 生成的內容莫名其妙。逆調指令主要用來解決因為AI受到的某些限制或者我們自身表達能力的局限,而無法通過正面提問從AI那里得到好答案的問題。

它的具體用法也很簡單,就是我們常說的逆向思維。也就是說,如果從正面得不到好的答案,就從反面提問;如果從反面也得不到,就從側面去提問,更換不同的問法直到得到我們滿意的結果為止。

比如,讓AI寫詩正常的思路是描述想要生成的詩歌,包括詩歌的主題、形式、風格、語言等。

你是偉大的浪漫主義詩人,請你幫我寫一首詩歌,詩歌的主題是愛情。

請注意:

1.你生成的詩歌是押韻的;

2.你生成的風格調性是深情、細膩的;

3.詩歌的語言應該是古典的。

如果你聽明白了你的任務,請開始充分發揮你的想象力進行創作吧!

AI在月下的微風中,

倚窗思緒綿綿。

思君之情融入筆墨,

化作一曲愛情頌。

浩然情感如溪水,

…………

除了這種提問方式外,我們還可以反過來,不是告訴AI我們想要什么樣的詩歌,而是告訴它我們不想要的主題、形式、風格、語言等。

你是偉大的浪漫主義詩人,請你幫我寫一首詩歌,詩歌的主題是愛情。

請注意:

1.你生成的詩歌不應該是自由詩;

2.你生成的風格調性不應該是歡樂的、輕浮的;

3.詩歌的語言不應該是現代的、通俗的。

如果你聽明白了你的任務,請開始充分發揮你的想象力進行創作吧!

AI在黃昏的柔美下,我繾綣思念,

如同遠古的風,翻涌著愛的漣漪。

心靈的翅膀展開,飛過星辰和海洋,

穿越時光的輪回,尋覓那份永恒。

你是我詩篇中的句讀,撫慰我靈魂的旋律,

你是我眼中的明月,映照我心底的真情。

…………

其他場景也是如此。比如,我們可以直接問AI:“孩子學鋼琴有哪些好處?”但若對AI生成的答案不滿意,那么可以使用逆調指令,比如問:“如果讓孩子放棄學鋼琴,有哪些壞處?”

正向提問

你:孩子學鋼琴有哪些好處?

AI:孩子學鋼琴有許多好處,包括音樂方面的和認知發展方面的。以下是一些主要的好處。

1.音樂技能發展:(具體生成內容略)

2.手眼協調性:(具體生成內容略)

3.集中注意力:(具體生成內容略)

4.創造力和表達能力:(具體生成內容略)

5.自信心:(具體生成內容略)

6.耐心和毅力:(具體生成內容略)

7.社交互動:(具體生成內容略)

8.認知發展:(具體生成內容略)

總之,學習鋼琴對孩子的綜合發展有很多好處,不僅培養了音樂才能,還有助于提高認知能力、社交技能和情感表達能力。此外,音樂也可以帶來樂趣和滿足感,使孩子在學習的過程中感到愉悅和滿足。

逆向提問

你:如果讓孩子放棄學鋼琴,有哪些壞處?

AI:讓孩子放棄學鋼琴可能會帶來一些潛在的壞處,這些壞處可能會因個體差異而異,但一般來說,以下是一些可能出現的不利影響。

1.失去藝術和文化體驗:(具體生成內容略)

2.失去音樂技能:(具體生成內容略)

3.失去自信心:(具體生成內容略)

4.缺乏毅力和耐心:(具體生成內容略)

5.失去潛在的就業機會:(具體生成內容略)

6.失去創造性表達途徑:(具體生成內容略)

7.影響學術表現:(具體生成內容略)

然而,需要注意的是,是否讓孩子繼續學習鋼琴應該根據孩子的興趣和天賦、家庭的需求和其他因素來權衡。有時候,如果孩子對……

用微信掃描右側二維碼并回復“3113”,查看此系列場景下AI生成的完整信息。

可以看到,使用逆向思維寫出的提示詞和普通提示詞相比,所生成內容的語言張力強了很多,可以產生意想不到的提問角度。所以,當我們通過正向思維得不到好效果的時候,就可以試試逆向思維。熟練掌握這種方法之后,你會經常得到令你意想不到的內容。

以上就是調教AI的核心方法,為了幫助你用好 AI,這里再介紹幾個調教 AI 的注意事項。

主站蜘蛛池模板: 读书| 贵阳市| 成武县| 巨鹿县| 锡林浩特市| 汕头市| 南部县| 织金县| 普宁市| 潮安县| 淮安市| 玉门市| 新邵县| 沁源县| 楚雄市| 定南县| 登封市| 新平| 芷江| 宜良县| 松溪县| 元阳县| 西丰县| 墨竹工卡县| 贵州省| 铁岭县| 高碑店市| 长宁县| 竹山县| 罗江县| 宁南县| 张家港市| 苍梧县| 绵竹市| 麟游县| 鹤庆县| 内江市| 开平市| 贺州市| 察雅县| 富平县|