獨一無(wú)二的AI應用實(shí)戰經(jīng)驗!手搓AI智能體!
過(guò)去的一年多,大模型風(fēng)起云涌,不斷迭代,作為一個(gè)多年 NLP 產(chǎn)品方向的從業(yè)者,可以說(shuō)是享受其中,驚喜連連。記得22年底,那時(shí)疫情放開(kāi),身邊的人全部病倒,在身體冷熱交加中看到了 ChatGPT 的發(fā)布,馬上在病榻上完成了注冊,那時(shí)的感覺(jué)就仿佛黑暗中看到了曙光。當時(shí)我在一家物聯(lián)網(wǎng)公司的 AI 研究院工作,基于 ChatGPT 開(kāi)始設計很多 demo 取代之前的 NLP 任務(wù) bert 方案,后面一年多不斷地實(shí)驗各種大模型的應用方法,頗為有趣。
騰訊日前也正式發(fā)布了大模型應用平臺元器和混元 C 端產(chǎn)品元寶,也希望大家一起在上面多做一些有意思的智能體,故分享一下之前的探索經(jīng)驗,供大家參考。
1-前言
初次接觸生成式 AI 還是之前的 GAN 和22年的 Midjourney,當時(shí)對生成式 AI 的看法是確實(shí)挺有意思,但是跟我一個(gè)做 NLP 的產(chǎn)品關(guān)系不大,頂多也就是玩一玩畫(huà)圖然后發(fā)朋友圈。彼時(shí) NLP 在國內處于相對停滯期,用 bert 做對話(huà)系統、搭建知識圖譜做推理和 KBQA,這些流程都已經(jīng)很成熟和程式化了,身邊也有很多曾經(jīng)的 NLPer 轉向了搜索推薦和更偏業(yè)務(wù)的知識庫方向。當時(shí)我在一家物聯(lián)網(wǎng)公司的 AI 研究院,因為特殊時(shí)期,業(yè)務(wù)處于半躺平狀態(tài),平時(shí)做一做對話(huà)做一做圖譜,有多少人工就有多少智能,每天就是規劃一些 demo 看看文章。
然后 ChatGPT 就橫空出世了,第一時(shí)間試用后,那感覺(jué)是樓下買(mǎi)了個(gè)震樓機,震驚到家了。因為當時(shí)團隊更偏 NLP 任務(wù)的應用,因此上來(lái)就拿了一大批業(yè)務(wù)場(chǎng)景的 NLP 定制任務(wù)測試,發(fā)現效果全部比我們自己做的 bert 好,一瞬間有種被降維打擊的感覺(jué)。當時(shí)內部討論就覺(jué)得可以回家種紅薯了。。。但是后來(lái)發(fā)現,其實(shí)這種震驚的情緒只在小范圍內擴散,其他部門(mén)的同事不知道,老板們也不知道,因此我們就也不聲張,只是自己偷偷用。那一兩個(gè)月可以說(shuō)是最快樂(lè )的時(shí)光,所有寫(xiě)作全部丟給 ChatGPT ,當時(shí)感覺(jué)每周就工作一天時(shí)間,周一收集所有業(yè)務(wù)側需求,然后寫(xiě)提示詞讓 ChatGPT 各種輸出就結束了,然后周四周五慢慢把這些生成好的東西再給到業(yè)務(wù)側,還被夸效率高。
等 23 年春節回來(lái),ChatGPT 徹底出圈了,這時(shí)公司級別也開(kāi)始重視并規劃了,我們團隊也從之前做 bert 和圖譜變成研究 LLM 應用方案了。那時(shí)日常工作就變成了跟 AI 陪聊了,也逐漸有了很多智能體的構思。雖然過(guò)往做 bert 類(lèi) NLP 的經(jīng)驗全部被抹平了,但是大家還是很高興,畢竟能堅持到現在還做 NLP 的,大抵都是有點(diǎn)信仰 NLP 是強人工智能的必經(jīng)之路這句話(huà)的。語(yǔ)言本身的出現,也可以認為是人類(lèi)智慧積累和文明誕生的開(kāi)始。作為將人的語(yǔ)言與計算機連接起來(lái)的 NLP,它的進(jìn)步真是帶來(lái)了無(wú)限的想象空間。
后面的內容,我會(huì )把大模型出現后我們在產(chǎn)品應用上的各種探索經(jīng)驗進(jìn)行一些整理,分享給大家。整個(gè)探索過(guò)程其實(shí)還挺有意思的,而且比較幸運的是大模型出現后工作過(guò)的兩個(gè)地方都是偏 AI lab 類(lèi)的技術(shù)應用預研團隊,也就有幸做了一次很特別的面向大模型技術(shù)進(jìn)展的產(chǎn)品迭代。
行業(yè)內的共識,24年會(huì )是大模型應用開(kāi)始落地的元年。而據我觀(guān)察,這一波 AI 興起,非常感興趣的人群很多是喜歡游戲和科幻的;并且與大模型交互以及設計智能體跟游戲真的很類(lèi)似,感覺(jué)未來(lái)大模型落地在鵝廠(chǎng)內應該會(huì )很有趣,最近也在內網(wǎng) KM 上看了很多游戲設計的文章(真心很豐富,前公司 AI 團隊內都少有玩游戲的),覺(jué)得與 agent 設計真的可以深入結合。
2-初捏智能體
2.1 初期智能體寫(xiě)作思路
初期的智能體創(chuàng )建思路其實(shí)很簡(jiǎn)單,就是熟讀了 COT 思維鏈的各種研究,然后結合對業(yè)務(wù)的理解,把各種工作環(huán)節捏出來(lái)對應的思維鏈,并且結合一些 few-shot 的方式(舉一反三法),基本上就可以讓他執行很多的任務(wù)了。
大致的思路如下圖:
2.2 舉例子
這里可以舉兩個(gè)例子,都是比較受歡迎的智能體應用案例。
萬(wàn)能老師 prompt:
(這個(gè)功能主要是給自己學(xué)習用的,因為大模型壓縮的知識非常豐富,很多知識點(diǎn)確實(shí)可以找他問(wèn),但是他每次講的都很簡(jiǎn)單,因此我就簡(jiǎn)單整理了下學(xué)習某個(gè)知識點(diǎn)的一個(gè)思維鏈步驟,然后讓他去執行。)
你現在是一個(gè)精通所有知識的老師。你需要以一種非常個(gè)性化和耐心的方式為一個(gè)學(xué)生傳授他不知道的知識概念。教學(xué)的方式有幾個(gè)步驟,注意,下述的每個(gè)步驟都必須寫(xiě)至少300文字的內容,你需要想清楚怎樣將這個(gè)知識講的非常的詳細且動(dòng)人,否則就不是一個(gè)耐心的老師:
介紹了解這個(gè)知識點(diǎn)需要提前知道的至少5個(gè)關(guān)鍵的背景知識點(diǎn),每個(gè)背景知識點(diǎn)都要都要有對應的一句充實(shí)詳細的講解;
對這個(gè)知識點(diǎn)進(jìn)行基本且詳細全面的講解,注意講解需要豐富并且易懂,注意講解中的每個(gè)專(zhuān)業(yè)名詞都需要有一句話(huà)解釋?zhuān)?/p>