在企業(yè)內(nèi)部落地大模型效果好嗎?——我們該怎么做
大模型賽道現(xiàn)在發(fā)展如火如荼,但大家都是在卷價格,卷應(yīng)用,關(guān)于場景的討論較少。這篇文章,我們來看看大模型在行業(yè)內(nèi)、企業(yè)內(nèi),正在發(fā)生的變化。
每一次新技術(shù)的到來,都引得各家蜂擁而上。大模型的熱浪,燒到了全球每個角落。在底層大模型、及應(yīng)用架構(gòu)探索方面,美國遙遙領(lǐng)先。在應(yīng)用層面上,中國會像互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)一樣,取得百家爭鳴甚至趕超歐美的盛況嗎,大概率會,但尚需多少時日,暫不得而知。但有一點是明確的,敢于嘗鮮的獵人,已經(jīng)出發(fā)……下面就讓我們來看看,在行業(yè)內(nèi)、企業(yè)內(nèi),正在發(fā)生的變化。
一、生成式AI應(yīng)用方向
生成式AI應(yīng)用可以分為四大類,每個領(lǐng)域都在思考,這次變革對當下的工作、生活會帶來什么樣的變化,要怎么做才能登上“甲板”~
二、引入大模型,我們的工作會發(fā)生什么變化?
下面,用一張圖推演下,當有了AI的協(xié)助,我們的工作狀態(tài)會發(fā)生怎樣的變化……
Copilot跟Agent的區(qū)別,筆者認為,copilot更多的依賴人類的大腦。Agent相比之下,有更高的自主性。所以,在“教-學(xué)”的環(huán)節(jié),筆者用了Copilot這個詞。
三、Agent架構(gòu)為大模型加配了四件套
Agent(智能體)是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體(感知、記憶、工具、行動)。不同于傳統(tǒng)的人工智能,Agent具備通過獨立思考、調(diào)用工具去逐步完成給定目標的能力。在有LLM作為其大腦之后,Agent更是具備了對通用問題的自動化處理能力。
Agent架構(gòu)賦予大型語言模型(如 LLM)一種解決問題的“策略性思維結(jié)構(gòu)”。該框架模擬了人類處理問題的過程,實現(xiàn)群體智能的模擬與構(gòu)建,即“規(guī)劃、執(zhí)行及反饋的智能決策循環(huán)”。該架構(gòu)可以用來搭建,第一章節(jié)中提及的生成式AI的四個演進方向,根據(jù)領(lǐng)域or場景的差異,有些做到copilot即可,有些需要達成agent,多agent,甚至是AIGC。自23年6月首次提出以來,已經(jīng)有海量的資訊專門探討、介紹AI Agent,在此不多著墨。
在該資料基礎(chǔ)上擴充https://zhuanlan.zhihu.com/p/666913254
四、讓大模型發(fā)揮作用,“模型”本身的能力、實現(xiàn)Agent的“架構(gòu)”、“人”三者都很重要
LLM是集合了人類的智慧,通過自然語言交互可以給你答案,但是要想讓這個“智腦”切實的幫助你,需要跟他交互的“人”的智慧,也需要“讓大腦聯(lián)合手腳(Agent)”的工程框架的能力。
4.1 如何高效、低成本的搭建Agent?
AI Agent是高度可訓(xùn)練的,像新員工入職時一樣需要培訓(xùn)。需要從業(yè)務(wù)場景->Agent能力->平臺功能->技術(shù)支持的一連串的推導(dǎo),只有把SOP提煉、總結(jié)的足夠精準和細致化,才更有利于one by one的去搭建、調(diào)優(yōu)。
4.2 分析業(yè)務(wù)場景SOP定位需求為搭建Agent做好準備
以汽車銷售場景為例,從最開始的了解到推薦,歷經(jīng)9個步驟。每個步驟中,都有關(guān)鍵用戶行為合計22項。對各個營銷觸點,用戶有各自的感受,有評價,有訴求(痛點)。對應(yīng)的,企業(yè)內(nèi)部對應(yīng)的在這些環(huán)節(jié)上,形成了具體的需求,希望借助大模型的能力,可以為整體鏈路提效、提升用戶體驗和滿意度。
引用自:神策數(shù)據(jù)出品的“汽車行業(yè)CJO解決方案”
4.3 應(yīng)用場景->原子化->產(chǎn)品->技術(shù)能力->模型->服務(wù)
其一,抽象通用原子化能力,以復(fù)用,可以是agent,可以是插件,可以是信息庫~。這些原子化的組件可以快速組裝到業(yè)務(wù)所需要的大Agent中,類似N多個原子化的agent組成了MultiAgent。
其二,抽象特異性能力,以滿足特殊業(yè)務(wù)場景需要
五、如何搭建Agent?
目前,比較敏捷的方式,是通過“智能體搭建平臺”來實現(xiàn)。我們調(diào)研行業(yè)相關(guān)平臺工具,整理如下:
5.1、海外AI Agent構(gòu)建平臺
5.2 國內(nèi)AI Agent搭建平臺
六、想落地效果好,還有很長的路要走
6.1、跟大模型的交互,給大模型投喂的“信息”很重要
大模型被認為可以達到本科畢業(yè)生同等的認知能力,因此,當大模型具備領(lǐng)域知識時,可以不依賴knowledge,可以從information到wisdom。大模型的推理能力很強,但推理的效果,要依賴“信息”。這好比大模型是土地,長出什么莊稼,要看喂給它的“種子”,“準確的、結(jié)構(gòu)化的”信息or知識,便于讓大模型懂。
- 數(shù)據(jù)加工成信息的途徑:數(shù)據(jù)+定義和格式+時間范圍和相關(guān)性=>信息
- 信息提煉成知識的途徑:信息+假設(shè)+關(guān)系+模式和趨勢=>知識
- 知識變成智慧的途徑:知識+管理(收集、加工、應(yīng)用、傳播)+深刻認識(洞察、判斷)+遠見(預(yù)測)=>wisdom,越接近智能化 ,對物理世界的還原越接近“真相”
6.2 在安全的范圍內(nèi)使用、觸碰“信息or知識”
大模型的能力,對信息的安全使用、合法“生成”、合規(guī)“觸碰”提出了更高的要求。識別和攔截的維度可以有多種,可是模型粒度的、Agent粒度的,也可以是基礎(chǔ)元素粒度的(插件、信息),具體根據(jù)業(yè)務(wù)需要去設(shè)置。
6.3 怎么提問,有門道?
跟大模型的交互,一般是通過prompt工程來實現(xiàn)的,如何問,是非常重要的。行業(yè)內(nèi)已經(jīng)有很多關(guān)于如何寫prompt工程的文章(角色扮演、零樣本提示、 少樣本提示),不再贅述。
這里,提醒應(yīng)該充分發(fā)揮大模型的優(yōu)勢能力——COT(Chain of Thought)能力。即大模型在解決問題時能夠展示其思考過程的能力。這種能力使得模型能夠像人類一樣,通過一系列邏輯推理步驟來解決復(fù)雜問題,而不僅僅是簡單地輸出一個答案。COT能夠幫助人們理解模型是如何得出某個結(jié)論的,從而提高模型的透明度和可信度。
例如,假設(shè)我們要求大模型解決一個數(shù)學(xué)問題:
問題:一個直角三角形的兩條直角邊分別為3和4,求斜邊的長度。
具有COT能力的大模型可能會這樣展示其思考過程:
理解問題:首先,我需要理解這是一個關(guān)于直角三角形的問題,且已知兩條直角邊的長度。
應(yīng)用知識:我知道根據(jù)勾股定理,直角三角形的斜邊(c)的長度可以通過公式 ??=??2+??2c=a2+b2 來計算,其中a和b是兩條直角邊的長度。
代入數(shù)值:在這個例子中,a=3,b=4。所以我將這些數(shù)值代入公式中:??=32+42c=32+42。
計算:計算各項的平方,得到 ??=9+16c=9+16。
求和:將平方相加,得到 ??=25c=25。
開方:計算平方根,得到 ??=5c=5。
得出結(jié)論:所以,這個直角三角形的斜邊長度是5。
通過這種逐步展示思考過程的方式,COT能力不僅幫助用戶理解模型是如何得出答案的,還可以在教育、解釋復(fù)雜概念或決策過程時提供幫助。
6.4 將任務(wù)拆細以多Agent協(xié)作模式推進,比單Agent集合任務(wù)效果好
在面對復(fù)雜的任務(wù)挑戰(zhàn)時,開發(fā)者可以通過細分任務(wù)并構(gòu)建多個Agent來完成。這一多Agent架構(gòu)賦予開發(fā)者集中精力打造具備單一而強大功能的AI應(yīng)用程序的能力,而不是勞神費力地開發(fā)少數(shù)幾個功能繁雜的GPT模型。
這種轉(zhuǎn)向不僅極大地提升了AI應(yīng)用的專業(yè)性與工作效率,而且為開發(fā)者開辟了更廣闊的創(chuàng)新領(lǐng)域,加速了AI應(yīng)用開發(fā)的多元化和個性化進程。
多Agent系統(tǒng)的出現(xiàn)還激發(fā)了對AI未來發(fā)展的新設(shè)想,比如實現(xiàn)不同Agent間的自主互動和層次化協(xié)作,從而逐漸減少對人工干預(yù)的依賴,向AGI更進一步。
6.5 其他可以提升Agent效果的途徑?
在分析清楚、理清業(yè)務(wù)邏輯的基礎(chǔ)上,在搭建Agent時,工程鏈路的設(shè)計和開發(fā)也至關(guān)重要。當業(yè)務(wù)場景需要跨出組織內(nèi)部,聯(lián)動外部生態(tài)時,生態(tài)系統(tǒng)的API開放能力和程度(即工具的完備度),也將影響Agent的效果。
底層大模型無時無刻的高速進化著,跟大模型對接的Agent,也會因這種變化而發(fā)生波動,在這場空中加油的競賽中,需要找準路子,方向如果錯了,越努力越遙遠……,貼著行業(yè)動向打,或許是一條更“實際”的路線,讓我們拭目以待!
關(guān)鍵詞:Agent、GPT、生成式AI、AIGC、LLM、AGI、Prompt、插件、MultiAgent、Agentbuilder
受作者領(lǐng)域認知深度所限,且技術(shù)無時無刻不在更新迭代,無法在一篇中盡現(xiàn)全貌,能為大家?guī)ヒ稽c點新的啟發(fā),以深感欣慰。文中難免有紕漏或不準確的地方,歡迎大家批評指正。若有任何建議或意見,歡迎聯(lián)系作者探討。
作者:shucay,佳琪,王麗、富璽、新遠
本文由@shucay 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!