大佬們都在關(guān)注的AI Agent,到底是什么?用5W1H分析框架拆解AI Agent(中篇)
從AI Agent的起源到其在不同階段的技術(shù)突破,再到對未來發(fā)展方向的預(yù)測,文章詳細闡述了AI Agent如何逐步演變?yōu)榻裉斓男螒B(tài),并探討了其在解決復雜任務(wù)中的潛力和挑戰(zhàn)。對于希望了解AI Agent及其在現(xiàn)代科技中角色的讀者來說,這是一篇不可錯過的文章。
本篇文章是使用5W1H分析框架拆解AI Agent的中篇,在進入正文之前,先總體回顧這一系列文章的脈絡(luò)。
上篇:介紹What + Why,主要解答以下問題。
What:AI Agent是什么?AI Agent有哪些組成部分?AI Agent的原理是什么?AI Agent是怎么分類的?
Why:為什么會產(chǎn)生AI Agent?AI Agent的優(yōu)勢和劣勢是什么?為什么企業(yè)和個人都要關(guān)注AI Agent?
中篇:介紹When + Where + Who,主要解答以下問題。
When:AI Agent的發(fā)展歷程是怎樣的?AI Agent未來的發(fā)展趨勢是怎樣的?
Where:AI Agent有哪些應(yīng)用場景?
Who:AI Agent領(lǐng)域的玩家有哪些?AI Agent領(lǐng)域的行業(yè)價值鏈是怎樣的?
下篇:介紹 How,主要解答以下問題。
How:如何實現(xiàn)AI Agent?AI Agent包括哪些系統(tǒng)模塊?如何開始學習AI Agent?
想了解全部內(nèi)容的同學,可以關(guān)注WXGZH“風叔云”,回復關(guān)鍵詞“拆解AI Agent”,獲得《5W1H分析框架拆解AI Agent》的完整PPT文件。
在《大佬們都在關(guān)注的AI Agent,到底是什么?用5W1H分析框架拆解AI Agent(上篇)》中,圍繞What和Why,風叔詳細闡述了AI Agent的概念、構(gòu)成、分類、產(chǎn)生原因、優(yōu)勢劣勢、以及對企業(yè)和個人的影響。
在這篇文章中,風叔將圍繞When、Who和Where,詳細介紹AI Agent的發(fā)展歷程、行業(yè)玩家和具體應(yīng)用場景。
一、5W1H分析框架之When
1. AI Agent的發(fā)展歷程
對于一直關(guān)注AI大模型的讀者來說,下圖應(yīng)該不陌生。下面我們就沿著這個脈絡(luò),回顧一下AI Agent的發(fā)展歷程。
階段一,LLM大模型時代之前的Agent
Agent這一概念其實要早于LLM大模型,最早可以起源于馬文明斯基在80年代出版的《智能社會》這本書,Agent理論在LLM大模型出來之前,也已經(jīng)被學術(shù)界研究了很多年。
在《大佬們都在關(guān)注的AI Agent,到底是什么?用5W1H分析框架拆解AI Agent(上篇)》中,風叔有介紹AI Agent的核心三大組成部分,Perception、Brain和Action,其中最關(guān)鍵的部分就是具備記憶、規(guī)劃和推理能力的Brain。在大模型出現(xiàn)之前,Agent的技術(shù)始終面臨天花板,無法取得實質(zhì)性的進步,其核心就是缺乏具備規(guī)劃和推理能力的Brain,且這種Brain還需要具有良好的通用性和泛化性。
在LLM大模型出現(xiàn)之前,比較知名的垂直領(lǐng)域 Agent 的例子比如 Alphago,它有感知環(huán)境、思考決策、采取行動的閉環(huán)邏輯。還有DeepMind的Agent57,使用強化學習方式讓Agent學習打游戲,以及OpenAI玩“躲貓貓”的多智能體。
在這一階段,常規(guī)的Agent更多采用結(jié)構(gòu)化固定模式,通過實現(xiàn)固定算法流程來完成一些自動化任務(wù)。而大模型為Agent帶來了靈活性,使其可以應(yīng)對人類在腦力勞動中面臨的各種復雜的長尾任務(wù),進一步實現(xiàn)體力和腦力任務(wù)的全面自動化。
LLM大模型是第一個可以自主學習并擁有廣泛知識的AI模型,以LLM大模型作為Brain武裝起來的AI Agent,開始迅速發(fā)展。
階段二,Prompt工程
在LLM大模型剛問世的時候,大家都喜歡Prompt工程。用戶通過描述角色技能、任務(wù)關(guān)鍵詞、任務(wù)目標及任務(wù)背景等信息,告訴大模型需要輸出的格式,然后大模型進行輸出。
用戶們也充分發(fā)揮自己的聰明才智,發(fā)展了各種各樣的Prompt工程的玩法,如角色扮演、零樣本提示和少樣本提示。比如在少樣本提示下,用戶只需要給出少量示例,大模型就能學習到示例背后的邏輯,從而給出正確的答復。
當任務(wù)過于復雜時,超出了單一 Prompt 的能力時,可以通過分解任務(wù),構(gòu)建多 Prompt 來協(xié)同解決。最常見的 Prompt 協(xié)同形式就是提示鏈 Prompt Chain,Prompt Chain 將原有需求進行分解,通過用多個小的 Prompt 來串聯(lián)或并聯(lián),共同解決一項復雜任務(wù),如下圖所示。
階段三,大模型插件
雖然Prompt工程很強大,但是僅憑Prompt工程根本無法滿足人們?nèi)找嬖鲩L的復雜需求。由于大模型本身的諸多缺陷,如不能及時更新知識,上下文長度有限等等,工程師們開始給大模型加入插件。
比如引入向量數(shù)據(jù)庫,對某些特定的專屬數(shù)據(jù)進行切片、分塊和向量化,然后把數(shù)據(jù)索引進向量數(shù)據(jù)庫。當用戶進行輸入時,先通過數(shù)據(jù)召回找到最匹配的數(shù)據(jù)分塊,再提交給大模型做Prompt工程,這樣就可以使用到最新的和最準確的知識。這就是檢索增強生成RAG,Retrieval-Augmented Generation。
同時,為了讓大模型更好地和物理世界交互,工程師們嘗試讓 GPT 調(diào)用函數(shù)和使用工具。一系列關(guān)于工具使用的實踐開始出現(xiàn),比如Toolformer和API Bank,ChatGPT也推出了自己的插件體系。
階段四,任務(wù)分解與反思
大模型在一些簡單的任務(wù)上取得了還不錯的結(jié)果,人們開始往更深處探索大模型的智能,尤其是處理復雜問題上的能力,這就涉及到了對復雜任務(wù)的分解,以及在行動過程中的反思。
(1) 思維鏈COT
當我們對LLM這樣要求「think step by step」,會發(fā)現(xiàn)LLM會把問題分解成多個步驟,一步一步思考和解決,能使得輸出的結(jié)果更加準確
(2) COT-SC
一個CoT有時可能出現(xiàn)錯誤,我們可以讓Agent進行發(fā)散,嘗試通過多種思路來解決問題,然后投票選擇出最佳答案,這就是CoT-SC。
(3) 思維樹TOT
思維樹TOT是對思維鏈CoT的進一步擴展,在思維鏈的每一步,推理出多個分支,拓撲展開成一棵思維樹。使用啟發(fā)式方法評估每個推理分支對問題解決的貢獻。選擇搜索算法,使用廣度優(yōu)先搜索(BFS)或深度優(yōu)先搜索(DFS)等算法來探索思維樹,并進行前瞻和回溯。
(4)思維圖GOT
思維樹ToT 的方式也存在一些缺陷,對于需要分解后再整合的問題,比如排序問題,排序我們可能需要分解和排序,然后再merge。這種情況下TOT就不行了,可以引入思維圖GOT來解決。
當人們發(fā)現(xiàn)大模型的推理能力還是不足時,開始試圖讓模型自身清楚地描述問題,把問題轉(zhuǎn)化為 PDDL (Planning Domain Definition Language)格式的描述語言,通過調(diào)用通用規(guī)劃器來解決規(guī)劃問題,再把解決方案轉(zhuǎn)化為可執(zhí)行的動作,以更好地邏輯推理和規(guī)劃等任務(wù)。這就是LLM+P
上面幾種思路都是在解決任務(wù)分解問題,工程師們也想到了很多解決大模型反思和完善自身行動的思路。
首先是ReACT,全稱是Reasoning-Action,這種模式是讓大模型先進行思考,思考完再進行行動,然后根據(jù)行動的結(jié)果再進行觀察,再進行思考,這樣一步一步循環(huán)下去。這種行為模式基本上就是人類這樣的智能體主要模式。
然而,工程師覺得這樣仍然不夠,他們希望大模型在完成每一個任務(wù)后,能夠積累經(jīng)驗和教訓、因此產(chǎn)生了借鑒強化學習思路的”反射”機制,反射機制能夠讓機器記住每一次任務(wù)的完成情況,無論效果好壞,以供未來參考,提升模型的性能。這就是Reflecxion。
階段五,Agent問世
隨著各項基礎(chǔ)設(shè)施的逐步完善,更大的變革轟然襲來,這就是Agent。2023年4月AutoGPT橫空出世正式宣告了LLM Agent的來臨,短短數(shù)周就獲得了9萬星,賺足了眼球。
下圖是AutoGPT 的架構(gòu)圖,旨在實現(xiàn)對任務(wù)的有效管理。生成的任務(wù)將會被加入優(yōu)先級隊列中,隨后系統(tǒng)會不斷從優(yōu)先隊列中選擇優(yōu)先級最高的任務(wù)進行執(zhí)行,整個過程中,任何反饋都會通過記憶進行迭代優(yōu)化代碼
隨后,更多的LLM Agent如雨后春筍般爆發(fā)出來,比如微軟的Jarvis HuggingGPT、專門用于寫小說的RecurrentGPT、清華聯(lián)合面壁推出的雙循環(huán)機制XAgent、虛擬世界Minecraft中的智能體Voyager等等。
然后,工程師們就想到了Multi-Agent,既然Single Agent已經(jīng)具備了獨立決策和行動能力,如果將多個Agent放到一個環(huán)境中,他們之間會碰撞出什么火花呢?
“斯坦福小鎮(zhèn)”項目應(yīng)該是最有名的Multi-Agent項目,在這個虛擬的小鎮(zhèn)里,有25 個獨立的 AI 智能體在小鎮(zhèn)上生活。他們的決策和行動并不是固定寫死在系統(tǒng)里面的,每個智能體背后都連接著LLM大模型。他們有工作,會八卦,能組織社交,結(jié)交新朋友,甚至舉辦情人節(jié)派對,每個小鎮(zhèn)居民都有獨特的個性和背景故事。這些角色每天會自己制定計劃,參與活動和做事情,還會主動和其他Agent交談。同時,Agent交談的內(nèi)容會被存儲在記憶數(shù)據(jù)庫中,并在第二天的活動計劃中被回憶和引用,是不是非常像人腦的記憶系統(tǒng)?“斯坦福小鎮(zhèn)”項目也涌現(xiàn)出了許多頗有趣味性的社會學現(xiàn)象。
還有一個很著名的Multi-Agent項目叫MetaGPT。這個項目按照軟件公司的組織架構(gòu),定義了多個AI智能體角色,包括產(chǎn)品經(jīng)理、架構(gòu)師、項目管理員、工程師和測試人員等角色。各角色之間通過相互協(xié)作,基本可以勝任完成500行左右代碼的小工程了。隨著AI Agent的進一步強大,在未來每個人完全可以開一家虛擬公司,自己承接物理世界的真實需求,然后交給虛擬公司的員工完成,非常具有想象空間。
這就是AI Agent到目前為止的大體發(fā)展過程,LLM大模型的出現(xiàn)是Agent發(fā)展的拐點,Agent的發(fā)展速度如火箭般攀升。那么站在現(xiàn)在看未來,AI Agent會有怎么樣的發(fā)展趨勢呢?
2. AI Agent的未來發(fā)展趨勢
在《大佬們都在關(guān)注的AI Agent,到底是什么?用5W1H分析框架拆解AI Agent(上篇)》中,風叔有介紹到,目前AI Agent最大的局限就是可靠性不足。因為LLM大模型容易出現(xiàn)幻覺和不一致性,將多個AI步驟連起來會進一步加劇可靠性問題,從而難以獲得用戶信任。舉個例子,假設(shè)每個步驟LLM的可靠性是95%,如果一個任務(wù)需要被分解到5步以上,那么最終的可靠性將不到80%,這會大大限制AI Agent在一些Critical場景下的應(yīng)用。
未來,AI Agent的發(fā)展,必須首先要解決可靠性不足的問題,而解決可靠性不足的問題,就得從任務(wù)分解與反思、記憶優(yōu)化、Function Calling準確性這幾個維度入手。
1)任務(wù)分解與反思
現(xiàn)在的 Agent 只是一個規(guī)劃器,它負責做規(guī)劃。但實際上,這個流程中還存在很多未明確的問題,比如是否存在一個內(nèi)部加工過程,以及這個過程是否透明可控等。
類比我們?nèi)祟愃伎嫉倪^程,人腦有兩套系統(tǒng),系統(tǒng)1和系統(tǒng)2。系統(tǒng)1是快思考,出自于人類天生的本能,思考時間快,消耗能量少。系統(tǒng)2是慢思考,人類的邏輯能力、推理能力和歸納能力,皆是出自于系統(tǒng)2,而且系統(tǒng)2思考時間慢,消耗能量大。系統(tǒng)2的能力大多數(shù)都是人類后天習得的,但是經(jīng)過不斷地刻意練習后,一部分能力也能由系統(tǒng)2轉(zhuǎn)移到系統(tǒng)1,由慢思考變?yōu)榭焖伎肌?/p>
對于任務(wù)分別的難題,一種可能的解決辦法是將內(nèi)部加工過程外部化,用系統(tǒng)2包裹起來,使每一步細粒度的思考都可以展現(xiàn)出來。但是具體如何用系統(tǒng)2進行包裹,風叔也還沒有具體的思路,需要持續(xù)關(guān)注AI Agent最新的論文和進展。
2) 記憶優(yōu)化
目前,AI Agent的記憶機制是把所有的信息,以向量數(shù)據(jù)的方式存儲在歷史記錄里,然后在需要的時候進行召回。這種記憶方式,站在工程化的角度,其實也比較合理,但是在實際使用中,會出現(xiàn)一些問題。
首先,歷史記憶會越積越多,當數(shù)據(jù)量到達一定程度之后,數(shù)據(jù)召回的速率就會顯著下降,從而影響AI Agent的反應(yīng)速度。其次,在記憶數(shù)據(jù)庫中,一定會存在大量的錯誤信息,或者不合時宜的信息,但是AI Agent很難判斷哪些記憶是需要修正的。
人類的記憶其實是有重塑機制的,人類在獲得大量相關(guān)的知識后,不會簡單地把它們堆積在腦中,而是通過海馬體進行重整。比如在我們做夢時,大腦會重新構(gòu)造這些相關(guān)的知識,使得記憶網(wǎng)絡(luò)變得有序。同時,人類可以主動刪除一些不好的記憶,或者錯誤的記憶,比如很多生活中無關(guān)緊要的信息,人腦就會逐漸遺忘掉,從而避免記憶負荷越來越大。
所以在未來,AI Agent一定要優(yōu)化記憶系統(tǒng),不能簡單的將長短時記憶簡化為向量數(shù)據(jù)庫。
3) Function Calling準確性
目前,F(xiàn)unction Calling是AI Agent進行工具使用的最主要的手段,可以說AI Agent的執(zhí)行能力強依賴于大模型的Function Calling能力。但是目前的Function Calling的準確性其實并不理想,表現(xiàn)最好的大模型其準確率也只有86%。
86%意味著什么?
意味著,目前的AI Agent還只能應(yīng)用在對準確率要求不高、有人類進行兜底的場景,比如撰寫論文或調(diào)研報告、智能客服等等。對于更加嚴謹?shù)膱鼍?,比如工業(yè)、醫(yī)療、能源,還難以有AI Agent的用武之地。
還意味著,如果AI Agent需要執(zhí)行一連串的任務(wù),哪怕只有5個環(huán)節(jié),整體流程的準確率將下降到不足30%,即系統(tǒng)不可用。
所以在未來,AI Agent一定要提升Function Calling的準確性,或者有更準確的API調(diào)用方式。只有當準確率達到99.99%以上時,AI Agent才能在更為廣闊的工業(yè)界生根發(fā)芽。
4)多模態(tài)與世界模型
除了以上三個維度之外,還有一個非常關(guān)鍵的點,即多模態(tài)和世界模型。
在漫長的進化歷史中,生物神經(jīng)網(wǎng)絡(luò)從簡單的條件反射逐漸進化到今天的主動預(yù)測,我們已經(jīng)可以在大腦中構(gòu)建世界模型,進行強大的推理和分析。比如當我們看到晚霞時,就會知道明天大概率是個晴天;比如當我們感知到建筑發(fā)生搖晃時,就知道很有可能發(fā)生了地震,需要趕緊去一個安全的地方。
現(xiàn)在的大模型主要是通過語言進行交互,這樣顯然是不夠的。如果要進一步理解世界,一定需要多模態(tài)輸入,包括視覺、聽覺、傳感器等等。因此,未來的AI Agent一定會更多和物理實體相結(jié)合,比如將AI Agent集成進入機器狗,訓練其進行救援任務(wù)。在這個過程中,對于時間的認知、身體運動的控制也需要集成到AI Agent里面去。
AI Agent的發(fā)展速度太快了,每個月甚至每周,都有新的研究成果、新的產(chǎn)品問世。我們能做的,就是躬身入局,時刻關(guān)注大模型和Agent的發(fā)展。
二、5W1H分析框架之Who
接下來,我們再從”Who”這個維度拆解一下AI Agent,主要回答AI Agent領(lǐng)域都有哪些核心玩家這一關(guān)鍵問題。
風叔將從三個角度來進行拆解:從AI Agent框架本身,從AI Agent的行業(yè)場景,以及從國內(nèi)AI Agent生態(tài)。
1. 從AI Agent框架本身
下面這張圖來自風險投資公司Aura Ventures的《自主人工智能體新興市場格局》,按照AI Agent的框架,將整個Agent產(chǎn)業(yè)自下而上分成了三層:最下面為用于智能體運營(AgentOps)的模塊插件層,中間為程序應(yīng)用層(Applications),最上面為服務(wù)層(Services)。整個劃分非常清晰,唯一美中不足的是,這張圖成圖于去年,因此難以揭示目前最新的Agent發(fā)展狀況。
1)AgentOps運營層
我們先來看最下面的AgentOps,非常明顯了采用了AI Agent的組成架構(gòu),即智能(Intelligence,負責Planning)、記憶(Memory)、工具使用(Tools & Plugins)。此外,還有多智能體環(huán)境和協(xié)議(Multi-agent playgrounds and protocols)、監(jiān)控/安全和預(yù)算(Monitoring,security and budgetary)、以及智能體運營市場(AgentOps marketplace)等輔助模塊。
- 智能(Intelligence):智能體的“大腦”,背后是LLM大模型,負責任務(wù)創(chuàng)建和規(guī)劃,這里我們能看到OpenAI GPT、Claude、HuggingFace等耳熟能詳?shù)拿?。大模型質(zhì)量、可靠性和成本,將是這部分玩家的制勝關(guān)鍵。
- 記憶(Memory):用于獲取、存儲、保留和檢索數(shù)據(jù),向量數(shù)據(jù)庫是其中的關(guān)鍵。這里的玩家包括 Pinecone、Chroma以及像Perplexity AI一樣具有集成優(yōu)勢的Text to SQL 初創(chuàng)公司。記憶容量、讀取速率、尤其是召回準確率,將是這部分玩家的關(guān)鍵因素。
- 工具和插件(Tools and plugins):能夠為Agent提供API和技能庫,用于Agent和外部系統(tǒng)與環(huán)境進行交互,例如搜索查詢、發(fā)送郵件等。典型的包括API-Bank、Toolformer、以及部分大模型自帶的function calling能力。
- 多智能體環(huán)境和協(xié)議:這部分主要用于智能體和智能體的通信協(xié)議,包括PumaMart、SIM Gen Agents和E2B。
- 監(jiān)控、安全和預(yù)算:這部分主要解決智能體在LLM大模型、通信協(xié)議、安全安保方面的問題,也應(yīng)該受到重視,安全是任何場景下使用Agent的前提。
- 智能體運營市場:主要用于Agent框架的發(fā)布、開源Agent的共享等。這塊最主要的玩家是HuggingFace和Github,還有FinGPT、BabyAGI等開源框架。
2) Agent應(yīng)用層
Agent應(yīng)用程序?qū)影ㄍㄓ脩?yīng)用(General purpose)和行業(yè)應(yīng)用(Business industry)
通用應(yīng)用主要偏個人應(yīng)用場景,比如個人生活助理、商務(wù)助理、日常工作助理等等。典型的產(chǎn)品包括Embra AI、Adept AI、Cognosys AI。
行業(yè)應(yīng)用主要偏業(yè)務(wù)垂直場景,比如編程、營銷、金融、供應(yīng)鏈等等。典型的產(chǎn)品包括Quill AI、Octain AI等等
3)Agent服務(wù)層
Agent服務(wù)層主要包括智能體搭建平臺和智能體市場。
智能體搭建平臺是一種低代碼平臺,支持普通用戶通過簡單的配置搭建屬于自己的Agent,大幅降低AI Agent的創(chuàng)建門檻。目前智能體搭建平臺受到了很多大廠的青睞,因為大廠很難一開始基于某些垂類場景開發(fā)Agent應(yīng)用,因此智能體搭建平臺成為最實際的選擇。比如微軟的Autogen、百度智能體平臺、字節(jié)Coze、騰訊元器等等。
下圖是字節(jié)Coze的智能體搭建的示意圖,提供了非常豐富的組件,方便用戶通過拖拉拽的方式快速搭建AI Agent。在后續(xù)文章中,風叔還會專門介紹搭建AI Agent的具體方法。
很多智能體搭建平臺也對外開放了Agent市場,使用者將自己搭建的Agent部署上線之后,其他用戶也能搜索并使用。下圖是字節(jié)Coze的Agent市場示例圖。
2. 從AI Agent行業(yè)場景
E2B出品的這份AI Agent行業(yè)全景圖是相對比較完整的。整張圖有兩個維度,第一個維度是開源和閉源,第二個維度是AI應(yīng)用,包括了Coding、Productivity、General Purpose、HR、Data Analysis、Business Intelligence、Science、Research、Design、Marketing、Finance等細分領(lǐng)域。
每個細分領(lǐng)域具體的玩家就不一一列舉了,大家可以詳細參考下圖。另外,這張圖是持續(xù)更新的,通過這個地址 https://github.com/e2b-dev/awesome-ai-agents,大家就能看到最新的進展,以及E2B對每個玩家的詳細介紹。
3. 國內(nèi)AIAgent生態(tài)
目前國內(nèi)的AI Agent發(fā)展也十分迅猛,下圖是甲子光年出品的中國AI Agent生態(tài)圖譜1.0,將整個AI Agent行業(yè)分為三層。
最底層是算力層,包括像阿里云、AWS、華為云這類提供底層GPU算力的云廠商。
中間是平臺框架層,包括面向企業(yè)業(yè)務(wù)工作流場景的企業(yè)級AI Agent平臺,比如釘釘、匯智智能、瀾碼科技。以及面向個人開發(fā)者或普通用戶的AI Agent平臺,比如百度文心智能體平臺、阿里ModelScope、字節(jié)扣子等。
最上層是垂直應(yīng)用層,比如專注于金融行業(yè)的Easy Link、招聘行業(yè)的用友和Moka、營銷領(lǐng)域的BetterYeah。
對于普通的創(chuàng)業(yè)者或創(chuàng)業(yè)團隊來說,肯定沒有足夠的資源投入大模型賽道,但是站在大模型的肩膀上,選擇一個相對垂直的領(lǐng)域做AI Agent,服務(wù)于企業(yè)客戶的具體業(yè)務(wù)流程和場景,是更加切實可行的選擇。
三、5W1H分析框架之Where
AI Agent的發(fā)展正在以前所未有的速度改變我們的生活和工作方式。接下來我們從行業(yè)視角來分析一下,在具體的行業(yè)中AI Agent都有哪些可落地的場景。
1. 電商&零售
- 個性化推薦系統(tǒng):將用戶的歷史瀏覽數(shù)據(jù)、購買數(shù)據(jù)以及當下和AI的上下文數(shù)據(jù),作為輸入給到AI Agent,Agent自動預(yù)測用戶在未來對各類商品的購買率,進行重排后輸出預(yù)估購買率最高的TopN商品,實現(xiàn)個性化的產(chǎn)品推薦。
- 個性化營銷系統(tǒng):將用戶歷史上在各個營銷渠道的觸達和點擊數(shù)據(jù),結(jié)合本次營銷活動的營銷內(nèi)容,作為輸入給到AI Agent,Agent自動預(yù)測每個用戶在每個營銷渠道(比如短信、外呼、小程序、公眾號等)的預(yù)估點擊率,從而實現(xiàn)自動化和個性化的營銷活動,提高用戶參與度和品牌曝光度。
- 智能客服:通過提前構(gòu)建企業(yè)專屬知識庫,AI Agent 可以自動回答用戶的咨詢,處理訂單問題和退貨請求。相比傳統(tǒng)智能客戶,AI Agent可以支持用戶靈活多樣的問題,不用局限于傳統(tǒng)的Q&A模板,可以大幅節(jié)省準備問答對的時間,提升智能客服的準確率。
- 內(nèi)容生成:在電商場景中,經(jīng)常會涉及到商品封面圖、海報、商品詳情頁、營銷文案等內(nèi)容的生成。傳統(tǒng)的做法都需要人工拍攝和撰寫,而在AI Agent的助力下,使用者只需要告訴Agent關(guān)鍵詞,比如商品類型、內(nèi)容形態(tài)、內(nèi)容主題和風格等,AI Agent可以自動完成。
- 需求預(yù)測:將過去一段時間內(nèi),各個品類的銷量數(shù)據(jù)、促銷活動信息、天氣信息等數(shù)據(jù),作為輸入給到AI Agent,Agent預(yù)測未來一段時間內(nèi)的銷量,從而幫助企業(yè)提前做好配貨。
- 庫存管理:將歷史各個品類的訂單數(shù)據(jù),各個供應(yīng)商的供貨數(shù)據(jù),比如供貨周期、供貨價格,作為輸入給到AI Agent,AI Agent預(yù)測每個品類的安全庫存,并在商品庫存預(yù)警時,自動發(fā)起采購流程。
- 價格優(yōu)化:AI Agent還可以使用爬蟲工具獲取市場動態(tài)、競爭對手定價和用戶行為,經(jīng)過數(shù)據(jù)分析后,為電商企業(yè)提供動態(tài)定價建議。這種實時的價格調(diào)整策略有助于最大化利潤和競爭力。
2. 制造業(yè)
- 質(zhì)量控制:用攝像頭捕捉生產(chǎn)線上各類零件和成品的圖像,將圖片或視頻傳遞給AI Agent,Agent利用計算機視覺技術(shù)對圖像進行分析,自動檢測產(chǎn)品缺陷。當檢測到存在缺陷的零件時,可以發(fā)送通知給產(chǎn)線檢查員,甚至可以直接操作機械臂取出缺陷品。
- 生產(chǎn)線優(yōu)化:生產(chǎn)線流程是一個標準的workflow,workflow的每個環(huán)節(jié)都有明確的步驟、檢查事項和執(zhí)行動作。在這個過程中,可以利用Agentic Workfow,明確告知Agent要做的事項,將更多過去需要由人工重復執(zhí)行的過程,交給AI Agent,從而提升生產(chǎn)效率。
- 產(chǎn)品設(shè)計與開發(fā):AI Agent 可以協(xié)助設(shè)計師和工程師進行產(chǎn)品設(shè)計,比如設(shè)計師輸入設(shè)計和尺寸的要求,AI Agent直接進行線稿設(shè)計;或者設(shè)計師提供線稿設(shè)計后,AI Agent輸出渲染效果圖,向設(shè)計師提供多種設(shè)計創(chuàng)意,從而縮短產(chǎn)品開發(fā)的周期。
- 能源消耗管理:AI Agent能夠接收機器或設(shè)備上傳感器的數(shù)據(jù),例如溫度、電壓、電流等等,和數(shù)據(jù)庫中正常的設(shè)備運行數(shù)據(jù)進行比對,從而對設(shè)備的運行情況進行監(jiān)控和預(yù)警。例如,當某個設(shè)備因電源老化出現(xiàn)電壓異常時,AI Agent可以提早識別,并預(yù)警給工廠設(shè)備的維修人員。
- 供應(yīng)鏈管理:和電商行業(yè)的需求預(yù)測和庫存優(yōu)化類似,AI Agent可以預(yù)測產(chǎn)品未來一段時間的銷量,同時根據(jù)歷史訂單和采購數(shù)據(jù)預(yù)測最優(yōu)的安全庫存,以及通過預(yù)警機制進行供應(yīng)鏈上下游的協(xié)同,幫助企業(yè)更好地應(yīng)對市場需求的波動和變化。
- 工藝改進:AI Agent 還可以通過分析生產(chǎn)過程中的數(shù)據(jù),比如在不同環(huán)境和參數(shù)下生產(chǎn)出來的產(chǎn)品的差異性,從而進行工藝參數(shù)的優(yōu)化,提升產(chǎn)品質(zhì)量和生產(chǎn)效率
3. 醫(yī)療行業(yè)
- 疾病預(yù)測和預(yù)防:通過歷史積累的患者健康數(shù)據(jù),比如血糖、血氧、白細胞、紅細胞等大量指標數(shù)據(jù),AI Agent可以學習到各項指標與疾病之間的相關(guān)性,對于像糖尿病、心臟病等疾病,提前預(yù)測病人患此類疾病的風險。
- 藥物研發(fā):和疾病預(yù)測類似,AI Agent可以分析既有藥物中的各種化學和生物成分,結(jié)合每種藥物的藥效,從而預(yù)測新的化學和成分組合之后的藥性,加速新藥的發(fā)掘和開發(fā),大幅降低研發(fā)成本和時間。
- 智能問診服務(wù):在LLM大模型基礎(chǔ)上,通過RAG技術(shù)掛載醫(yī)療知識庫,將AI Agent訓練成為醫(yī)療領(lǐng)域?qū)2?,為患者提?*24小時的在線醫(yī)療咨詢服務(wù),根據(jù)患者的問題描述,還能提供初步的診斷建議。這樣既可以提升患者的就醫(yī)體驗,也能減輕醫(yī)生的工作負擔。
- 醫(yī)療影像分析:通過機器視覺技術(shù),AI Agent 能夠輔助醫(yī)生分析 X 光、MRI、CT 等醫(yī)療影像,快速識別出患者是否有異常情況,如腫瘤、肺炎、骨折等,提高診斷的準確性和效率。
- 醫(yī)療教育和培訓:當AI Agent掛載了專門的醫(yī)學知識庫之后,還可以作為醫(yī)療教育的工具。比如AI Agent可以模擬患者向醫(yī)學院的學生提問,根據(jù)學生的回答,自動分析學生的學習情況,并指出學生的錯誤和不足,并引導學生進行專門的醫(yī)療課程學習。
AI Agent在各個行業(yè)都有非常多的應(yīng)用場景,除了上述介紹的電商、制造、醫(yī)療之外,還包括金融、物流、能源、人資、旅游、教育等等行業(yè),風叔就不在文章里一一贅述了。
風叔專門整理了一張行業(yè)應(yīng)用場景的腦圖,感興趣的讀者可以關(guān)注WXGZH“風叔云”,回復“AI Agent應(yīng)用場景”,即可獲取完整的應(yīng)用場景圖。
四、總結(jié)
本篇文章是使用5W1H分析框架拆解AI Agent的中篇,圍繞When、Who和Where,詳細闡述了AI Agent的發(fā)展歷程、行業(yè)玩家和具體應(yīng)用場景。
在下一篇文章中,風叔將圍繞How,詳細介紹AI Agent的具體實現(xiàn)路徑,以及如何更快的上手學習AI Agent。
作者:風叔,微信公眾號:風叔云
本文由@風叔 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
拆解AI Agent