AI 智能體解釋(智能體的 3 個(gè)級(jí)別)

0 評(píng)論 2744 瀏覽 6 收藏 10 分鐘
🔗 产品经理的职业发展路径主要有四个方向:专业线、管理线、项目线和自主创业。管理线是指转向管理岗位,带一个团队..

這是有關(guān) AI 智能體的大型系列中的第一篇文章。盡管 2025 年被稱為“AI 智能體之年?”,但對(duì)許多人來說,是什么使 AI 系統(tǒng)成為“?智能體?”以及我們?yōu)槭裁磻?yīng)該關(guān)心仍然不清楚。在這篇文章中,我將描述這些系統(tǒng)的主要特征以及 3 個(gè)智能體級(jí)別的具體示例。

公司正在 AI 智能體上下大賭注。OpenAI 正在提供 Operator 和 DeepResearch 等模型。YC 表示,垂直 AI 智能體可能比 SaaS 大 10 倍 。Cursor 和 Windsurf 等 AI 應(yīng)用程序已經(jīng)用智能體界面取代了他們的聊天界面。

這讓智能體商們興奮不已,甚至超越了 AI 公司。但是,對(duì)于外行來說,可能不清楚 AI 智能體(實(shí)際上)是什么。

什么是 AI 智能體?

造成混淆的原因之一是,沒有人對(duì) AI 智能體的單一定義達(dá)成一致。為了證明這一點(diǎn),以下是一些來自領(lǐng)先組織的案例。

  • OpenAI:一個(gè)大型語言模型 (LLM),配置了指令和工具;
  • Hugging Face:大型語言模型 LLM 可以通過規(guī)劃和使用工具執(zhí)行更復(fù)雜的任務(wù)的系統(tǒng);
  • Anthropic:LLMs 動(dòng)態(tài)指導(dǎo)自己的流程和工具使用,保持對(duì)完成任務(wù)方式的控制;

雖然我不會(huì)通過提出另一個(gè)定義來使事情變得更糟,但我將討論跨越所有這些定義的幾個(gè)關(guān)鍵特征。

  • LLM— 大型語言模型在智能體系統(tǒng)中起著核心作用;
  • 工具使用— 這些允許智能體超越 LLM 的基本文本生成并與外部世界交互(例如代碼解釋器、API 調(diào)用、RAG、內(nèi)存);
  • 自主性— 智能體(在不同程度上)決定如何完成給定的任務(wù),這可能涉及計(jì)劃、推理或帶有某些停止標(biāo)準(zhǔn)的反饋循環(huán);

為什么選擇 Agents?

LLMs與傳統(tǒng)方法相比,允許我們構(gòu)建更靈活、更強(qiáng)大的軟件。這有兩個(gè)主要原因。首先,他們可以處理請(qǐng)求并以自然語言生成響應(yīng),從而實(shí)現(xiàn)直觀的用戶界面。其次,LLMs 能夠進(jìn)行 0-shot 學(xué)習(xí),即在沒有明確訓(xùn)練的情況下執(zhí)行任意任務(wù)。

但是,僅靠這些功能對(duì)于大多數(shù)應(yīng)用程序來說是不夠的。這是因?yàn)?LLMs(開箱即用的)缺乏為我們解決問題所需的上下文和對(duì)現(xiàn)實(shí)世界系統(tǒng)的訪問權(quán)限。為了克服這個(gè)問題,我們通常會(huì)手動(dòng)為模型提供上下文,并自己執(zhí)行其建議的作。

智能體可以利用測試時(shí)計(jì)算擴(kuò)展定律來執(zhí)行比普通 LLM API 調(diào)用更好的任務(wù)。這只是一種花哨的說法,LLM 即生成的 Token 越多,其響應(yīng)就越好。我們將在下面的 3 級(jí)智能體示例中了解如何利用這個(gè)想法。

AI 智能體的 3 個(gè)級(jí)別

由于人們無法就AI 智能體的單一定義達(dá)成一致,因此大多數(shù)從業(yè)者都談?wù)?strong>智能體系統(tǒng)。換句話說,與其將系統(tǒng)視為 AI 智能體或不作為 AI 智能體,不如將它們視為一個(gè)智能體范圍,從無智能體(例如基于規(guī)則的系統(tǒng))到人類級(jí)別的智能體

為了證明這一點(diǎn),我將分享 3 個(gè)智能體系統(tǒng)在智能體程度增加的具體例子。雖然這些方法都是不同的,但它們并不是相互排斥的。例如,級(jí)別 3(LLM 在循環(huán)中)可以是級(jí)別 2(LLM 工作流)的組件,而級(jí)別 1 (+LLM 工具)通常用于級(jí)別 3。

第 1 級(jí):+ LLM 工具

如今,人們可能認(rèn)為智能體的最簡單的 AI 系統(tǒng)是LLM帶有工具的增強(qiáng)系統(tǒng)。工具是任何 AI 智能體的關(guān)鍵組件,因?yàn)樗鼈?strong>使系統(tǒng)能夠與現(xiàn)實(shí)世界進(jìn)行交互。

以下是智能體系統(tǒng)中使用的常用工具的示例。

  • 網(wǎng)絡(luò)搜索= 通過 Google 搜索或 DuckDuckGo 訪問實(shí)時(shí)信息;
  • 代碼解釋器= 執(zhí)行代碼并處理其輸出的能力;
  • API 調(diào)用= 與程序接口(例如 YouTube、Gmail、Notion)交互以執(zhí)行作;
  • 計(jì)算機(jī)使用= 使視覺對(duì)象LLM能夠通過鼠標(biāo)單擊和鍵盤敲擊與 GUI 交互;
  • 另一個(gè)模型= 調(diào)用另一個(gè)LLM或多模態(tài)模型來執(zhí)行特定任務(wù);
  • 文件讀取器= 從.pdf和.csv等文件格式中提取文本;

此類智能體最流行的示例是 ChatGPT,它可以訪問網(wǎng)絡(luò)搜索、Python 解釋器和文本到圖像模型。這些簡單的工具將 ChatGPT 從人們?cè)谏缃幻襟w上分享的新奇事物(首次發(fā)布時(shí))轉(zhuǎn)變?yōu)閷?shí)用的日常工具。

盡管這些工具對(duì) 進(jìn)行了LLM重大改進(jìn),但這些系統(tǒng)仍然受到根本限制。也就是說,他們依賴于單個(gè)LLM調(diào)用,這對(duì)于更復(fù)雜的任務(wù)來說可能不足,例如研究博客創(chuàng)意、選擇最好的創(chuàng)意和編寫初稿。

第 2 級(jí):LLM 工作流程

工作流是一個(gè)圖形,用于定義執(zhí)行特定任務(wù)所涉及的步驟。在這里,圖形在數(shù)學(xué)意義上使用,其中節(jié)點(diǎn)(即工作流中的步驟)通過有向鏈接(即步驟的順序)連接。下面顯示了一個(gè)示例。

將系統(tǒng)設(shè)計(jì)為LLM工作流有兩個(gè)主要好處。首先,這些系統(tǒng)可以通過將復(fù)雜任務(wù)拆分為子任務(wù)并使用專用模塊執(zhí)行它們來處理復(fù)雜任務(wù)。其次,模塊化設(shè)計(jì)允許更好地控制中間輸出,使調(diào)試和避免不良系統(tǒng)輸出變得更加容易。

雖然設(shè)計(jì)這些系統(tǒng)的方法無窮無盡,有些常見的設(shè)計(jì)模式,這些總結(jié)如下:

  • 鏈接= 將任務(wù)分解為一系列步驟,其中前一步的輸出被輸入到后面的步驟中,例如 A → B → C
  • 路由= 對(duì)輸入進(jìn)行分類并將其定向到專用模塊,例如 A → B 或 A → C
  • 并行化= 通過分段(即將任務(wù)分成更小的步驟并并行運(yùn)行以提高速度)或投票(即多次運(yùn)行同一任務(wù)并對(duì)最終輸出進(jìn)行性能投票)同時(shí)運(yùn)行 LLMs,例如 A → B 和 A → C
  • 編排器將任務(wù)分解為子任務(wù),并將其委托給工作器模塊,例如 A → B 和 A → C
  • 評(píng)估者-優(yōu)化器= 一個(gè)LLM生成響應(yīng),而另一個(gè)在循環(huán)中提供評(píng)估和反饋,例如 A → B → A

最后一種模式與列出的其他模式有著根本的不同,后者本質(zhì)上是封閉式的,因?yàn)樗鼈円杂邢薜捻樞驁?zhí)行步驟。然而,評(píng)估者-優(yōu)化器為開放式任務(wù)打開了大門,這些任務(wù)可以(原則上)無限期地持續(xù)下去,這將我們帶到了智能體的下一個(gè)層次。

第 3 級(jí):LLM 循環(huán)中

盡管我們可以使用 Level 1 和 Level 2 描述的系統(tǒng)走得很遠(yuǎn),但并非所有任務(wù)都可以一次性完成或由預(yù)定義的工作流程完成。相反,有些問題需要LLM探索和反思可能的解決方案。

這利用了 OpenAI 的 o1 和 DeepSeek-R1 等模型所展示的測試時(shí)計(jì)算擴(kuò)展定律。然而,與這些模型不同的是,智能體系統(tǒng)不僅限于代幣生成——它們可以使用工具與現(xiàn)實(shí)世界的系統(tǒng)交互并反映他們的反饋。

實(shí)現(xiàn)這種系統(tǒng)的一種常見方法是通過一個(gè)動(dòng)作 + 反饋循環(huán),重復(fù)直到滿足特定任務(wù)。

構(gòu)建此類系統(tǒng)的更復(fù)雜的方法是端到端強(qiáng)化學(xué)習(xí)。在這里,一個(gè) LLM + 工具被賦予一個(gè)封閉式任務(wù),并根據(jù)其響應(yīng)接收訓(xùn)練信號(hào)(即 的權(quán)重LLM被更新)。一個(gè)例子是 OpenAI 的 DeepResearch 功能,它使 ChatGPT 能夠?qū)⒀芯坎樵兎纸鉃樾袆?dòng)計(jì)劃,并迭代探索和優(yōu)化搜索結(jié)果。

下一步是什么?

AI 智能體建立在靈活性之上 LLMs,以創(chuàng)建能夠解決現(xiàn)實(shí)世界中復(fù)雜任務(wù)的系統(tǒng)。在這里,我們討論了不同級(jí)別的智能體系統(tǒng)的三個(gè)例子。

本文由 @來學(xué)習(xí)一下 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!
专题
16934人已学习12篇文章
供应链管理系统是最早期面向企业的软件解决方案之一,供应商管理又是供应链链条中的上游部分。本专题的文章分享了供应商管理设计指南以及供应链的基础知识。
专题
14015人已学习12篇文章
本专题的文章分享了用户运营实战经验。
专题
60908人已学习20篇文章
想转行做产品经理,这个专题值得一看,看看前人是怎么做到的。
专题
12905人已学习14篇文章
大多数产品经理都会经历职场晋升和转正述职的时刻,这个时候,你该怎么做准备?本专题的文章分享了述职报告撰写指南。