国产成人一区二区三区视频免费,综合自拍亚洲综合图明片,日本韩国欧美国产一级

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

開通會員

發(fā)布

注冊 | 登錄

巨頭搶灘、資本沸騰，AI智能體如何跨越「幻覺」陷阱？

鋅財經(jīng)

2025-03-14

0 評論 379 瀏覽 0 收藏

🔗 产品经理的职业发展路径主要有四个方向：专业线、管理线、项目线和自主创业。管理线是指转向管理岗位，带一个团队..

最近超火的AI智能體，比如Manus，它不僅讓科技圈沸騰，還帶火了股市。讓我們意識到AI智能體正在從“只會回答”進化到“主動干活”，雖然潛力巨大，但也面臨不少難題，比如AI幻覺、數(shù)據(jù)不互通和倫理問題。未來誰能先解決這些問題，誰就能在這場AI競賽中拔得頭籌。

Manus的出現(xiàn)，激起了科技與資本市場的雙重震蕩，一時間AI Agent相關(guān)概念股集體大漲，阿里、谷歌、微軟等科技巨頭密集發(fā)布智能體研發(fā)計劃……

而在這場熱潮的背后，是AI技術(shù)從“被動應(yīng)答”向“主動執(zhí)行”的范式躍遷。

盡管市場的評價褒貶不一，但不能否認，Manus的突破性在于，它首次驗證了通用型AI Agent在復(fù)雜場景下的商業(yè)化可行性。

傳統(tǒng)的大語言模型雖能生成文本，卻難以閉環(huán)執(zhí)行任務(wù)，而Manus通過“規(guī)劃-驗證-執(zhí)行”的架構(gòu)，將AI大模型的認知能力轉(zhuǎn)化為生產(chǎn)力工具。

根據(jù)麥肯錫等多份權(quán)威報告，在多元化需求驅(qū)動下，AI Agent市場呈爆發(fā)式增長態(tài)勢，2024年全球AI Agent市場規(guī)模約為51億美元，預(yù)計2030年將飆升至471億美元，復(fù)合年增長率高達44.8%。

然而，這場“智能體浪潮”并非坦途。技術(shù)瓶頸與商業(yè)野心的碰撞，讓AI Agent的競爭既充滿想象力，又暗藏風(fēng)險。

01 破壁之戰(zhàn)

本質(zhì)上，AI Agent的是具備人類思維范式的數(shù)字勞動力。

如果說聊天機器人還停留在“對話”階段，那么Agent則已經(jīng)開始“行動”。簡單來說，可以理解為一種更智能、更自主的AI應(yīng)用，它不僅能回答問題，還能執(zhí)行任務(wù)、完成交易。

它們可以被應(yīng)用于各種場景，如客戶服務(wù)、金融分析、軟件開發(fā)等，極大地提高了生產(chǎn)力和效率。

以大語言模型為“大腦”，AI Agent不僅能理解指令表層語義，更能捕捉隱含需求。例如用戶說“找性價比高的酒店”，Manus會結(jié)合季節(jié)、當(dāng)?shù)鼗顒拥壬舷挛耐评沓觥邦A(yù)算敏感型”或“體驗優(yōu)先型”需求。

如何定义B端产品及B端产品经理方法论

相较于C端产品，B端产品最大的特点是：面向特定领域用户，且数量少得多，但更注重对用户专业领域操作流程的深度挖掘——也就是专业性更强，与业务的结合更紧密。

查看详情 >

而可以期待的是，隨著大模型在多模態(tài)能力上的持續(xù)突破，特別是多模態(tài)融合技術(shù)的迭代升級，AI Agent將能夠更精準地解析并反饋用戶需求，逐步實現(xiàn)類人類的視聽感知與交互能力。

這將使得AI Agent可以應(yīng)用于更廣泛的領(lǐng)域，如醫(yī)療診斷、自動駕駛、智能安防等。

在單體智能持續(xù)優(yōu)化的同時，還可以想象的是，未來的AI Agent或許也能夠突破單機運作模式，通過協(xié)同機制重構(gòu)復(fù)雜任務(wù)處理與決策鏈條。

這種多智能體系統(tǒng)（MAS）通過角色定位機制，能夠使每個智能體如同專業(yè)化分工的人類團隊。

舉例來說，在軟件開發(fā)的場景下，每個AI Agent都有自己的特長，有的擅長編程，有的擅長設(shè)計，還有的專門檢查質(zhì)量，只要它們能很好的協(xié)作，就能一起完成一個高質(zhì)量的軟件項目。

此外，MAS系統(tǒng)還能模擬人類的決策過程，就像人遇到問題時會找人商量一樣，多智能體也可以模擬集體決策的行為，這樣就能為用戶提供更好的信息支持，特別是在一些復(fù)雜的情況下。

比如遇到緊急情況，這些AI智能體就能幫用戶模擬所有可能的情形，及時提供有用的信息，讓用戶能更快更好的作出決定。

可以說，這種“類人”的智能范式，正在重構(gòu)生活、工作的成本結(jié)構(gòu)。而從Manus開始，似乎AI Agent已從概念驗證階段，邁入規(guī)?；涞氐呐R界點。

02 巨頭競速

AI Agent的熱潮并非偶然，而是技術(shù)演進的必然產(chǎn)物。

早在2024年紅杉AI峰會上，吳恩達教授便預(yù)言“AI Agent是AI發(fā)展的下一個關(guān)鍵階段”。事實上，2024年期間，便有不少科技巨頭布局AI Agent。

如谷歌在2024年12月發(fā)布了其最新版大模型Gemini2.0系列，并介紹了多個智能體應(yīng)用，如ProjectAstra。微軟也在2024年10月和11月分別發(fā)布了多個面向銷售、運營等場景的AI智能體，并推出CopilotStudio平臺支持用戶構(gòu)建自主智能體。

進入2025年，Manus的火熱，徹底帶動了市場的情緒。

海外，OpenAI近期公布的商業(yè)化計劃進一步印證AI Agent的B端潛力。其“博士水平”Agent針對科研與軟件開發(fā)場景，每月服務(wù)費高達2萬美元，覆蓋從基礎(chǔ)分析到復(fù)雜任務(wù)的全鏈條需求。

國內(nèi)方面，阿里千問QwQ-32B模型中也集成了與智能體Agent相關(guān)的能力，使其能夠在使用工具的同時進行批判性思考，并根據(jù)環(huán)境反饋調(diào)整推理過程。

另一方面，開源社區(qū)已出現(xiàn)OpenManus、OWL等新產(chǎn)品，基于Manus進行復(fù)刻和創(chuàng)新，有望推動Agent產(chǎn)品百花齊放。

資本市場的狂熱更加印證了這一趨勢。

Manus發(fā)布當(dāng)天，A股超150只AI智能體概念股漲停，立方控股、酷特智能等漲幅超20%。

來源：東方財富

此外，Manus發(fā)布后，券商PPT、分析師路演火速上線，不完全統(tǒng)計顯示，中金、華泰、招商、中泰等數(shù)十家券商研究所進行了路演，其中有分析師上線了多場路演，路演內(nèi)容從技術(shù)原理、AI應(yīng)用、受益方向到落地場景、產(chǎn)業(yè)圈推演，內(nèi)容豐富。

當(dāng)然，在熱潮的背后，也有不同的聲音。不少業(yè)內(nèi)人士認為，Manus屬于AI Agent初級的應(yīng)用，市場的反應(yīng)過大了。

事實也的確如此，AI會進一步拉平信息差，大量收集信息、整理資料的工作可以交給AI，但真正距離生成投資決策，無疑還有很長的路要走。

其中，最大的挑戰(zhàn)在于：AI幻覺的幽靈始終縈繞不去。

03 技術(shù)瓶頸

AI Agent的競爭，入口為王。

當(dāng)掌握更多用戶流量的廠商，有望實現(xiàn)“流量-數(shù)據(jù)-使用體驗”的正向循環(huán)，且隨著開源模型能力升級彌補大廠及中小廠技術(shù)代差，AI產(chǎn)品工程化能力，或拉開產(chǎn)品使用體驗差距。

可盡管展現(xiàn)出巨大的潛力，但AI Agent的爆發(fā)仍面臨多重障礙。從商業(yè)模式到技術(shù)瓶頸，從法規(guī)缺失到用戶認知，每個環(huán)節(jié)都在考驗著行業(yè)的耐心。

首當(dāng)其沖的原因就在于，現(xiàn)有技術(shù)還無法有效地解決AI幻覺的問題。

以當(dāng)紅的Manus來說，雖然在GAIA基準測試中取得了優(yōu)異成績，但在實際應(yīng)用中，仍存在一些不穩(wěn)定的情況。

GAIA基準測試排名來源：ManusAIX平臺

有實測用戶反饋，在處理復(fù)雜任務(wù)時，Manus偶爾會出現(xiàn)任務(wù)執(zhí)行失敗或結(jié)果不準確的問題。在進行股票數(shù)據(jù)分析時，Manus可能會因為數(shù)據(jù)接口的臨時故障或數(shù)據(jù)格式的細微變化，導(dǎo)致分析結(jié)果出現(xiàn)偏差。

再以O(shè)penAI的GPT4.5來說，毫無疑問，這是目前最強的大語言模型。但在SimpleQA基準測試中，GPT-4.5的準確率為62.5%，幻覺率為7.1%，盡管這一成績要遠優(yōu)于GPT-4o、OpenAIo1和o3-mini等模型，但是依然存在著相當(dāng)高的幻覺率。

而這種幻覺，在金融、醫(yī)療等高風(fēng)險領(lǐng)域，任何一點誤差，都可能引發(fā)系統(tǒng)性風(fēng)險。

假設(shè)某醫(yī)療診斷Agent，其誤判罕見病案例的概率為3%，客若應(yīng)用于千萬級用戶群體，那么潛在誤診人數(shù)將高達30萬。

除了幻覺，緊接著的是數(shù)據(jù)孤島與通用能力的矛盾。

AI Agent的效能高度依賴場景數(shù)據(jù)，例如金融風(fēng)控需要實時交易數(shù)據(jù)，而醫(yī)療診斷依賴患者病史庫，數(shù)據(jù)割裂會導(dǎo)致通用型Agent難以跨領(lǐng)域遷移。

最后是倫理與監(jiān)管的滯后性。AI Agent的自主決策涉及隱私泄露、責(zé)任歸屬等倫理問題，比如調(diào)用用戶健康數(shù)據(jù)、自動駕駛事故等等，而全球監(jiān)管框架尚未成熟。

由此可見，AI Agent的破局路徑需從技術(shù)、生態(tài)與監(jiān)管三端協(xié)同推進。而未來，誰能率先突破技術(shù)瓶頸并構(gòu)建合規(guī)生態(tài)，毫無疑問，誰就將主導(dǎo)這場智能體時代的“諾曼底登陸”。

本文由人人都是產(chǎn)品經(jīng)理作者【鋅財經(jīng)】，微信公眾號：【鋅財經(jīng)】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App