智譜的AtuoGLM實測–通用agent到來

施拉格e
0 評論 2296 瀏覽 2 收藏 20 分鐘
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

智譜清言近期發(fā)布的AutoGLM沉思,作為一款對標(biāo)OpenAI Operator的智能體產(chǎn)品,引發(fā)了廣泛關(guān)注。本文將為你帶來AutoGLM沉思的深度使用體驗,從其核心功能、實際應(yīng)用場景到操作感受,全方位剖析這款產(chǎn)品的優(yōu)勢與不足。

智譜在agent走的不快,但是很穩(wěn)!

3月31日,智譜在中關(guān)村上發(fā)布了它們的auto glm沉思,我也是第一時間使用,及時給大家更新這篇產(chǎn)品使用體驗,告訴大家這款對標(biāo)open AI的operater的GLM到底怎么樣

說到這,智譜其實在去年就發(fā)布了它們的glm產(chǎn)品,在發(fā)布會上,我們可以看到智譜可以幫助用戶導(dǎo)航、自動購物或者寫好評等等,看起來十分炫酷。不過當(dāng)時還是處于內(nèi)測階段并沒有對外發(fā)布,只知道看完發(fā)布會的我是很震驚的,心想這么快已經(jīng)有這樣的產(chǎn)品出現(xiàn)了,讓我一度以為AGI真的不遠(yuǎn)了。

先說第一點,智譜在這次發(fā)布會上,一共發(fā)布了兩個產(chǎn)品,第一個是沉思,第二個是沉思glm,嗯…….,聽上去差不多,但其實并不一樣

首先呢,沉思版本你可以理解為deep research,就是類似于Google和open AI的深度調(diào)研功能,用戶提出問題之后,它會根據(jù)用戶的問題不斷調(diào)用所需要的函數(shù)信息,來滿足用戶信息的需要,最大化使模型的回答質(zhì)量更佳的優(yōu)質(zhì),當(dāng)然了,這種也會更加的耗時,因為模型會根據(jù)用戶的問題來分析,然后不斷的尋找最優(yōu)解,什么意思呢?

比如,你現(xiàn)在想去西湖旅游,但是你根本不知道旅行路線,傳統(tǒng)方法你肯定要去各大平臺去挨個搜取信息,比如去抖音看博主怎么玩的,去小紅書看出行路線圖,然后在這個過程中你還需要不斷的翻用戶評論,深怕自己踩坑了或者被宰了,最后你經(jīng)過長達一個小時或者一天的時間,你終于規(guī)劃出來一條自己認(rèn)為還不錯的旅行路線,但是你已經(jīng)累趴了,就說你看到下面這種情況,你會不會窒息?反正我是直接b潰住了

但是現(xiàn)在,你只需要把這個問題,交給智譜的沉思或者任何帶有deep research的功能的大模型,它們會幫你解決這個問題,我這里現(xiàn)場實操一下

dangdangdangdang,一個智能版西湖旅游攻略就出來了,當(dāng)然了我覺得還是不足的,包括吃什么,咋哪里吃,怎么規(guī)劃時間路線和交通工具等等,不過這也是因為我沒有具體的prompt,如果大家想要有更好的出行計劃選擇,就需要給出完整的信息,比如預(yù)算啊,出發(fā)地啊什么的,這樣的效果會更好一些,而且從我使用體驗來看,如果你想要選擇酒店的時候,你也可以利用沉思功能,根據(jù)目的地選擇便宜并且距離近的酒店,把它放在規(guī)劃里面。(友情提示:圖片里的一日游路線不要嘗試,這完全是把人類當(dāng)猴耍……)

另外,從深思的過程來看,它確實在很努力的搜集信息,看它不斷的查找,又不斷的否定自己,真的有在很努力的工作,是個和負(fù)責(zé)的打工人,甚至讓我有點心疼。

值得一提的是,盡管你要求它在抖音和小紅書里面搜索,但是它還會在別的平臺盡可能調(diào)用一些信息,我猜測,可能智譜優(yōu)先地插件是知乎,因為我在每一次的試用它的函數(shù)都有知乎,另外一方面可能是因為它最大化滿足信息源所帶來結(jié)果的客觀性,避免過擬合。

沉思版本就將到這里,下面來講一講這次的重頭戲“沉思GLM”。

所謂沉思GLM,就是一個具有自主規(guī)劃、思考和行動能力的agent,我相信大家對于agent都一定不陌生,我在這里列出了一個清單,結(jié)合目前市面上所有的agent,然后給出一個分類

需要提醒的是,這個分類是根據(jù)agent類目的一個整理,和我們之前看到的那種l1級別的AI劃分并不一樣,做這個表格的初衷是因為,我發(fā)現(xiàn)agent這個詞在被濫用,行業(yè)內(nèi)可能都知道agent是什么意思,但是我身邊還有很多用AI的人,對于agent這個詞熟悉又陌生,在他們看來豆包的agent和manus好像都是一樣的,但為什么后者看上去難度就更大呢?

比如,我們說的agent一般都指第三種,也就是l3級別的,能基于大模型加上工具鏈,從而實現(xiàn)端到端的專業(yè)任務(wù)執(zhí)行,它的核心是規(guī)劃和執(zhí)行,這也是我們最近的研究和商業(yè)的重點,市面上很多人工智能公司都在往這個方向發(fā)展,簡單來說無論是manus還是智譜的glm本質(zhì)上都是一樣的,具備這種規(guī)劃和行動能力,在未來無非就是朝著不斷的優(yōu)化發(fā)展,這里面有,速度響應(yīng)更快、幻覺更少、插件調(diào)用更多等等,所以這些工具給我們一個框架,證明這種模式行得通并且有效,也為以后的agent發(fā)展提供了一個清晰的路徑。

至于我們現(xiàn)在都在說的通用agent,我個人感覺是非常模糊的,主要是因為這個詞被大家用爛了,manus出來的時候我們說它是通用agent,現(xiàn)在誰家出來一個產(chǎn)品大家都要說是通用agent,就是在l3和l4之間來回徘徊,因為沒有準(zhǔn)確的定義,或者公眾對于agi的期待太高,導(dǎo)致這個詞一直在被濫用

因此,拋開這些定義來看的話,結(jié)合這些agent的功能,我們可以給這些市面上agent工具做了一個區(qū)分,也是為了讓大家有一個更加清晰明了的認(rèn)知。

回到正題,來說一下這一次智譜的agent,根據(jù)官網(wǎng)所說這一次的,它們給其命名為auto glm,其核心突破在于實現(xiàn) “邊想邊干” 的自主任務(wù)執(zhí)行能力,推動 AI 從 “信息處理” 升級為 “目標(biāo)驅(qū)動的行動者”。

主要功能有三個:

1,深度思考:基于 GLM-Z1-Rumination 沉思模型,模擬人類復(fù)雜決策過程。例如,處理 “分析 2025 年 Q2 互聯(lián)網(wǎng)大廠 AI 動向” 時,能自主規(guī)劃 “技術(shù)熱點梳理→網(wǎng)頁檢索→信息整合→報告生成” 的全流程,平均思考步驟超過 20 步。類似于open AI的o1.

2,感知世界:突破傳統(tǒng) API 限制,通過純前端視覺感知方案模擬人類操作。例如,可自動登錄知網(wǎng)、小紅書等平臺,抓取圖文信息并分析用戶真實評論,生成香港旅行攻略時能突破封閉內(nèi)容生態(tài)的信息壁壘。

這一點是比較有意思的,官方說的這種GUI閱讀能力,可以讓模型不斷的閱讀網(wǎng)頁內(nèi)容,擺脫傳統(tǒng)的API鏈接,什么意思呢?簡單來說,以前我們做一個agent,想要獲取外部鏈接有以下幾種困難:

第一,你需要一個插件,如果沒有這個插件,你很難獲取到完整且合格的內(nèi)容,就拿扣子(coze)來說,我每次工作流都需要用到它的網(wǎng)頁插件來調(diào)取內(nèi)容,這就造成什么問題呢,不方便,比如你需要不斷的提醒agent,再遇鏈接問題,要及時去調(diào)動,否則它可能會直接忽略,不具備自主能力。

第二,我們都知道人工智能時代,數(shù)據(jù)飛輪(數(shù)據(jù)飛輪是一種基于數(shù)據(jù)驅(qū)動的業(yè)務(wù)增長模型,其核心概念是通過不斷地收集、分析和利用數(shù)據(jù),來推動業(yè)務(wù)各個環(huán)節(jié)的優(yōu)化和提升,從而形成一個正向循環(huán),促進業(yè)務(wù)持續(xù)增長。)的重要性,但是獲取數(shù)據(jù)是沒有那么簡單的。

人工智能時代尤其是gpt出現(xiàn)的這幾年幾乎把互聯(lián)網(wǎng)20多年的數(shù)據(jù)跑完了,未來像小紅書、知乎、貼吧、抖音這種平臺的數(shù)據(jù)會越來越有價值,但是它們不會把這些數(shù)據(jù)給你的,那怎么辦呢?有同學(xué)說,爬蟲,先不說技術(shù)上能不能實現(xiàn)的同,即便你爬到了你也要面臨及其嚴(yán)峻的法律風(fēng)險,之前openai爬去烏克蘭一家電商公司,直接給對方網(wǎng)站整崩潰了,所以這在道道德上也說不過去,肯定不利于商業(yè)的長期發(fā)展。

所以,智譜的使用方法是,我不調(diào)用,我也不爬蟲,我就直接看,我一邊瀏覽一邊抄,比如我就用它跑了幾個小紅書的案例,它就瘋狂的去幫我打開小紅書的網(wǎng)頁,中間除了讓我掃碼登陸(為了防止你不是真人),其他的都由他自主完成,完全沒有考慮我的感受,這家伙壞的很。

我這里隨便放一張圖,大家自行感受一下……..

3,工具使用:整合智譜自研的 AutoGLM 設(shè)備操作能力,支持網(wǎng)頁瀏覽、郵件發(fā)送、文檔生成等跨平臺任務(wù)。例如,接收到 “賺取 100 元” 的任務(wù)時,能自主完成征稿啟事搜索、稿件撰寫、郵件投稿等操作。這點看上去很誘人,但是實際效果我們需要測試才知道。

那如何才能使用auto glm呢?

首先你需要打開官方網(wǎng)站,我把鏈接放在這里

https://autoglm-research.zhipuai.cn/#get_started

打開之后你會看到官方給出很多案例,感興趣的小伙伴可以觀看一下

接著你只需要看到下方的開始體驗就行,很遺憾的事,目前autoglm是只能支持Google插件才能使用的,其他版本后續(xù)可能還會更新,所以google這一步需要大家自己解決。

這里提醒一下,大家在客戶端或者網(wǎng)頁端都是可以使用智譜的沉思的,無論你有沒有g(shù)oogle插件,只是說你想要用autoglm的話,你還需要進行下一步地操作。

其實也很簡單,就是你惦點擊下載之后,再把點擊google,選擇擴展程序,點擊開發(fā)者模式,然后把這個文件拖入到google里面進去,就可以了。

完成之后,你就可以在google的任何界面去隨時使用智譜,甚至在使用chatGPT的時候也可以(逆天了)

然后,這個時候你再打開智譜的時候,你就會神奇的發(fā)現(xiàn),你的頁面有一個新的功能,你可以點擊旁邊的沉思使用他們最新的研究功能,也可以點擊autoglm沉思,體驗他們的agent。

那他們的智譜agent到底怎么樣呢?

我一共跑了5個case左右,實話講,效果一般,不如發(fā)布會和廣告那樣效果好,我身邊的幾個伙伴都測試了一下,幾乎都對其變現(xiàn)能力給出一般的評價。

但是人家其實也說了,目前是preview版本,很多功能還在測試,我個人覺得智譜的對agent的思考是有的,起碼這樣的一個框架是實現(xiàn)了的,規(guī)劃、思考和行動,都能鏈接在一起,只是說綜合起來可能還差點意思,但是不妨礙它仍然是一個很優(yōu)秀的作品。

比如,它的思考能力確實很好,前文我說過了,當(dāng)你在輸入問題的時候他會不斷的進行分析,然后篩選信息,在進行自動化操作,這一部分就是相當(dāng)于深度思考?深度研究?agent了。

比如,我下面這個,我讓智譜去幫我搜集open AI的最近一周的相關(guān)帖子,它就真的在不斷的大量閱讀,不斷的翻,而不像我們說的那樣,走馬觀花似得

這里可以看出來,它在瘋狂的閱讀小紅書內(nèi)容。

順便把我的prompt放進來,供大家參考

##你是一位OpenAI的公關(guān)團隊人員,你現(xiàn)在閱讀最近一周關(guān)于小紅書的帖子,找出一位情緒化最嚴(yán)重的帖子,然后進行友好的用戶回復(fù)

這里面,智譜autoglm一共進行了這幾個步驟,先去分析問題,確定用戶想要問的是什么,然后執(zhí)行命令,打開小紅書,請求登陸,閱讀相關(guān)文章,然后判斷哪一個情緒化最嚴(yán)重,再代入人物視角,進行回復(fù)

然后呢,它會選擇一篇帖子進行回復(fù),你只需要點擊確定,然后就可以評論了,不過我目前使用起來,這個功能不穩(wěn)定,起碼我有一半的case都沒有自動回復(fù)

其次來說一下,autoglm的插件調(diào)用功能還是很豐富的,就我目前使用下來,是可以打開地圖、天氣以及小紅書、抖音等等軟件內(nèi)容的,這里面需要提醒一下,即便你電腦沒有下載小紅書,你的autoglm照樣可以打開它,因為它不是直接打開小紅書客戶端的,可以簡單理解為不在一個圖層,所以影響不大。

比如,我用這個它去操作一下這個天氣功能

還不錯,我以為他會打開一些商業(yè)天氣網(wǎng)站,結(jié)果直接跳出來了中央氣象臺,還是很官方的

我這里還是建議大家多跑跑case,也許會有一些新的發(fā)現(xiàn),畢竟還是免費的,沒有限制使用?。。」膺@一點就是最大的優(yōu)點,直接點贊!?。?/p>

但是,我還是要說一下autoglm的問題的,算是一些小建議:

首先,插件的調(diào)用問題很混亂,比如我想要智譜去在小紅書和抖音去找信息,但是它還是會跳轉(zhuǎn)到知乎或者別的平臺,這就很不方便,萬一有些用戶在做需求調(diào)研的時候,只想看個別平臺,而忽略某些平臺,這樣就很不方便。

其次,當(dāng)autoglm在行動的時候,用戶在使用別的軟件或者智譜的時候,會造成其后臺停止,這就很雞肋了,因為既然是自主行動,那我在進行別的操作應(yīng)該完全不受限制,起碼glm需要有一個單獨獨立的窗口

最后,也就是這種agent通用的一個毛病,也是我最頭疼的,速度太慢,比如,我想要選找路線,明明只需要一個高德地圖的事,它卻拐彎抹角幾十分鐘,甚至還沒有解決好,那這樣我還不如自己導(dǎo)航來的快

起初我還以為我的prompt不夠明確,但是即便我提示它怎么做,它還是會照樣那樣做。。。。。。

我想要的是,belike,請你跟我這樣做,我就跟你這樣做的那種效果

最后的最后,希望大家積極嘗試,還是那句話,早用早享受,解放生產(chǎn)力,起碼讓glm去給我進行一些需求分析和用戶調(diào)研,還是很方便的,畢竟我們刷抖音也是只是想刷抖音,工作這種事還是給AI比較好。

原來這才是打工人真正的護眼神藥,媽媽再也不用擔(dān)心我的眼睛了!

本文由 @施拉格e 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
17451人已学习14篇文章
MVP是指开发团队通过提供最小化可行产品获取用户反馈,并在这个最小化可行产品上持续快速迭代,直到产品到达一个相对稳定的阶段。本专题的文章分享了如何做MVP产品。
专题
12093人已学习12篇文章
电商平台,是兼具媒体和消费场景两大属性的平台,因此衍生出了多种营销模式。本专题的文章分享了电商如何做营销。
专题
31845人已学习21篇文章
产品经理每月必须做的事情,10个用户调查,关注100个用户博客,收集1000个用户的反馈。
专题
13586人已学习13篇文章
广告是互联网的最大的商业模式,已经逐步形成一个巨大的行业,整个互联网广告也在持续增长中。本专题的文章分享了关于对互联网广告的思考与分析
专题
11633人已学习11篇文章
随着互联互通的发展,虚拟与现实之间的距离在逐渐缩小,未来数字设计也在发生着变化。本专题的文章分享了数字未来设计趋势。
专题
35736人已学习14篇文章
原型对于产品经理来说是一门必修课。