都是煙霧彈:聊聊AI瀏覽器
AI瀏覽器正在改變我們獲取信息的方式,從傳統(tǒng)的用戶主動(dòng)搜索轉(zhuǎn)向AI預(yù)判需求。文章探討了AI瀏覽器的發(fā)展歷程、技術(shù)特點(diǎn)以及未來趨勢(shì),分析了傳統(tǒng)瀏覽器巨頭和新興勢(shì)力在這一領(lǐng)域的布局,揭示了AI瀏覽器作為智能體的潛力和挑戰(zhàn)。
大模型一直有個(gè)難以解決的問題:系統(tǒng)的知識(shí)是過時(shí)的,他們難以跟進(jìn)最新的信息。
基于這個(gè)原因,ChatGPT以及DeepSeek都提出了聯(lián)網(wǎng)功能,只不過效果嘛絕不可能太好(絕不會(huì)有用會(huì)從CSDN搜尋程序員要的答案):
AI應(yīng)用團(tuán)隊(duì)的話,一般會(huì)使用爬蟲到各個(gè)目標(biāo)網(wǎng)站整理信息,提前存入到知識(shí)庫(kù),以保證AI應(yīng)用的先進(jìn)性,只不過這在特定領(lǐng)域是適用的,如果是泛?jiǎn)栴},知識(shí)庫(kù)沒有信息的話,模型依舊會(huì)胡說八道。
在這個(gè)基礎(chǔ)上,事實(shí)上各個(gè)AI應(yīng)用團(tuán)隊(duì)對(duì)AI瀏覽器是有訴求的,于是就有很多公司在做相關(guān)功能:2023年:Opera推出Aria,內(nèi)置AI助手,支持網(wǎng)頁(yè)內(nèi)容摘要和實(shí)時(shí)回答;2024年:微軟Edge推出Copilot,嵌入生成式AI,提升生產(chǎn)力;2025年:Brave推出Leo,支持網(wǎng)頁(yè)自動(dòng)摘要和多功能助手;
其實(shí),RAG的本質(zhì)和搜索引擎是很類似的,也可以將AI瀏覽器理解為一個(gè)MCP應(yīng)用,提供給AI產(chǎn)品調(diào)用即可。
PS:拋開瀏覽器提供接口給我使用這個(gè)點(diǎn),我其實(shí)已經(jīng)想不到太多瀏覽器的生存空間了,
我只有在不想看AI回答的情況下,才會(huì)去用搜索,而且一定不是瀏覽器搜索…
以上是AI瀏覽器誕生的一些背景,以及我的一些認(rèn)識(shí),接下來我們來具體的了解其中一些表現(xiàn)不俗的AI瀏覽器。unsetunset從Arc到Diaunsetunset
The Browser Company 成立于2019年,融資1個(gè)多億,估值5.5億美金。
其核心產(chǎn)品是Arc,一款被極客喜愛的瀏覽器,被認(rèn)為遠(yuǎn)超Chrome的用戶體驗(yàn)。
而在24年完成5000萬美金融資后,其毅然決然的放棄了Arc的研發(fā)投入,開始轉(zhuǎn)向?yàn)槿碌腁I瀏覽器研發(fā)。
同年,Dia瀏覽器發(fā)布,這也是現(xiàn)在被認(rèn)為非常優(yōu)秀的AI瀏覽器:
AI不會(huì)以一個(gè)應(yīng)用或者一個(gè)按鈕的形式存在,它將是一個(gè)全新的環(huán)境——建立在網(wǎng)頁(yè)瀏覽器之上的。
這句話透露出一種堅(jiān)定的信念:AI將不再是我們?nèi)缃袼姷暮?jiǎn)單工具,而是將徹底重塑我們與技術(shù)互動(dòng)的方式,成為一個(gè)無處不在、深度融合的全新生態(tài)。
在使用之前,瀏覽器會(huì)搜集很多個(gè)人傾向性信息:
我猜測(cè),他會(huì)根據(jù)用戶的喜好,返回最合適的信息。
只不過使用下來,不知道是不是錯(cuò)覺,感覺跟Manus想要達(dá)到的體驗(yàn)很類似…
這其實(shí)都還是在走OpenAI的L3路徑:
L1級(jí)別(聊天機(jī)器人)。AI系統(tǒng)能夠進(jìn)行基本的對(duì)話和交流,顯示出對(duì)自然語言的基本理解能力,并能對(duì)各種提示和問題作出響應(yīng)。
L2:推理者(Reasoners)。AI系統(tǒng)能夠以人類專家的熟練程度解決復(fù)雜問題,標(biāo)志著其從單純模仿人類行為升級(jí)到展現(xiàn)真實(shí)的智能水平。這些AI不僅擅長(zhǎng)對(duì)話,更具備了解決問題的能力,其推理和決策能力已接近人類水平。
L3:智能體(Agents)。AI系統(tǒng)能夠承擔(dān)復(fù)雜的任務(wù)、作出決策和適應(yīng)不斷變化的環(huán)境,并在無須持續(xù)人類監(jiān)督的情況下自主行動(dòng)。這一階段的AI不僅具備推理能力,更能自主執(zhí)行各類復(fù)雜的操作任務(wù)。
與其說他是瀏覽器,不如說他是智能體…unsetunsetAI需要瀏覽器unsetunset
事實(shí)上,AI需要的不是瀏覽器,AI需要的是最新的知識(shí)庫(kù),并且真人使用的瀏覽器與AI想要的瀏覽器非常不一樣。
比如Manus團(tuán)隊(duì)之前就想打造一款適應(yīng)于AI的瀏覽器,以便AI產(chǎn)品的體驗(yàn)更好,最終他們也確實(shí)這么做了,這里以我的理解來說的話,與其說做了一個(gè)AI瀏覽器,倒不如說做了一個(gè)適應(yīng)于AI使用的知識(shí)庫(kù)。
綜上,事實(shí)上我們是不需要AI瀏覽器的,我們只需要AI Agent,是AI Agent需要一個(gè)適應(yīng)于他的瀏覽器(更確切的說是知識(shí)庫(kù)),比如browser-use、Nova Act SDK。
只不過,瀏覽器是極其重要的關(guān)鍵詞,因?yàn)樗且粋€(gè)非常好的入口,入口代表著流量,流量意味著爭(zhēng)奪,所以很多公司都在開始布局AI瀏覽器,其本質(zhì)其實(shí)在爭(zhēng)奪下一個(gè)Agent入口…
事實(shí)上,從The Browser Company宣布放棄旗艦產(chǎn)品Arc、轉(zhuǎn)投Dia研發(fā)時(shí)就是一個(gè)非常重要的信號(hào):瀏覽器已不再是單純的網(wǎng)頁(yè)容器,而正在經(jīng)歷從”工具”到”智能體”的躍遷。
當(dāng)AI出現(xiàn)那一刻,就宣布了傳統(tǒng)瀏覽器的死亡,因?yàn)槿蠛诵慕换フ谧兓盒畔@取方式:從”用戶主動(dòng)搜索”轉(zhuǎn)向”Agent預(yù)判需求”;交互界面:從”URL+網(wǎng)頁(yè)”轉(zhuǎn)向”多模態(tài)對(duì)話空間”;底層架構(gòu):從”頁(yè)面渲染引擎”轉(zhuǎn)向”實(shí)時(shí)數(shù)據(jù)處理器”;
微軟Edge Copilot的代碼自動(dòng)補(bǔ)全功能已展示這種轉(zhuǎn)變:當(dāng)開發(fā)者輸入注釋時(shí),AI直接調(diào)用GitHub最新代碼庫(kù)生成解決方案,整個(gè)過程無需打開任何技術(shù)文檔網(wǎng)站…unsetunset入口之爭(zhēng)unsetunset
隨著AI Agent的崛起,科技巨頭紛紛布局,爭(zhēng)奪下一代用戶“入口”?,F(xiàn)在有兩類玩家:傳統(tǒng)玩家
對(duì)于已有入口占領(lǐng)者,會(huì)發(fā)揮好本來優(yōu)勢(shì):微軟:將Copilot深度植入Windows內(nèi)核,實(shí)現(xiàn)系統(tǒng)級(jí)Agent調(diào)用;谷歌:通過Gemini重構(gòu)Chrome,搜索結(jié)果直接呈現(xiàn)動(dòng)態(tài)生成的3D模型演示;蘋果:Siri升級(jí)為Proactive Agent,可跨設(shè)備預(yù)測(cè)用戶行為軌跡;新秀玩家
與此同時(shí),各種新興勢(shì)力也在沖擊這一領(lǐng)域:Dia瀏覽器:通過實(shí)時(shí)屏幕語義分析,在用戶點(diǎn)擊前預(yù)加載所需信息;Manus智能體:首創(chuàng)”認(rèn)知沙盒”技術(shù),可并行運(yùn)行多個(gè)Agent處理復(fù)雜任務(wù);Nova Act SDK:提供跨平臺(tái)Agent運(yùn)行時(shí),打破瀏覽器與本地應(yīng)用的界限;
這些公司通過不斷擴(kuò)展AI Agent的能力,推動(dòng)用戶體驗(yàn)的提升,爭(zhēng)奪用戶的核心“入口”,這個(gè)行為不再局限于操作界面,而是進(jìn)入了工作流、決策支持和深度集成的層面。
具體到行業(yè)應(yīng)用,AI Agent在各領(lǐng)域中的應(yīng)用正以驚人的速度改變傳統(tǒng)的用戶體驗(yàn)。
例如,在醫(yī)療行業(yè),AI Agent能夠分析患者的病史、癥狀,并根據(jù)最新的醫(yī)學(xué)研究提出精準(zhǔn)的治療建議。
在教育領(lǐng)域,AI Agent通過個(gè)性化學(xué)習(xí)路徑幫助學(xué)生提高成績(jī),在金融行業(yè),AI Agent可以幫助金融顧問根據(jù)實(shí)時(shí)數(shù)據(jù)做出投資決策。
在這些應(yīng)用中,AI Agent的存在不再是“工具”,而是用戶的“合伙人”。用戶不再只是被動(dòng)接受信息,而是通過AI Agent主動(dòng)獲取、分析和執(zhí)行任務(wù),這使得用戶體驗(yàn)變得更加智能化、動(dòng)態(tài)化。
盡管AI Agent的前景廣闊,但它的發(fā)展仍面臨諸多挑戰(zhàn)。其中包括如何解決隱私保護(hù)問題、如何確保數(shù)據(jù)安全、以及如何實(shí)現(xiàn)算法的透明性等…
本文由人人都是產(chǎn)品經(jīng)理作者【汪仔3905】,微信公眾號(hào):【葉小釵】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!