谷歌將推出接管電腦的人工智能技術(shù)
想象一下,一個能夠理解你的需求、自動執(zhí)行網(wǎng)上任務(wù)的智能系統(tǒng),無論是購物、預(yù)訂旅行還是日常的信息搜集,都能輕松搞定。谷歌正在研發(fā)的“賈維斯項目”就是這樣一款旨在接管網(wǎng)頁瀏覽器、自動化網(wǎng)絡(luò)任務(wù)的AI產(chǎn)品。
谷歌研發(fā)的“賈維斯”能直接接管瀏覽器,替你搞定所有網(wǎng)絡(luò)任務(wù),而它的對手竟是ChatGPT。
據(jù)三位直接知情人士透露,谷歌(Google)正在開發(fā)一種人工智能,能夠接管用戶的網(wǎng)頁瀏覽器,幫助完成諸如收集資料、購買商品或預(yù)訂航班等任務(wù)。
據(jù)悉,該產(chǎn)品的代號為“Project Jarvis(賈維斯項目)”,其功能與Anthropic公司本周發(fā)布的一款產(chǎn)品類似。
其中兩位知情人士表示,谷歌計劃最早在12月預(yù)覽這一產(chǎn)品,屆時還將發(fā)布其下一代旗艦大型語言模型Gemini(雙子座),該模型將為這款產(chǎn)品提供技術(shù)支持。
這些計劃仍處于暫定狀態(tài),未來可能會發(fā)生變化。
代號“賈維斯”的這款產(chǎn)品名字來源于《鋼鐵俠》中托尼·斯塔克的AI助手。其開發(fā)時間表顯示,盡管谷歌研究人員發(fā)明了許多底層AI技術(shù),但公司在人工智能領(lǐng)域仍面臨來自初創(chuàng)企業(yè)的強(qiáng)勁競爭。
例如,谷歌近期仍在研發(fā)具備“推理能力”的AI,而OpenAI已在9月推出了類似的AI推理功能,這一進(jìn)展得益于他們從谷歌聘請了一位2022年幫助發(fā)明推理方法的研究員。
這一競爭壓力導(dǎo)致谷歌的Gemini聊天機(jī)器人嚴(yán)重落后于ChatGPT,眾多企業(yè)客戶紛紛轉(zhuǎn)向使用OpenAI的語言模型,使得谷歌的Gemini模型難以趕超。上周,為提高AI開發(fā)效率,谷歌將負(fù)責(zé)Gemini聊天機(jī)器人的團(tuán)隊轉(zhuǎn)移至其主要AI部門DeepMind。根據(jù)《The Verge》上周五的報道,下一代Gemini模型預(yù)計將在12月發(fā)布。
AI開發(fā)者們正積極推動“代理”技術(shù)(agent),即無需人工監(jiān)督就能完成復(fù)雜任務(wù)的AI系統(tǒng),作為行業(yè)發(fā)展的下一步。企業(yè)軟件公司如Salesforce、Microsoft和Workday等,正競相使用OpenAI及其他公司的語言模型開發(fā)AI代理,以實現(xiàn)簡單業(yè)務(wù)任務(wù)的自動化,盡管這些代理技術(shù)仍在實驗階段。
谷歌和Anthropic正試圖將“代理”概念進(jìn)一步延伸,研發(fā)可直接與用戶電腦或瀏覽器交互的軟件。OpenAI也在過去一年中積極開發(fā)類似軟件。據(jù)兩位知情人士透露,谷歌的“賈維斯”代理與Anthropic推出的產(chǎn)品類似,能夠通過頻繁截取電腦屏幕截圖來分析當(dāng)前界面內(nèi)容,并根據(jù)用戶指令采取行動,比如點擊按鈕或在文本框中輸入信息。
不過,這兩家公司代理軟件在功能上存在重要差異。Anthropic表示,其產(chǎn)品可以操作用戶電腦上安裝的不同應(yīng)用程序,而谷歌的賈維斯則僅能操作網(wǎng)頁瀏覽器,并且專為Chrome瀏覽器進(jìn)行了優(yōu)化。
三位消息人士稱,至少目前,Jarvis主要面向希望自動化日常網(wǎng)絡(luò)任務(wù)的普通消費者。例如,在今年春季谷歌開發(fā)者大會上,首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)暗示,未來版本的Gemini或許可以自主執(zhí)行多項操作,幫助用戶完成退換鞋子的任務(wù)。
相比之下,Anthropic則將其智能代理定位為可以幫助軟件工程師和其他辦公人員提高工作效率的工具,盡管Anthropic也表示,人們可以將其用于規(guī)劃與朋友的日常出行等個人事務(wù)。
Anthropic展示了一款實驗性的計算機(jī)助手,能夠處理工作和個人任務(wù)。
據(jù)兩位消息人士透露,谷歌可能會首先將Jarvis發(fā)布給一小部分早期測試用戶,以幫助識別和解決其缺陷。目前,這款智能助手的操作速度較慢,因為模型在執(zhí)行每個操作前需要花費幾秒鐘進(jìn)行思考。
谷歌需要說服用戶,相信其AI助手能夠安全處理他們的個人數(shù)據(jù),包括登錄密碼和信用卡信息。這些信息對于AI助手訪問不同網(wǎng)站、根據(jù)客戶需求完成任務(wù)或進(jìn)行購買至關(guān)重要。
眾所周知,大型語言模型(LLM)偶爾會給出錯誤答案。例如,谷歌在搜索引擎中使用LLM驅(qū)動的對話式回答時,最初就出現(xiàn)過不少明顯錯誤。(The Information)
本文由人人都是產(chǎn)品經(jīng)理作者【AI新智能】,微信公眾號:【AI新智能】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!