新“Siri”之戰(zhàn)開打,微軟、亞馬遜、OpenAI已入場

0 評論 3802 瀏覽 7 收藏 20 分鐘

“個人助理”因為一直少有公司入局,導(dǎo)致大眾的使用體驗也不是很好。但自從生成式AI大火之后,個人助理有了更多的可能性,紛紛吸引大公司入局。亞馬遜、微軟也發(fā)布了自己的AI助理。這篇文章,我們就來看下現(xiàn)在個人AI助理的具體情況。

新一代個人AI助理之戰(zhàn),終于打響了。

9月,三家公司發(fā)布了重要預(yù)告,標(biāo)志著這個節(jié)點的到來。這三家公司分別是亞馬遜、微軟和OpenAI。

亞馬遜在21日的秋季硬件發(fā)布會上宣布,“老牌”語音助理Alexa終于要升級,融入大語言模型。新Alexa延遲更低,能理解上下文、記憶此前的對話、無需來回喚醒,而且還會越用越個性化。

同樣是在9月21日,微軟在美國紐約召開秋季發(fā)布會,宣布自26日起將逐步給Windows11用戶推送系列更新,其中一個重要更新是人工智能助手Copilot。Copilot,正如其名“副駕駛”,要成為用戶的數(shù)字管家,將出現(xiàn)在Windows11的側(cè)邊欄,可以語音對話,允許用戶通過其控制PC上的設(shè)置、啟動應(yīng)用程序,或是回答問題等。驅(qū)動Copilot的是OpenAI目前最先進(jìn)的大語言模型GPT-4。

沒過幾天,25日,OpenAI突然放招,發(fā)布公告《ChatGPT現(xiàn)在能看、能聽、能說》,宣布將在未來兩周向付費用戶推送多模態(tài)新功能。多模態(tài)ChatGPT將能基于圖片對話,并進(jìn)行實時語音對話。舉個例子就是,你打開冰箱拍張照,就可以和ChatGPT語音暢聊晚上吃點什么。結(jié)合ChatGPT已經(jīng)以App形式登陸安卓和iOS,相比于無所不知的“大明白”AI,此舉讓ChatGPT更具備個人助理的能力。

除了這三家正式宣布相關(guān)產(chǎn)品升級之外,谷歌在上個月被科技媒體Axios爆料,內(nèi)部郵件顯示,谷歌將利用最新的大語言模型技術(shù)對谷歌助手(Google Assistant)進(jìn)行全新改造。蘋果也被爆料已經(jīng)搭建好大語言模型的框架,在對地圖、Siri在內(nèi)的功能進(jìn)行改造。

科技巨頭在個人助理的戰(zhàn)場上廝殺,上一次出現(xiàn)這樣的場景還是在8年前:Alexa首次發(fā)布于2014年,搭載在亞馬遜智能音箱Echo產(chǎn)品中。也是在那一年,微軟也隨Windows系統(tǒng)推出語音助理Cortana,在中國大陸被稱為“小娜”;谷歌隨安卓4.1推出語音助理Google Now,也就是后來的谷歌助手Google Assistant。那是繼2011年蘋果隨iPhone 4S推出Siri之后,緊跟的三款來自科技巨頭的語音助理競品,拉開了上一代語音助理混戰(zhàn)的序幕。

然而,最初引起大眾極大興趣的語音助理,近幾年已經(jīng)變成了智能終端必備、但人見人嫌的“人工智障”。隨著去年11月底OpenAI發(fā)布ChatGPT,流暢的對話讓上一代個人助理更加相形見絀。在ChatGPT發(fā)布前不久,Alexa被傳出虧損、裁員的消息,而在ChatGPT發(fā)布之后,微軟“殺死”了Cortana,在今年8月將其下線。

上一代個人助理之戰(zhàn)告一段落,新一代個人助理的戰(zhàn)爭已經(jīng)奏響號角。有了大語言模型技術(shù)的加持,這一次的故事會有不同嗎?

01

先讓我們官方給出的例子,看看亞馬遜Alexa、微軟Cortana和OpenAI的多模態(tài)ChatGPT是怎樣的存在。

接入大語言模型的Alexa,“機(jī)器人”味少了。用戶可以說得不直白,如“Alexa,我很冷”來讓Alexa開空調(diào),也可以很抽象,比如“讓這個房間看起來像XX球隊的顏色”。用戶還可以一次說多個指令,如“Alexa,打開噴頭,打開車庫門,關(guān)閉外部燈光”,Alexa就會識別并執(zhí)行這些任務(wù)。

此外,現(xiàn)在,用戶可以對Alexa說“Alexa,讓我們聊天吧”,接下來的對話中都不需要再叫Alexa的名字。并且Alexa會記住用戶的一些信息和偏好,不必每次都對TA做自我介紹。

在一條演示廣告中,用戶和Alexa進(jìn)入聊天模式。用戶想要舉辦一場派對,讓Alexa推薦派對主題,然后再依據(jù)主題推薦合適的場地。當(dāng)用戶和Alexa商量好一切之后,用戶要求“給我的朋友發(fā)送下周五晚上8點的邀請郵件嗎,神秘一些”,Alexa便欣然答應(yīng),并閱讀以“你準(zhǔn)備好度過一個難忘的夜晚了嗎”開頭的郵件給用戶確認(rèn)。

比起過去每句話都要叫一聲“Alexa”、前后不能有連續(xù)、指令必須清晰明確的語音助手體驗,新Alexa的確“更像人”了。相信每一個使用智能家居的用戶,都受夠了變著法地試探怎么說才能讓“小X”和“精靈”們聽懂指令。

已經(jīng)被殺死的微軟Cortana,也就是我們熟悉的“小娜”,基本上和iPhone的Siri差不多。為你打開某個應(yīng)用、播放一首歌曲,或者回答你的問題(除了今天的日期和天氣之類的基礎(chǔ)問題外,基本上是給你顯示網(wǎng)頁搜索結(jié)果)。

而Copilot則更像一個實干型的助手。比如你可以要求Copilot幫你“整理桌面”,它就會把窗口平鋪排列;當(dāng)你瀏覽網(wǎng)頁的時候,可以呼出Copilot讓它幫你總結(jié)、解釋、重寫網(wǎng)頁的內(nèi)容;編寫文案、總結(jié)圖表更是不在話下。更有意思的是,Copilot還具備對圖片的處理能力,你可以在截圖后直接讓Copilot進(jìn)行去除背景、摳出人像等操作。

和升級后的Alexa一樣,Copilot的對話體驗也更偏“人類”,你可以直接讓Copilot“播放讓我集中精力的歌”,它就會找到Spotify上的對應(yīng)歌單。

至于OpenAI的ChatGPT,也在轉(zhuǎn)向多模態(tài)之后變得更貼近生活。

前文已經(jīng)提到,你可以打開冰箱拍張照,和ChatGPT討論晚上吃什么。

在官方給出的另一個例子中,用戶給ChatGPT發(fā)送了一張自行車的照片,問它如何調(diào)低座椅。

ChatGPT提醒用戶查看車的型號,確認(rèn)是有快拆桿還是用螺栓固定,并給出詳細(xì)步驟。用戶還是不明白,拍攝了座椅連接處的照片并圈出某部位,問這是不是快拆桿。

ChatGPT識別出這是螺栓,并建議用內(nèi)六角扳手。

用戶接著發(fā)難,拍攝了一張工具箱的照片,詢問ChatGPT哪一個是內(nèi)六角扳手,它也成功識別了出來。

除了日常生活中的問題解決外,由于具備語音功能,可以“說”的ChatGPT還可以給孩子講睡前故事。更有意思的是,當(dāng)你與人吵架,也可以把能聽會說的ChatGPT擺上來,幫你們梳理思路,解決爭論。

02

不過,不管是新Alexa,還是Copilot和多模態(tài)ChatGPT,都有一定的使用門檻。

Windows11操作系統(tǒng)內(nèi)置的Copilot目前沒有收費的消息,應(yīng)該是免費向用戶開放的,但是要等更新逐步推送。而在辦公套件Microsoft 365上,Copilot屬于高級訂閱功能,每月收費30美元。

OpenAI的多模態(tài)ChatGPT僅向高級訂閱用戶開放,也就是ChatGPT Plus,每月20美元。

而新Alexa未來可能會收費。在亞馬遜秋季發(fā)布會之后,彭博社采訪了即將離任的亞馬遜設(shè)備和服務(wù)部門副總裁大衛(wèi)·林普(David Limp),他表示亞馬遜“絕對”在考慮Alexa的訂閱模式。

林普拒絕討論Alexa若收費的話定價會是多少,并表示“你今天所熟悉和喜愛的Alexa將保持免費”,但為AI聊天機(jī)器人提供動力并不便宜,他承認(rèn)“在云端進(jìn)行模型推理的成本是巨大的?!?/p>

剛開始打仗就想著怎么收費,這看似急功近利,實際上都是上一代個人助理之戰(zhàn)的血淚教訓(xùn)。

個人助理產(chǎn)品早就有,其中的代表是微軟在1995年就推出的微軟鮑勃(Microsoft Bob),彼時比爾·蓋茨(Bill Gates)還是微軟的CEO,在那一年首次登上《福布斯》全球富翁榜榜首。但現(xiàn)在回頭看,鮑勃顯得很臃腫:軟件顯示一座虛擬的房間,就像一間個人辦公室,角落里蹲著卡通狗助手,親切地問你需要什么幫助。

這條路沒有走通,僅一年,微軟就用Clippy代替了鮑勃,就是那個濃眉大眼的曲別針,熱心腸地想幫你做這做那(但什么都做不好),也不成功,是大家批評嘲笑的對象。

到了2011年,一切都改變了,蘋果推出iPhone 4S,“附贈”的還有Siri——一個沒有實體形象,可以長按Home鍵呼出的語音助理,可以幫你打開應(yīng)用,還能回答問題,甚至可以俏皮地給你講笑話,在當(dāng)時頗具“未來感”。

科技巨頭們聞風(fēng)而動。在2014年,語音助理大爆發(fā),占據(jù)安卓的谷歌推出了Google Now(兩年后升級為谷歌助手Google Assistant),占據(jù)PC操作系統(tǒng)的微軟推出了Cortana,而亞馬遜干脆研發(fā)智能音箱設(shè)備,將Alexa塞了進(jìn)去。

電影《她》上映了,電影中男主人公和電腦操作系統(tǒng)的語音助手談戀愛,后者的配音是好萊塢著名演員“寡姐”斯嘉麗·約翰遜(Scarlett Johansson),而語音助手的界面像極了Cortana。電影上映后,《連線》雜志甚至報道有一些iPhone用戶認(rèn)為Siri似乎開始擁有“自我意識”。

到了2019年之前,各家陸續(xù)在更多端口搭載語音助手,谷歌、蘋果、微軟都推出了智能音箱設(shè)備,Alexa和Cortana還搞起了合作,可以在自家語音助手那里呼出對方,以實現(xiàn)更多功能。在國內(nèi),手機(jī)智能語音助手和智能音箱也開始涌現(xiàn),小度、小愛、天貓精靈等悉數(shù)登場。

然而,也是在這個階段,語音助手越來越普及,大眾對其的評價卻慢慢從充滿幻想,變?yōu)榱烁械绞?。在國?nèi),這些語音助手喜提“人工智障”稱號。人們在網(wǎng)上發(fā)帖詢問“Cortana老自己彈出來,怎么關(guān)掉啊”,或是分享智能音箱怎么都聽不懂“關(guān)掉客廳的燈”的簡單指令的短視頻。

以Siri為例,2018年Vetro Analytics的數(shù)據(jù)顯示,Siri的使用率為19.6%,依賴度僅為11%,每位用戶每月平均使用時長只有短短14分鐘。

03

體驗差,直接影響著語音助手產(chǎn)品的商業(yè)前景。

就在ChatGPT推出之前,2022年11月,媒體Business Insider報道,根據(jù)其獲得的內(nèi)部數(shù)據(jù),一季度亞馬遜Worldwide Digital部門運營虧損超過30億美元。這個部門包括從Echo智能音箱、Alexa語音技術(shù)到流媒體服務(wù)的所有內(nèi)容。而熟悉該部門的人士表示,這一虧損是亞馬遜所有業(yè)務(wù)部門中最大的,而且其中大部分損失都要歸咎于Alexa。報道估計,2022年該部門的虧損甚至?xí)_(dá)到100億美元。

Alexa的開局并不差,第一代Echo設(shè)備的銷量超過500萬臺。但是其商業(yè)模式一直是個問題,所有的語音助手其實都有這個問題:提供了服務(wù),然后呢?2018年,亞馬遜預(yù)計2021你那每臺設(shè)備都將虧損5美元。

上一代語音助手并沒有很好的貨幣化舉措,再加上交互的體驗并不好,Alexa期望可以將亞馬遜的電商服務(wù)融合進(jìn)去,但糟糕的體驗無法支撐這個愿景,而頻繁地詢問用戶要不要買東西本身又在損害體驗。用戶到頭來和語音助手間的大部分對話瑣碎而日常,如今天的天氣、日期、打開某個應(yīng)用等,而這并不能讓亞馬遜賺錢。

在裁員、虧損的消息傳出后,亞馬遜表示還是會大力發(fā)展Alexa,但是外界看不到什么新的可能。

ChatGPT的出現(xiàn),讓一切都不同了。

一方面是危機(jī),ChatGPT基于大語言模型的出色對話能力,讓大眾幾乎在第一時間就將之與上一代語音助手進(jìn)行對比,結(jié)論就是“太差了”。問題改變,上一代語音助手不思進(jìn)取、不上大模型,就有可能落后挨打,即便是蘋果和谷歌也得忌憚這種可能性。

除了谷歌在今年8月被傳出要用大語言模型升級谷歌助手以外,蘋果也有類似的傳聞。今年7月,名記馬克·古爾曼(Mark Gurman)爆料,蘋果已經(jīng)完成了其大語言模型的基礎(chǔ)框架,被稱為“Ajax”,定位為支持對話式AI系統(tǒng),并已經(jīng)將其應(yīng)用在地圖、Siri等功能上,做人工智能改進(jìn)。

而在科技巨頭動作之前,早就有各種整合了大模型的個人助理第三方應(yīng)用出現(xiàn)。如今年6月,就有人“復(fù)活”了微軟鮑勃,使用的是GPT-3.5模型,在微軟商店上架。

另一方面是機(jī)遇。以亞馬遜Alexa為代表的智能生態(tài)想象,如今在5G加持、大模型支撐之下,實現(xiàn)的可能性前所未有得大。

本次秋季發(fā)布會,亞馬遜在宣布Alexa將全面升級之時,也已經(jīng)勾勒出了廣闊的前景:亞馬遜將大語言模型注入200多個智能家居API,為Alexa提供更主動無縫管理智能家居所需的背景信息。同時,亞馬遜要推出工具,允許Alexa控制第三方產(chǎn)品的某些功能,后者無需在智能家居生態(tài)系統(tǒng)的工具包中。亞馬遜表示,已經(jīng)和通用電氣、飛利浦、小米、iRobot等合作開發(fā)這些功能。

但現(xiàn)在要面臨的新挑戰(zhàn)也是10年前所沒有的,AI對于個人隱私和數(shù)據(jù)安全的威脅正在被重視。不管是新Alexa、Copilot還是多模態(tài)ChatGPT,在向個性化助理的方向進(jìn)發(fā)時,將不可避免地觸及這一問題。目前,新Alexa發(fā)布,亞馬遜將利用用戶與Alexa的語音交互來訓(xùn)練模型的消息已經(jīng)在被討論。

“誰贏得了個人代理,那就是一件大事。因為你將再也不會去搜索網(wǎng)站或去生產(chǎn)力網(wǎng)站,你再也不會去亞馬遜(購物)?!痹诮衲?月的一場活動上,比爾·蓋茨如是預(yù)測。

問題是,究竟會是誰贏下這場戰(zhàn)爭呢?亦或是像上一代語音助手之戰(zhàn)一樣,轟轟烈烈之后沒有贏家。

參考資料:

1、IT之家:《“大眼夾”重生,變身 ChatGPT 聊天機(jī)器人》

2、智東西:《昨夜微軟與亞馬遜“聯(lián)姻” 還拋出5道AI殺手锏》

3、金融界:《從“全村的希望”到“大裁員”,亞馬遜是如何摧毀Alexa 的?》

4、鈦媒體:《智能手機(jī)之爭的下半場:語音助手之戰(zhàn)》

作者:畢安娣,編輯:王靖

來源公眾號:字母榜(ID:wujicaijing),讓未來不止于大。

本文由人人都是產(chǎn)品經(jīng)理合作媒體@字母榜 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!