千萬(wàn)別認(rèn)為對(duì)話式交互是進(jìn)步!詳解對(duì)話式交互的6大缺點(diǎn)。
本文深入探討了對(duì)話式交互相較于傳統(tǒng)的圖形用戶界面(GUI)的優(yōu)缺點(diǎn),揭示了背后的技術(shù)驅(qū)動(dòng)因素,并分析了在不同場(chǎng)景下的應(yīng)用效果。通過(guò)全面比較,我們可以更清晰地理解兩種交互方式的適用性和局限性。
最近兩年很多AI產(chǎn)品出現(xiàn)之后都采用了對(duì)話式(Chat)的形式。導(dǎo)致很多人認(rèn)為對(duì)話形式(Chat)交互相對(duì)于常見(jiàn)的圖形化界面是一種進(jìn)步。事實(shí)并非如此。
這種錯(cuò)誤認(rèn)知可能因?yàn)榘袮I技術(shù)與對(duì)話式交互畫上了等號(hào),在看到AI技術(shù)迅猛發(fā)展的時(shí)候。就同樣認(rèn)為對(duì)話式更優(yōu)秀。
但這種交互形式被眾多AI產(chǎn)品使用的原因只是因?yàn)檫@一波AI浪潮最大的技術(shù)進(jìn)步是大語(yǔ)言模型。而大語(yǔ)言模型的核心功能之一就是生成內(nèi)容。加上OpenAI最早使用了這種形式被后來(lái)者效仿。
在2017年前后上一波AI浪潮中,主要的技術(shù)發(fā)展方向是計(jì)算機(jī)視覺(jué),像人臉識(shí)別、自動(dòng)駕駛、OCR等等都是基于計(jì)算機(jī)視覺(jué)技術(shù)衍生的。
由于其技術(shù)突破方向并非語(yǔ)言方向所以就沒(méi)有產(chǎn)生對(duì)話式形式,由此我們可以看出:對(duì)話式交互只是一個(gè)附屬形式并非更優(yōu)秀。
一、對(duì)話式交互和圖形化界面相比有哪些缺點(diǎn)
1. 操作效率
GUI的操作過(guò)程其實(shí)是眼、手、預(yù)置信息等三方面協(xié)同,眼睛瞄準(zhǔn)、手點(diǎn)擊、預(yù)置信息觸發(fā)對(duì)應(yīng)操作,但在Chat形式中幾乎全部依賴手了,所以操作效率下降。
其實(shí)很多圖形化界面的交互形式點(diǎn)擊幾次就能解決的問(wèn)題使用對(duì)話形式可能需要多輪次、多描述才能完成,例如典型的訂外賣場(chǎng)景:
使用圖形化界面是這樣的:
對(duì)4項(xiàng)不同的設(shè)置,只需要點(diǎn)擊4下就可以了,但如果使用chat的形式可能是這樣的:
系統(tǒng):你要大杯還是小杯?
用戶:大杯
系統(tǒng):零卡糖還是蔗糖?
用戶:0卡糖
系統(tǒng):正常糖量還是半糖?
用戶:正常糖
系統(tǒng):熱的還是溫的還是冰的?
用戶:熱的
可以看出需要幾輪對(duì)話此案完成圖形化界面中4次點(diǎn)擊就能完成的操作,整體效率是很低的,這種形式也是非常真實(shí)的,不通過(guò)手機(jī)點(diǎn)單而是在門店直接下單店員真的需要把這些問(wèn)題都問(wèn)一遍。
但并非所有場(chǎng)景下Chat形式都比GUI形式低效,例如使用手機(jī)語(yǔ)音助手創(chuàng)建一個(gè)日程,可以退直接用語(yǔ)音指令:明天下午3點(diǎn)提醒我搶火車票,而不需要打開(kāi)某待辦APP-點(diǎn)創(chuàng)建待辦按鈕-輸入待辦各個(gè)字段的文字-點(diǎn)擊保存。
所以還是存在一個(gè)臨界值,需要從點(diǎn)擊次數(shù)、路徑長(zhǎng)度、迷失度、可通訊通道場(chǎng)景等方面綜合衡量。
Chat形式的每一次交互包含了操作+對(duì)象+修改內(nèi)容的具體描述,例如在修改代碼時(shí),需要給出指令:增大登錄按鈕的寬度到500PX,需要把GUI交互中修改方式、修改對(duì)象、修改數(shù)值等全部使用自然語(yǔ)言描述一遍,因此會(huì)降低操作效率。
2. 操作歧義
由于操作過(guò)程完全依賴自然語(yǔ)言的描述,因此當(dāng)用戶輸入的文字不準(zhǔn)確、有錯(cuò)字、多含義時(shí),可能產(chǎn)生錯(cuò)誤的結(jié)果。對(duì)用戶輸入準(zhǔn)確率的保證性較低。
出現(xiàn)錯(cuò)誤后還需要多加一輪對(duì)話進(jìn)行澄清,這又會(huì)進(jìn)一步影響操作效率。
例如,如果用戶想要搜索“蘋果的營(yíng)養(yǎng)價(jià)值”,但不小心打成了“萍果..”,AI可能會(huì)將“萍果”理解為一個(gè)不常見(jiàn)或者不存在的詞匯,從而無(wú)法正確提供關(guān)于蘋果的營(yíng)養(yǎng)信息?;蚴墙o出與用戶期望不符的結(jié)果。
這是因?yàn)椤疤O果”是一個(gè)常見(jiàn)詞匯,而“萍果”可能不是,導(dǎo)致AI無(wú)法正確理解用戶的查詢意圖。
同樣的,作者真實(shí)的經(jīng)歷是在某電商平臺(tái)搜索【蘋果】結(jié)果顯示了一堆手機(jī),其實(shí)作者本身是想買點(diǎn)紅富士吃吃。對(duì)于有多重含義的詞匯使用對(duì)話式交互就很容易出現(xiàn)這樣的問(wèn)題。
當(dāng)然我們可以通過(guò)更完整的描述來(lái)避免誤解,但輸入更完整的描述本身就是更高的操作成本了。
3. 自我描述能力
GUI形式會(huì)把產(chǎn)品的能力直接體現(xiàn)在用戶界面中,如搜索框、時(shí)間選擇器、下載等能力,Chat形式最大的問(wèn)題是手續(xù)愛(ài)你需要用戶能想到,這一步就把產(chǎn)品設(shè)計(jì)時(shí)從要求產(chǎn)品變成了要求用戶,對(duì)產(chǎn)品清晰性的影響較大。
在下圖中用戶可以很清晰的知道某篇筆記能導(dǎo)出、且能以多種格式導(dǎo)出,但Chat的形式則需要用戶先想到。
4. 用戶習(xí)慣
工具需要細(xì)分,手指甲和腳指甲的剪刀都會(huì)細(xì)分,何況是各種大需求,微信里可以打車但滴滴APP的日活還有幾億。
想打破用戶的習(xí)慣需要并非不可以,但一定需要新方案的體驗(yàn)強(qiáng)于舊方案體驗(yàn)+遷移成本。
人類會(huì)用自己習(xí)慣的方式解決問(wèn)題,路徑依賴會(huì)影響人類在擁有多工具時(shí)的選擇,而GUI在過(guò)去的10年已經(jīng)為用戶形成了極強(qiáng)的操作習(xí)慣。
還有一些生活中下意識(shí)的習(xí)慣也會(huì)有影響,例如兩個(gè)對(duì)話時(shí),往往不是只只針對(duì)唯一話題進(jìn)行多輪次對(duì)話,可能是兩三個(gè)主題并行的,此時(shí)AI在理解時(shí)就會(huì)比較困難(因?yàn)槌霈F(xiàn)了一句與上下文無(wú)關(guān)的話)。
如果是在使用了多個(gè)模型/提示詞/agent的產(chǎn)品中,這個(gè)問(wèn)題可能會(huì)更加明顯,因?yàn)樵谟脩粼趯?duì)話過(guò)程中切換話題時(shí)是否能馬上切換到其他模型/提示詞/agent來(lái)回答無(wú)法確定。
5. 能力精細(xì)度
即使模型能力范圍越來(lái)越大,但很難想象把所有應(yīng)用集中到一起會(huì)是什么樣子,分類是人腦生理結(jié)構(gòu)決定的人處理任務(wù)/信息的方式。工具的ALL in one是個(gè)偽命題。
現(xiàn)在大多數(shù)通用Chat,既能寫代碼也能畫表格,但通用的結(jié)果一定是不夠精深,在細(xì)分能力是不夠強(qiáng)大。
還是以畫表格為例,通用Chatbot可以實(shí)現(xiàn)快速把數(shù)據(jù)填充到表格,但不一定能設(shè)置某行固定。更復(fù)雜的科學(xué)計(jì)算公式也無(wú)法實(shí)現(xiàn)。
以WPS為例,功能豐富到需要使用十幾個(gè)標(biāo)簽+每個(gè)標(biāo)簽下數(shù)十個(gè)子功能來(lái)呈現(xiàn)。
難以想象使用通用Chatbot如何幫助用戶觸達(dá)這些功能,而這還只是一個(gè)WPS中的功能點(diǎn),所以作者堅(jiān)定的認(rèn)為工具產(chǎn)品的All in one是個(gè)偽命題。追求通用則一定在精細(xì)化能力上會(huì)有不足,就像我們?cè)O(shè)計(jì)師常用的設(shè)計(jì)規(guī)范,在追求通用性的同時(shí)面對(duì)不同業(yè)務(wù)場(chǎng)景的個(gè)性化能力就會(huì)被削弱。
6. 多語(yǔ)言適配
在面對(duì)產(chǎn)品國(guó)際化、多語(yǔ)言適配的問(wèn)題中,圖形化用戶界面只需要把界面中出現(xiàn)的文字做翻譯即可,部分還可以使用圖標(biāo)替代更具通用性。
但大模型的輸入、輸出都使用了大量的文字,那么面對(duì)多語(yǔ)言是否能很好的支持是個(gè)問(wèn)題。
對(duì)于一些小語(yǔ)種,可能根本沒(méi)有足夠用于模型訓(xùn)練的數(shù)據(jù)量,那么模型就更加不可能提供優(yōu)質(zhì)服務(wù)了。
以上是對(duì)話式交互的6大缺點(diǎn)。下面再簡(jiǎn)單聊聊
二、對(duì)話式交互的優(yōu)點(diǎn)
1. 易學(xué)性
對(duì)話式交互很直觀,用戶無(wú)需學(xué)習(xí)復(fù)雜的界面或命令,可以直接用自己的語(yǔ)言與系統(tǒng)交流。就像功能點(diǎn)非常多產(chǎn)品里面我們經(jīng)常找不到需要的功能在哪里一樣,對(duì)話式交互沒(méi)有這個(gè)問(wèn)題,因?yàn)椴恍枰趶?fù)雜的界面中尋找。但依然需要用戶已有【這個(gè)產(chǎn)品用這個(gè)功能】的認(rèn)知。
2. 靈活性
用戶可以通過(guò)對(duì)話來(lái)表達(dá)繁瑣的命令,例如手機(jī)語(yǔ)音助手的一句話創(chuàng)建待辦,但要注意這里所說(shuō)的【繁瑣的命令】還不是【復(fù)雜的命令】,只能解決多步驟但每一步都比較簡(jiǎn)單的問(wèn)題。
圖形用戶界面中,用戶只能點(diǎn)擊到當(dāng)前顯示出來(lái)的元素(如按鈕),操作依賴屏幕可顯示范圍,但對(duì)話式交互沒(méi)有這個(gè)問(wèn)題,因?yàn)橐呀?jīng)用【描述】代替了屏幕中必須顯示出來(lái)的功能。
3. 設(shè)備適應(yīng)性強(qiáng)
對(duì)話式交互可以很容易地集成到移動(dòng)設(shè)備、智能揚(yáng)聲器或其他物聯(lián)網(wǎng)設(shè)備中,只要設(shè)備有麥克風(fēng)、揚(yáng)聲器、處理器即可滿足基本的對(duì)話式交互(這里特指語(yǔ)音交互了),減少了屏幕在設(shè)備中的成本。
這方面的實(shí)例已經(jīng)非常多了,就像小米的智能音箱,還有商場(chǎng)中的服務(wù)機(jī)器人。
4. 擴(kuò)展性
可以添加新的功能和服務(wù),而用戶無(wú)需下載更新或?qū)W習(xí)新的交互方式。正式因?yàn)闆](méi)有圖形界面的限制,在增加功能時(shí)也不需要考慮界面顯示能力,不需要像GUI時(shí)代一樣因?yàn)榭臻g只能擺放有限個(gè)入口而爭(zhēng)來(lái)爭(zhēng)去了。
但這一點(diǎn)同樣會(huì)帶來(lái)曝光率的問(wèn)題,因?yàn)槟芰Φ臄U(kuò)展對(duì)用戶來(lái)說(shuō)是隱形的過(guò)程,即使使用新版本功能引導(dǎo)也只能被用戶看到一次(其實(shí)大概率一次都看不到就點(diǎn)擊關(guān)閉了)。
而不像GUI那樣有一個(gè)固定的位置顯示,經(jīng)常能被用戶看到。
專欄作家
杜昭,微信公眾號(hào):AI與用戶體驗(yàn),人人都是產(chǎn)品經(jīng)理專欄作者,實(shí)戰(zhàn)派設(shè)計(jì)師,目前在某手機(jī)公司負(fù)責(zé)手機(jī)OS交互設(shè)計(jì),所負(fù)責(zé)產(chǎn)品覆蓋用戶數(shù)億,主要研究AI與人機(jī)交互設(shè)計(jì)的融合及人因?qū)W對(duì)用戶體驗(yàn)的影響。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Pixabay,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
寫作不易,頂一下。
語(yǔ)音交互算對(duì)話交互的一種,而且不同的交互方式也可以組合使用,對(duì)于有殘障的人士來(lái)說(shuō)會(huì)更有利,說(shuō)實(shí)話你看問(wèn)題的方式太片面了,技術(shù)總是向前發(fā)展的,這樣才會(huì)有更好的交互方式出現(xiàn),以后甚至?xí)霈F(xiàn)腦電波交互方式的出現(xiàn)
拜托你仔細(xì)看看,首先這份內(nèi)容沒(méi)討論語(yǔ)音交互,然后也沒(méi)說(shuō)對(duì)話形式一定不好,后面有列優(yōu)點(diǎn)。
不贊同,現(xiàn)在只是很多模態(tài)沒(méi)有和語(yǔ)言對(duì)齊,等把不同模態(tài)的信息都對(duì)齊了,就可以實(shí)現(xiàn)說(shuō)一句話就能下單
不同模態(tài)信息能完全轉(zhuǎn)化很難,比如怎么把語(yǔ)速、音量、重音、停頓等信息分析成不同意圖的文字
一句話下單只是個(gè)小場(chǎng)景,VUI的穿透特性是OK的
點(diǎn)單適合熟客哈哈,如果客戶邊工作邊跟ai助理說(shuō)了一句,“燕麥奶茶三分糖少冰大杯”來(lái)一杯—-立即下單,是不是也很爽;“老樣子來(lái)一杯”–立即下單,是不是也很爽,技術(shù)是慢慢迭代的~也許將來(lái)用語(yǔ)音交互后,我們的低頭族就越來(lái)越少了,調(diào)用起來(lái)的五官有助于我們更豐富的去體驗(yàn)感受精彩的生活,而不是整天??手機(jī)哈哈哈哈~純屬謬論,作者別見(jiàn)怪哈哈~
那應(yīng)該打開(kāi)美團(tuán)外賣還是餓了么還是各個(gè)咖啡APP?文末說(shuō)了哦,本文分析的是對(duì)話式交互不是語(yǔ)音交互
作者留言:這篇主要是填坑,在上一篇關(guān)于AI搜索產(chǎn)品的萬(wàn)字長(zhǎng)文分析中留的坑,對(duì)AI搜索感興趣的朋友可以點(diǎn)我頭像看那篇。