淺說(shuō)語(yǔ)音用戶界面:VUI+GUI

1 評(píng)論 18149 瀏覽 63 收藏 8 分鐘

文章對(duì)語(yǔ)音用戶界面進(jìn)行了相關(guān)的分析解讀,希望對(duì)你有所幫助。

語(yǔ)音用戶界面(VUI)

A?voice-user interface?(VUI)?makes human interaction with computers possible through a voice/speech platform in order to initiate an?automated?service or process.

VUI是任何語(yǔ)音應(yīng)用程序/設(shè)備的接口。從Siri 、Amazon echo Alexa、google home 、小冰、國(guó)內(nèi)的叮咚、天貓精力、小愛同學(xué)、你好問問以及各種你聽說(shuō)過(guò)的,沒聽說(shuō)過(guò)的。然而,隨著技術(shù)的進(jìn)步,從DuerOS的 聽清、聽懂、滿足。

以及喚醒萬(wàn)物,用白話說(shuō),聽清靠麥克風(fēng)陣列來(lái)拾音;聽懂靠自然語(yǔ)言處理技術(shù);滿足靠數(shù)據(jù);?語(yǔ)音的交互呈現(xiàn)給用戶的主要是說(shuō)和聽;語(yǔ)音交互,都是瞬態(tài)或不長(zhǎng)久存在的信息,用戶聽到了,然后就消失了,用戶沒有可能去回顧設(shè)備的輸出,聽覺界面的這種瞬態(tài)特征對(duì)用戶知識(shí)有一定的要求。而VUI 設(shè)計(jì)的原則之一就是不要讓用戶有認(rèn)知負(fù)荷,不要挑戰(zhàn)人類短暫的記憶能力。

語(yǔ)音,用戶的直接交互的界面,人類與設(shè)備交互的邏輯會(huì)有很大的影響。而好的用戶體驗(yàn)會(huì)帶來(lái)用戶對(duì)設(shè)備的認(rèn)可及多次使用;滿足用戶意圖。“我知道設(shè)備聽清楚了,也聽懂了,還給我提供了幫助,我不會(huì)感到迷失與焦慮”。很簡(jiǎn)單,我還會(huì)在使用它。反之,聽不清,聽不懂,用戶會(huì)責(zé)備這個(gè)設(shè)備,覺得它很SB ,從而拒絕使用。最早的Siri為什么沒有火起來(lái)也是技術(shù)條件不成熟,所以用戶并不買賬。

所以,在這個(gè)快的時(shí)代,現(xiàn)在的人們喜歡快餐,人們對(duì)新的產(chǎn)品沒有耐心,因此,幾乎沒有容錯(cuò)的余地:VUI需要可靠地響應(yīng)輸入與輸出,否則將被用戶拒絕且拋棄?;锇閭兌际褂眠^(guò)10086吧,有沒有覺得一串的按1 按2 再按* 讓你有種砸掉手機(jī)的沖動(dòng)? 是的這其實(shí)某種程度上來(lái)講是單方的語(yǔ)音交互;它一直在挑戰(zhàn)人類的耐心。

VUI設(shè)計(jì)是一個(gè)以用戶心理模型為中心的設(shè)計(jì)過(guò)程。目的是為了給用戶最優(yōu)的經(jīng)歷。創(chuàng)建有吸引力的交互過(guò)程,用用戶習(xí)慣的、情感化的、靈活多樣而有引導(dǎo)性的方式,使用戶樂于使用,幫助用戶解決問題,提高效率,贏得用戶的忠誠(chéng)。

聲音,最自然的交互形式,但不能取代圖形GUI,而是更好的協(xié)作

語(yǔ)音用戶界面設(shè)計(jì)是一個(gè)全新的應(yīng)用領(lǐng)域,通過(guò)語(yǔ)音控制來(lái)完成任務(wù)。人與人的溝通通常在不同場(chǎng)景與人的面部表情,動(dòng)作等,能解析出不同的意圖。VUI+GUI 更好的滿足人機(jī)的交互。

GUI層級(jí)鮮明,好比俄羅斯套娃,一層一層直到結(jié)果呈現(xiàn),想想你的朋友圈,你應(yīng)該如何發(fā)朋友圈?文字與圖片不同的入口。想想打開手機(jī)上的手電筒,選擇消息應(yīng)用程序,回到主屏幕。所有這些操作都會(huì)引用實(shí)際的空間關(guān)系,幫助我們記住并了解他們。GUI可能會(huì)考慮你的手指觸摸的位置以及你在屏幕上看到的內(nèi)容。這種相互作用在功能上是肌肉記憶。他們必須是一個(gè)聯(lián)動(dòng)的層級(jí)關(guān)系,需要每個(gè)步驟才能訪問它們,那么執(zhí)行此操作的認(rèn)知負(fù)荷將高于簡(jiǎn)單地使用該應(yīng)用程序。

VUI沒有層級(jí),可以直接獲取結(jié)果,拍照,—-已經(jīng)幫你拍好了,。GUI被動(dòng)的交互是一種引導(dǎo),傳遞信息。而VUI主動(dòng)的交互不僅僅包含被動(dòng)所能表現(xiàn)的,且能夠主動(dòng)感知或認(rèn)知人來(lái)獲取信息,而人還是原來(lái)的行為模式。VUI的實(shí)現(xiàn)基于NLP 的技術(shù),傳感器技術(shù),以及不同類型的數(shù)據(jù)交叉處理和判斷,這些處理和判斷又與產(chǎn)品的市場(chǎng)需求,業(yè)務(wù)需求,產(chǎn)品形態(tài)的需求. 息息相關(guān)?!獔?chǎng)景革命,語(yǔ)音交互任何時(shí)候都是基于場(chǎng)景來(lái)做調(diào)用, 場(chǎng)景又叫技能。

服務(wù)器端處理:場(chǎng)景(技能)—— 意圖——具體操作(結(jié)果)

這個(gè)技能場(chǎng)景可以是:廚房技能、音樂場(chǎng)景、詩(shī)詞場(chǎng)景、APP場(chǎng)景、故事場(chǎng)景、定制業(yè)務(wù)場(chǎng)景、閑聊場(chǎng)景等。 不過(guò)閑聊這個(gè)場(chǎng)景我個(gè)人認(rèn)為是最難做的。它的邊界不好限定。

場(chǎng)景的要素:

  1. 哪里的用戶?(環(huán)境)(根據(jù)不同場(chǎng)景建立不同業(yè)務(wù)邏輯與規(guī)則)家庭?戶外?閑聊?廚房?音樂?
  2. 他們要做什么?(目的
  3. 他們互動(dòng)的設(shè)備的類型(媒介)機(jī)器人?Echo ? iPhone?computer?……
  4. 什么時(shí)間?(時(shí)間)時(shí)間的維度可以更好情感化設(shè)計(jì)。
  5. 他們正在試圖做什么?(行為
  6. 盡量滿足他們的意圖,而不是一個(gè)特定的功能。(目的
  7. 意圖:需要多個(gè)維度去判斷,視覺,聽覺,記憶,用戶習(xí)慣等。
  8. 哪里是用戶心靈的框架?(用戶模型?)用戶任務(wù)精神模型(根據(jù)不同用戶受眾,進(jìn)行不同的任務(wù)流程)
  9. 場(chǎng)景多維度屬性(場(chǎng)景屬性)

VUI+GUI

語(yǔ)音與視覺的交互是交叉處理,(多模態(tài)),說(shuō)白了,一個(gè)用戶指令,設(shè)備有多種反饋的方式,可以是聲音,燈光,動(dòng)作,界面,表情,等各種交叉的反饋。 什么樣的多模態(tài)交互是用戶需要的呢?這就需要基于場(chǎng)景的要素去進(jìn)行交互規(guī)則設(shè)計(jì)。(下圖機(jī)器人語(yǔ)音交互部分流程)

 

本文由 @?司馬 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Pixabay,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 編輯段落都給我搞錯(cuò)了,差評(píng)! 換了我的圖,差評(píng)! ??

    來(lái)自廣東 回復(fù)