亚洲日韩欧美在线观看,欧美日韩亚洲高清不卡一区二区三区 ,中文字幕亚洲日韩无线码

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

VUI 與 GUI，不同場(chǎng)景下的優(yōu)劣對(duì)比

飯大官人

2020-03-10

2 評(píng)論 12945 瀏覽 70 收藏

15 分鐘

筆者從事自然語(yǔ)言處理已經(jīng)超過(guò)了一年半的時(shí)間，對(duì)語(yǔ)音交互有了自己的理解，本文以封閉五官的極端狀態(tài)為各位讀者帶來(lái)一種特別的體驗(yàn)，以便大家熟悉和掌握其特點(diǎn)和優(yōu)勢(shì)，以便將來(lái)大家應(yīng)用到自己的產(chǎn)品設(shè)計(jì)中。

為方便討論，先做一下定義。市面上關(guān)于交互的常見(jiàn)的幾個(gè)詞匯，GUI、VUI、DUI。

一、三種基本概念

1. GUI

GUI（Graphical UserInterface）圖形界面，市面上最常見(jiàn)的交互方式。點(diǎn)觸，滑動(dòng)，作為主要輸入方式。圖像顯示作為主要輸出方式。

2. VUI

VUI（Voice User Interface）語(yǔ)音界面，常見(jiàn)沒(méi)有屏幕的智能音箱/耳機(jī)，靠音軌輸入，音軌輸出。

VUI還有一個(gè)前身，即IVR（Interactive Voice Response）交互式語(yǔ)音應(yīng)答，類似我們撥打營(yíng)業(yè)廳電話，通過(guò)選擇數(shù)字，來(lái)選擇進(jìn)入某某業(yè)務(wù)。

3.?DUI

DUI（Dialogue User Interface）對(duì)話界面，當(dāng)然還有另外一種說(shuō)法叫做CUI（Conversational User Interface），舉例子就是蘋果的SIRI，或者某種對(duì)話機(jī)器人，以對(duì)話式窗口作為主要功能界面。這種方式是混合式方案，故而不在討論范圍之內(nèi)。

二、交互形態(tài)

為方便理解，更容易代入角色，理解交互形態(tài)，大家需要在限制的條件下體會(huì)。

只有封閉了自己的功能，如此才能做到設(shè)身處境，繼而理解兩種不同交互形態(tài)的差異。不妨把自己想象成：聽(tīng)力正常且發(fā)音標(biāo)準(zhǔn)的盲人，以及視力正常且四肢健全的聾啞人。

GUI（Graphical UserInterface）圖形界面

特性：使用鼠標(biāo)鍵盤、手指點(diǎn)觸，作為主要輸入方式，以圖形展示作為輸出方式。通俗來(lái)說(shuō)：動(dòng)眼動(dòng)手與硬件進(jìn)行交互。當(dāng)前市面上最為常見(jiàn)的交互方式。

VUI（Voice User Interface）語(yǔ)音界面

特性：使用語(yǔ)音作為輸入，語(yǔ)音作為輸出。能聽(tīng)見(jiàn)，能發(fā)音，那么就能使用VUI。通俗來(lái)說(shuō)：動(dòng)耳動(dòng)嘴與硬件進(jìn)行交互。未來(lái)一定會(huì)走入我們生活的交互方式。

日常生活中有很多場(chǎng)景，雙手是被占用的，如果有好的VUI的解決方案，那么就存在交互空間。

解放雙手是一個(gè)特性，不足以成為優(yōu)點(diǎn)，是一種特定情況下的解決方案。

VUI的缺點(diǎn)，只能在安靜和隱私的環(huán)境下進(jìn)行，在公共場(chǎng)合使用，必然引起他人的圍觀，繼而造成自己的心里壓力。GUI則不存在輸入壓力問(wèn)題，僅依賴光線。

輸入速度，是VUI的一個(gè)巨大優(yōu)勢(shì)，需要什么說(shuō)就好了，然后通過(guò)ASR轉(zhuǎn)化為文字，由計(jì)算機(jī)理解，并執(zhí)行命令。

GUI的界面上顯示了太多的信息，如果不熟悉的話，需要判斷點(diǎn)哪里（如果你教老人使用智能手機(jī)就能懂得其痛苦）有些時(shí)候還需要調(diào)用鍵盤，輸入速度就很慢。

播放周杰倫的《煙花易冷》如果用點(diǎn)觸的話，操作成本非常高（打開APP，尋找搜索框，輸入指定信息，搜尋，選擇列表中的一個(gè)播放）。而使用VUI，成本就非常低。

VUI可以無(wú)視層級(jí)，一句話直達(dá)目標(biāo)。例如：播放2020年NBA全明星正賽第4節(jié)，或者是打開APP的簽到功能/活動(dòng)頁(yè)面這類話術(shù)，可以直達(dá)熟悉的位置。

而GUI則是預(yù)設(shè)路徑的交互方式，強(qiáng)迫用戶沿著單一路徑去完成操作的人機(jī)交互方式。每一步操作正確或者錯(cuò)誤都會(huì)給予反饋，通過(guò)信息結(jié)構(gòu)層級(jí)去展示指定內(nèi)容，這非常方便人們學(xué)習(xí)和摸索規(guī)律，故而不是缺點(diǎn)而是特點(diǎn)。

VUI的缺點(diǎn)，由于人類的輸入不可控，導(dǎo)致計(jì)算機(jī)難以理解——

用戶本身發(fā)音模糊；依賴ASR（語(yǔ)音識(shí)別：Automatic Speech Recognition）技術(shù)的表現(xiàn)。
人類表述差異化較大，無(wú)邏輯，上下文表述會(huì)使用指代關(guān)系，會(huì)歧義或者雙關(guān)。而計(jì)算機(jī)推理較難，此處考驗(yàn)NLP（自然語(yǔ)言處理：Natural Language Processing）的能力。

GUI的優(yōu)點(diǎn)就是輸入精準(zhǔn)，任何操作都有著邊界約束，流程可控，選擇明確，計(jì)算機(jī)容易理解。

交互是一個(gè)雙向的過(guò)程，語(yǔ)音作為輸入動(dòng)作確實(shí)很快，而純語(yǔ)音輸出的話，效率非常低。幾乎沒(méi)有人愿意做太多的等待行為。且語(yǔ)音輸出攜帶的信息量非常少。

比如展示2020福布斯前10名的結(jié)果，語(yǔ)音輸出的效率就是悲劇。而視覺(jué)層面展示的內(nèi)容可以無(wú)限多，可以使用表格圖形的方式進(jìn)行展示，眼睛接受效率也非常高。

在計(jì)算機(jī)輸出的過(guò)程中，語(yǔ)音輸出要求人不可分心，需消耗注意力，視覺(jué)展示則沒(méi)有，即使走神，也無(wú)壓力。

在語(yǔ)音交互的過(guò)程，如果是多輪交互，當(dāng)計(jì)算機(jī)說(shuō)完之后，立刻留給人決策，注定會(huì)給人壓力。GUI則不存在這個(gè)過(guò)程。

比如一個(gè)簡(jiǎn)單的機(jī)票業(yè)務(wù)查詢結(jié)果，為你找到從[城市]到[城市]，[幾月幾日][幾點(diǎn)幾時(shí)幾分]出發(fā)[航空公司][飛機(jī)倉(cāng)位][機(jī)票價(jià)格]，是否需要定這張票？

當(dāng)語(yǔ)音播放完畢后，我是不是要思考和比較一下？如果我想更新下查詢條件，語(yǔ)音應(yīng)該如何處理？而這交給GUI，就非常容易處理。

基于此，我們整體來(lái)看一下兩種交互形式的優(yōu)劣表現(xiàn)：

由于GUI的特性大家非常熟悉，所以本文偏重于總結(jié)提煉純VUI的特性。

三、VUI的特性

1. 基本特性

VUI語(yǔ)音交互的特性是解放雙手，動(dòng)嘴就可以搞定。在某些業(yè)務(wù)場(chǎng)景下，是存在于雙手被占用，通過(guò)語(yǔ)音指令完成目標(biāo)的需求。（作者吐槽：GUI交互總不能寫，不用動(dòng)嘴且不依賴光線就能解決問(wèn)題吧，這很奇怪）

VUI語(yǔ)音交互依賴安靜、隱私環(huán)境，公共場(chǎng)合有使用壓力。聲音輸入，和聲音輸出都可以通過(guò)空氣這個(gè)介質(zhì)傳播。即使是耳機(jī)可以管理計(jì)算機(jī)的輸出行為，但是人類的輸入行為也會(huì)引起他人的圍觀。這一點(diǎn)就局限了VUI的使用場(chǎng)景。

當(dāng)【基本特性】掌握后，對(duì)尋找VUI的使用場(chǎng)景有了方向，即

光線不太好，不方便點(diǎn)觸操作
雙手被占用，不方便點(diǎn)觸操作
隱私，安全，的無(wú)場(chǎng)景
使用語(yǔ)音無(wú)壓力的場(chǎng)景

所以目前看來(lái)，臥室、客廳和車內(nèi)這種相對(duì)隱私的空間是VUI的主要交互場(chǎng)合。

開車的時(shí)候，雙手被占用，VUI有發(fā)揮空間
騎車或者跑步鍛煉的時(shí)候，VUI有發(fā)揮空間
晚上都關(guān)燈了，不想睜眼睛，VUI有發(fā)揮空間
快遞員/外賣小哥在送東西的時(shí)候，VUI有發(fā)揮空間

2. 輸入表現(xiàn)

GUI是一種預(yù)設(shè)路徑的交互方式，VUI則聚焦于如何發(fā)揮語(yǔ)言和表意的強(qiáng)大力量，采用人們?nèi)粘５恼Z(yǔ)言來(lái)交流。

GUI需要人類適應(yīng)工具。VUI則是由工具適應(yīng)人。

語(yǔ)音輸入門檻非常低，只要會(huì)說(shuō)話，就能模仿，輸入速度快捷，相比GUI擁有巨大的優(yōu)勢(shì)。而圖形界面則具備相當(dāng)?shù)膶W(xué)習(xí)門檻，難點(diǎn)就是在于，用老年人學(xué)習(xí)手機(jī)的委屈狀態(tài)“這個(gè)上面字那么多，按鈕那么多，我不知道點(diǎn)哪里”以及“這個(gè)太多了記不住”。

VUI另外一個(gè)特性優(yōu)勢(shì)是沒(méi)有UI層級(jí)，可以一句話直達(dá)，這點(diǎn)對(duì)于熟悉的事物具備巨大的優(yōu)勢(shì)。不需要像GUI依照層級(jí)關(guān)系一路點(diǎn)過(guò)去。而GUI的特性是流程明確，對(duì)于復(fù)雜的流程，明確交代了層級(jí)關(guān)系。

VUI的巨大劣勢(shì)是，用戶的輸入表述不可控，這是自然語(yǔ)言處理的核心，即，如何讓計(jì)算機(jī)理解人類的各種表述。而圖形界面則輸入非?？煽?，計(jì)算機(jī)易于理解。

3. 交互表現(xiàn)

VUI語(yǔ)音輸出的效率非常低，且依賴注意力。這是巨大的劣勢(shì)。而對(duì)GUI而言，則是巨大的優(yōu)勢(shì)，不要求人類過(guò)于集中注意力。

VUI反饋設(shè)計(jì)，注定無(wú)法輸出大量?jī)?nèi)容，最好的表現(xiàn)還是GUI。多輪對(duì)話中，盡量控制用戶的表述范圍，才能夠得到更好的體驗(yàn)。

基于輸入表現(xiàn)和交互表現(xiàn)，我們對(duì)處理VUI交互有了方向，即

一句話能搞定的用戶熟悉的任務(wù)
決策壓力低的的任務(wù)
管理用戶輸出，讓其做選擇題或填空題
語(yǔ)音輸出的內(nèi)容不應(yīng)該太長(zhǎng)
不讓用戶做挑挑揀揀的任務(wù)

綜上，只有理解其優(yōu)勢(shì)和劣勢(shì)，才方便展開業(yè)務(wù)。

附一張當(dāng)前智能音箱的技能列表，筆者已經(jīng)就自己的理解做了歸納，這是當(dāng)前市面上，相對(duì)比較成熟的語(yǔ)音交互技能。

我們還是回歸正常，未來(lái)一定是多模態(tài)交互的場(chǎng)景。

人類與計(jì)算機(jī)打交道的方式不斷演變，隨著科學(xué)技術(shù)的發(fā)展，從最早的命令行，鼠標(biāo)鍵盤，到如今最為主流的點(diǎn)擊和觸摸，到未來(lái)的語(yǔ)音交互以及手勢(shì)交互。

想做好交互設(shè)計(jì)，只有了解各種交互形式的優(yōu)缺點(diǎn)，硬件相關(guān)知識(shí)，技術(shù)相關(guān)知識(shí)，才能夠做好選擇，然后疊加出多模態(tài)交互方案。

生活中，帶屏幕的音箱越來(lái)越多，而且耳機(jī)也是搭配各種屏幕的硬件使用的，而且在未來(lái)，就跟科幻電影里面一樣，幾乎每一塊屏幕都可以用來(lái)操作。

從實(shí)際的發(fā)展趨勢(shì)上來(lái)看，未來(lái)注定是萬(wàn)物互聯(lián)的世界，幾乎任何硬件都可以搭配麥克風(fēng)、揚(yáng)聲器和WIFI模塊三件套，由于其硬件成本低，普及極其容易。各方數(shù)據(jù)表現(xiàn)，可穿戴智能硬件出貨量巨大……語(yǔ)音又是最為自然的交互形態(tài)，一定會(huì)在我們生活中占據(jù)一席之地。

語(yǔ)音交互，將會(huì)給我們的產(chǎn)品設(shè)計(jì)帶來(lái)極大的改變，提供更為豐富立體的交互樂(lè)趣。在即將到來(lái)的萬(wàn)物互聯(lián)時(shí)代，對(duì)各位交互設(shè)計(jì)師/產(chǎn)品經(jīng)理而言，也是一種進(jìn)步和挑戰(zhàn)。

做好語(yǔ)音交互，不需要掌握任何畫圖技巧，上下文對(duì)話，就是UI本身，如何管理用戶輸入，全憑內(nèi)容結(jié)構(gòu)。

本文旨在討論，GUI和VUI的區(qū)別，相關(guān)設(shè)計(jì)不做展開，相關(guān)的VUI設(shè)計(jì)心得，會(huì)在后續(xù)文章中，為大家介紹。

作者：飯大官人，不折騰會(huì)死星人，微信公眾號(hào)：fanfan19860403《游戲運(yùn)營(yíng)：高手進(jìn)階之路》作者。熟悉游戲領(lǐng)域、人工智能-自然語(yǔ)言處理領(lǐng)域。

本文由 @飯大官人原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載

題圖來(lái)自?Unsplash，基于 CC0 協(xié)議

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App