做好這8步,你的語音產(chǎn)品才不會變成讀屏工具(最全的VUI設(shè)計(jì)指南&實(shí)例剖析)
編輯導(dǎo)語:相信大家都使用過手機(jī)上的語音產(chǎn)品,隨口來一句:“嘿,Siri……”,便能夠滿足自己一定的需求。但是當(dāng)代語音產(chǎn)品還存在著一些不足之處,該如何完善才不會讓它變成讀屏工具呢?
- “嘿,Siri,我今天需要雨傘嗎?”
- “Alexa,提醒我明天早上9點(diǎn)給媽媽打電話。”
- “嘿Google,從這里到機(jī)場最快的方式是什么?”
語音用戶界面(VUI)極大地改善了我們的交互方式,雖然語音交互已經(jīng)存在了一段時(shí)間,但我們直到近期才開始看到語音交互的更多可能性。
通常,我們講“用戶界面”多是停留在視覺層面,當(dāng)下我們對界面中的滑動和點(diǎn)擊操作也已經(jīng)非常熟悉,但語音UI根本就不可見,它是需要我們用聲音和設(shè)備直接進(jìn)行交互。
現(xiàn)在蘋果、亞馬遜和谷歌等知名公司都打造了一些簡單的語音交互產(chǎn)品,來讓我們的日常工作變得更加輕松。同時(shí),越來越多的公司也開始將虛擬助手加入到自己的產(chǎn)品中,甚至打造更專業(yè)的語言UI。
以下我們將分享,設(shè)計(jì)語音交互時(shí)需要考慮哪些因素、如何克服各種障礙,讓語音UI能夠成為除視覺以外的第二界面語音。
一、以人為本
設(shè)計(jì)語音UI時(shí),首先需要考慮:
- 使用你產(chǎn)品的用戶群體是什么?
- 他們會怎么想?
- 他們在日復(fù)一日的交流中是怎么做的?
您可能在設(shè)計(jì)前需要考慮多個(gè)受眾群體。例如我們要建立一個(gè)支持語音預(yù)定航班的系統(tǒng),首先我們需要考慮完成這整個(gè)任務(wù)所需的所有步驟,并將其應(yīng)用于語音界面當(dāng)中。
比如我們現(xiàn)在要預(yù)訂從喬治亞州亞特蘭大市到紐約市的航班,這將涉及以下步驟:
- 選擇要飛的日期
- 搜索指定日期范圍內(nèi)的航班
- 選擇單程或往返
- 根據(jù)價(jià)格和/或飛行時(shí)間選擇出發(fā)的航班
- 根據(jù)價(jià)格和/或飛行時(shí)間選擇回程航班
- 選擇航班或票價(jià)升級
- 選擇保險(xiǎn)套餐
- 確認(rèn)并付款
語音界面絕不是視覺界面的替代品。通過互補(bǔ),兩者可以創(chuàng)造出更好的產(chǎn)品體驗(yàn)。
二、使用自然語言
自然語言指我們每天在對話中使用的口語,它并不是事先計(jì)劃好的內(nèi)容,而是自然而然地出現(xiàn)在語音界面中,可以為用戶帶來更直觀的體驗(yàn)。
由于掌握自然語言需要高級的計(jì)算語言學(xué)和語義,因此仍然有許多不太理想的例子。
比如在許多語音郵件助手中,你會收到一條新語音消息:
- 要再次聽到消息,請說“重復(fù)”;
- 要答復(fù)消息,請說“答復(fù)”;
- 要刪除消息,請說“刪除”。
這種語音內(nèi)容并沒有使用自然語言,導(dǎo)致傳達(dá)的意思不明確甚至容易讓人混淆。因?yàn)檫@種語音只是在直接讀出系統(tǒng)需要我們做出的操作,這導(dǎo)致我們需要先了解目前在執(zhí)行的操作是什么,才能得知它到底在表達(dá)什么意思。
Google語音助手打電話預(yù)定酒店
回到我們剛才的機(jī)票預(yù)訂示例中,很明顯并非所有操作都可以快速執(zhí)行,但是我們可以使用戶更輕松地與之互動并完成該過程,比如:
- 用戶:為我預(yù)訂8月4日從亞特蘭大飛往紐約市的航班。
- 系統(tǒng):您是單程還是往返?
- 用戶:往返。
- 系統(tǒng):好的,我為您找到了三趟絕佳的航班,最便宜的是兩小時(shí)的飛行時(shí)間,價(jià)格為121美元。您要預(yù)定嗎?
- 用戶:是的。
請注意,在這個(gè)過程中并沒有用任何語音“關(guān)鍵詞”來執(zhí)行交互。雖然教用戶一些詞匯可能很簡單,但實(shí)際上他們在交流過程中可能會忘記這些關(guān)鍵詞。
你可以回想一下,在致電客服熱線時(shí)總是迫不及待地想繞開那些糟糕的自動語音系統(tǒng)。所以,在與用戶進(jìn)行語音交互時(shí),請使用自然語言才能為用戶帶來真正的原生體驗(yàn)。
三、適當(dāng)簡短地回應(yīng)
還是以預(yù)定航班為例,其實(shí)預(yù)定系統(tǒng)的響應(yīng)時(shí)間不長,但搜索結(jié)果可能會產(chǎn)生多達(dá)50個(gè)航班選擇。
所以最好讓結(jié)果回應(yīng)保持簡單明了,這樣用戶才不會突然被太多信息所淹沒。如果將這些搜索結(jié)果全部呈現(xiàn),這意味著永無止境的語音交互。
其實(shí)我們需要提供的只是一些最重要的選項(xiàng),能夠?yàn)橛脩舻倪x擇提供足夠的信息就可以了。如果可能的話,嘗試將每次互動信息最多限制在兩點(diǎn)或三點(diǎn)以內(nèi)。
四、 保持有用,即使是無法提供幫助的時(shí)候
有時(shí),在交互過程中用戶并沒有得到想要的結(jié)果,例如在所選日期可能沒有可用的航班。
與其說“抱歉,沒有可用的航班”,便突然結(jié)束互動,不如嘗試調(diào)整回應(yīng)的內(nèi)容,為用戶搜索附近日期的航班,并向用戶提供有用的建議:
“8月4日沒有航班,但我找到了8月3日和8月5日的航班。您要預(yù)訂其中的任何一個(gè)嗎?”
五、考慮技術(shù)限制
盡管我們有很好的想法和愿景,并且進(jìn)行了多輪的研究和用戶測試,但語音交互設(shè)計(jì)仍然受到技術(shù)限制的限制。計(jì)算機(jī)系統(tǒng)是否能夠識別不同的口音、單詞、短語甚至俚語?
幸運(yùn)的是,諸如自然語言處理(機(jī)器學(xué)習(xí))之類的人工智能技術(shù)的進(jìn)步也正在讓這些挑戰(zhàn)成為過去。
語音消息App設(shè)計(jì)@Marta Fryga
最近,微軟、亞馬遜和英特爾公司專門針對語音交互應(yīng)用開發(fā)了更高效的處理器,這項(xiàng)技術(shù)意味我們語音交互系統(tǒng)在性能上的突破。
六、 牢記安全和隱私
盡管大多數(shù)用戶的語音交互都是在自己的家里或車?yán)锏人矫苄詧鏊锇l(fā)生的,但越來越多的語音交互可能會發(fā)生在公共場所(如雜貨店,機(jī)場等)中。
在上面的預(yù)訂機(jī)票的示例中,如果用戶身邊還有其他人,但這時(shí)候他需要完成付款,那應(yīng)該怎么處理這種情況?或者如果此時(shí)系統(tǒng)需要處理到用戶一些受保護(hù)的健康信息(PHI)該怎么辦?
以下是確保用戶安全和隱私的一些最佳做法:
1. 隱藏付款信息
在我們視覺用戶界面中,我們交易時(shí)的付款信息可能會被隱藏,例如:**** **** **** 4576。
不過在語音用戶界面中,我們可以通過對付款卡進(jìn)行昵稱的設(shè)置來保護(hù)用戶的隱私。當(dāng)需要完成付款時(shí),交互可能會這樣進(jìn)行:
- 系統(tǒng):確認(rèn)一下,您要預(yù)訂一個(gè)從喬治亞州亞特蘭大到紐約市的兩個(gè)小時(shí)的航班,價(jià)格為121美元。您要繼續(xù)付款嗎?
- 用戶:是的。
- 系統(tǒng):好的,我應(yīng)該使用您的默認(rèn)付款“ Mike’s Chase卡嗎?”
- 用戶:是的。
- 系統(tǒng):確定,一切就緒!您的行程和登機(jī)信息將發(fā)送到您的電子郵件。
請注意,在這個(gè)過程中用戶的付款信息永遠(yuǎn)不會泄露,這意味著即使用戶在公眾環(huán)境中也可以進(jìn)行這種交互。
2. 合適的時(shí)機(jī)
這取決于具體的場景,對于用戶來說有些場景并不適合在公共場合使用語音交互。
想象一個(gè)想要安排見醫(yī)生的人,即使只是提及醫(yī)生或醫(yī)療機(jī)構(gòu)的類型,也可能暴露私人健康問題。
因此請務(wù)必考慮您的語音UI如何處理這些情況,語音交互還能保持用戶隱私嗎?語音系統(tǒng)可以接聽到用戶的低聲或耳語嗎?
所以,盡管語音UI肯定會占據(jù)一席之地,但對于某些場景最好還是使用視覺元素來處理,因?yàn)檫@些情況需要更高的敏感性和謹(jǐn)慎性。
七、強(qiáng)化語音表現(xiàn)
語音交互絕不是視覺交互的替代。即使隨著技術(shù)的進(jìn)步,我們會發(fā)現(xiàn)兩者互補(bǔ)可以為用戶帶來更好的產(chǎn)品體驗(yàn)。
當(dāng)然,這需要一個(gè)良好的平衡:
- 我們?nèi)绾我曈X上表示可聽見的語音或內(nèi)容?
- 如何在不過于依賴視覺表現(xiàn)的情況下制作流暢的語音界面?
- 什么時(shí)候應(yīng)該強(qiáng)化聲音?
概念設(shè)計(jì):語音控制文件管理
問題的許多答案很大程度上取決于你要構(gòu)建的產(chǎn)品。
1. 當(dāng)進(jìn)行語音交互時(shí)(視覺反饋)
Amazon Alexa和Apple的Siri界面都為用戶提供了很好的視覺反饋,并帶有持續(xù)的微妙細(xì)節(jié)讓用戶知道當(dāng)前的產(chǎn)品正在進(jìn)行語音交互。
大多數(shù)情況下,我們需要的視覺元素很少。如上圖,運(yùn)用簡單的指示燈閃爍或脈動圖標(biāo)可以讓用戶知道:
- 設(shè)備正在運(yùn)行。
- 語音界面正在響應(yīng),或?qū)⒁憫?yīng)用戶所說的內(nèi)容。
2. 當(dāng)語音進(jìn)行協(xié)助時(shí)
語音交互已集成到許多系統(tǒng)中。有時(shí)語音UI只是一個(gè)輔助,作為系統(tǒng)的另一種操作途徑。
一個(gè)很好的例子是macOS上的Siri或Windows上的Cortana,這兩種操作系統(tǒng)主要都是視覺化的用戶界面,但這并不意味著不能與語音一起使用。
相反,他們的虛擬助手還為用戶的操作增添了獨(dú)特的方式。
當(dāng)我們問Siri或Cortana:“今天我的日程是什么”時(shí),通常在界面上會向我們顯示日歷內(nèi)容。
但其實(shí)通過語音可以讓用戶更快地完成任務(wù),他們無需通過打開日歷來看日程安排,而是可以簡單地要求語音助手為他們這樣做。
我們可以在許多應(yīng)用中看到類似語音交互的加入,對于一些重復(fù)、普通的任務(wù)我們可以通過語音輕松處理,讓用戶能夠快速、輕松地完成他們真正需要的事情。
3. 當(dāng)區(qū)分系統(tǒng)與真人時(shí)
當(dāng)下的技術(shù)已經(jīng)發(fā)展到我們幾乎可以與計(jì)算機(jī)日常對話的地步,一些App中的虛擬助手在與你對話時(shí)會顯示對話的內(nèi)容。
因此,我們可以從視覺上區(qū)分系統(tǒng)可識別的內(nèi)容與人類說的內(nèi)容(如下圖)。
概念設(shè)計(jì):語音預(yù)定會
我們可以通過使用不同顏色、粗體文本或其他視覺設(shè)計(jì)進(jìn)行區(qū)分,確保用戶不會在對話過程中感到迷茫。
八、為殘障人士考慮
可能從語音UI中受益最多的人是殘障人士,尤其是對視障人士而言,語音UI可以極大地增強(qiáng)我們系統(tǒng)的可訪問性。
盡管我們確實(shí)取得了長足的進(jìn)步,但在此之前,我們還有一些路要走。
最近,我正在幫助我的一個(gè)朋友設(shè)置手機(jī),原本希望手機(jī)能為他帶來便捷,但當(dāng)他使用的時(shí)候卻發(fā)現(xiàn)非常艱難。
例如手機(jī)里的語音對話功能雖然有所幫助,但仍然需要用戶利用視覺元素、知道屏幕上的點(diǎn)擊位置才能使用它。
但對于我的朋友來說這是不可能完成的一件事,因?yàn)樗莻€(gè)盲人。
在這種情況下,如果不能依靠視覺提示,我們應(yīng)如何才能使語音交互能夠無縫銜接功能,讓視障人士也能輕松操作呢?
由于大多數(shù)手機(jī)都帶有陀螺儀和加速度計(jì),因此可以用來檢測手機(jī)何時(shí)被拿起,并提示用戶:“你希望做什么?”或“我可以如何幫助你?”
這樣用戶才可以進(jìn)行接下來的交互,最終順利完成他們的預(yù)期目標(biāo),無論是撥打電話、收聽電子郵件等。
因此對于視障人士來說,聲音的提示變得尤為重要。利用現(xiàn)有的語音交互技術(shù),我們可以設(shè)計(jì)出完整的語音UI,讓用戶即使在沒有任何視覺元素的情況下也可以順利完成操作。
九、寫在最后
語音設(shè)計(jì)從一開始的機(jī)器閱讀到如今的自動電話助手,這期間已經(jīng)取得了長足的進(jìn)步。很快,我們也可以看到語音交互會達(dá)到跟視覺交互一樣的水準(zhǔn)。
盡管這兩者無法相互替代,但它們可以形成相互補(bǔ)充的作用,幫助所有用戶甚至殘障人士更順利地完成任務(wù)。
準(zhǔn)備好面對新的挑戰(zhàn)吧!用我們的設(shè)計(jì)釋放出語音交互的全部潛力。
設(shè)計(jì)語音用戶界面(VUI)需考慮的因素:
- 以人為本
- 使用自然語言
- 適當(dāng)簡短地回應(yīng)
- 保持有用,即使是無法提供幫助的時(shí)候
- 考慮技術(shù)限制
- 牢記安全與隱私
- 強(qiáng)化語音表現(xiàn)
- 為殘障人士考慮
作者:SDL藝術(shù)實(shí)驗(yàn)室,微信公眾號:SDL藝術(shù)實(shí)驗(yàn)室
本文由 @SDL藝術(shù)實(shí)驗(yàn)室 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Pixabay,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!