VUI語音交互設(shè)計(jì):三步打造任務(wù)導(dǎo)向型對(duì)話場(chǎng)景

13 評(píng)論 33069 瀏覽 116 收藏 7 分鐘

設(shè)計(jì)任務(wù)導(dǎo)向型對(duì)話場(chǎng)景是一項(xiàng)關(guān)乎人類最自然的對(duì)話和AI最智能的技術(shù)結(jié)合的復(fù)雜而有趣的工作,希望這篇文章對(duì)從事語音交互產(chǎn)品設(shè)計(jì)的同學(xué)們有所幫助。

  • 5月10日,微軟Build大會(huì)發(fā)布智能音箱Invoke,
  • 6月6日,蘋果WWDC發(fā)布HomePod,
  • 7月5日,上午10點(diǎn),百度AI開發(fā)者大會(huì)發(fā)布DureOS開放平臺(tái),
  • 同一天,下午2點(diǎn),阿里人工智能實(shí)驗(yàn)室發(fā)布天貓精靈……

這個(gè)夏天,被人工智能驕陽炙烤著的智能語音交互市場(chǎng),熱度可謂一路飆升。

語音交互的主要能力在于開放式domain的聊天型功能與任務(wù)導(dǎo)向的技能型功能。如果說快捷高效、輕松自然是語音交互的獨(dú)特優(yōu)勢(shì),那么任務(wù)導(dǎo)向型功能就是這些優(yōu)勢(shì)的完美落點(diǎn),一個(gè)量好的語音交互產(chǎn)品,自然是技多不壓身,能夠cover的domain多越好,能夠get的技能越強(qiáng)大越好。

那么,作為語音產(chǎn)品設(shè)計(jì)人員,如何以短平快的方式設(shè)計(jì)一個(gè)任務(wù)導(dǎo)向型對(duì)話場(chǎng)景呢?

當(dāng)然,和傳統(tǒng)交互設(shè)計(jì)工作一樣,前期調(diào)研是很有必要的。你想設(shè)計(jì)的這個(gè)功能是否能滿足產(chǎn)品目標(biāo)、是否具備相關(guān)技術(shù)和數(shù)據(jù)能力支持以及符合用戶實(shí)際需求?如果有兩個(gè)場(chǎng)景擺在你設(shè)計(jì)的智能音箱面前,一個(gè)是訂外賣,而另一個(gè)是星座速配,你會(huì)選擇優(yōu)先做哪個(gè)?

一旦確定了要設(shè)計(jì)某個(gè)場(chǎng)景,接下來就可以著手設(shè)計(jì)工作了。具體來說就是三個(gè)步驟:理清對(duì)話邏輯(Chat Flow)、設(shè)計(jì)語法(Grammer)以及設(shè)計(jì)應(yīng)答 (Confirmation)。

第一步:對(duì)話邏輯——從哪里來,到哪里去?

如同圖形用戶界面以點(diǎn)擊-觸發(fā)為各個(gè)節(jié)點(diǎn)的交互邏輯,VUI也需要一從query到answer的流轉(zhuǎn)邏輯,將一個(gè)場(chǎng)景的對(duì)話流程流暢的貫穿起來。

假設(shè)你設(shè)計(jì)的對(duì)話場(chǎng)景是查詢空氣質(zhì)量,請(qǐng)考慮在這番對(duì)話中可能出現(xiàn)的任何情況以及相應(yīng)的反饋動(dòng)作:

下圖展現(xiàn)了該場(chǎng)景可能的Chat Flow

即便是詢問天氣這樣看上去很簡(jiǎn)單的對(duì)話場(chǎng)景,也可以設(shè)計(jì)出十分復(fù)雜的對(duì)話邏輯,根據(jù)該場(chǎng)景在你產(chǎn)品中的重要程度決定細(xì)節(jié)邏輯的粒度。

第二步:設(shè)計(jì)語法 ——用戶會(huì)對(duì)你說什么?

語法就是用戶輸入的指令集,對(duì)話設(shè)計(jì)者需要設(shè)計(jì)對(duì)話的意圖(Intent),以及盡量考慮用戶可能表達(dá)方式,將其中最核心、最常用的表達(dá)方式提取為指令集模板。設(shè)計(jì)的指令集越多越全面,對(duì)話覆蓋率就會(huì)越高。

想象場(chǎng)景還是查詢空氣質(zhì)量,請(qǐng)考慮用戶會(huì)用怎樣的表達(dá)方式來提出自己的要求:

“幫我查詢空氣質(zhì)量”

“北京空氣質(zhì)量指數(shù)”

“今天PM2.5值是多少”

“我需要戴口罩嗎”

“今天的空氣怎么樣”

……

中華語言,博大精深,簡(jiǎn)單的查詢空氣質(zhì)量,就有茫茫多的問法。不過不用著急,你只需要提取一些最典型的句式,至于“么”“嗎”“呢”這些語氣詞,或者虛詞、助詞等,語義理解模塊(NLU)會(huì)幫忙泛化。

下圖為查詢空氣質(zhì)量對(duì)話指令集,其中<place>和<time>是槽位(Slot)。Slot是NLU從用戶指令中抽取的關(guān)鍵信息點(diǎn),NUL模塊通過這些關(guān)鍵信息及其取值定義(Slot-Value),理解用戶指令的具體要求。

第三步:設(shè)計(jì)應(yīng)答——你要如何回答用戶?

語音交互中最主要的應(yīng)答方式是TTS(Text To Speech),就是將設(shè)計(jì)者寫好的應(yīng)答腳本,通過TTS引擎轉(zhuǎn)化為語音播放出來。應(yīng)答帶給用戶最直觀的感受,應(yīng)答的好壞,直接關(guān)系到語音產(chǎn)品的體驗(yàn)。鑒于過長(zhǎng)的語音內(nèi)容會(huì)增加用戶的記憶負(fù)載,設(shè)計(jì)應(yīng)答時(shí)應(yīng)該盡量簡(jiǎn)潔。同時(shí),如果你的語音產(chǎn)品具備自己的個(gè)性特點(diǎn),在應(yīng)答時(shí)也請(qǐng)按照該特點(diǎn)的語言風(fēng)格撰寫腳本,保持角色的一致性。

還是查詢空氣質(zhì)量的例子,在第一步,設(shè)計(jì)對(duì)話邏輯的過程中,我們已經(jīng)定義了該對(duì)話可能出現(xiàn)的幾類應(yīng)答。分別是:

  • A1.詢問用戶想查詢哪里的空氣質(zhì)量
  • A2.反饋沒有查到相關(guān)地區(qū)相關(guān)時(shí)間的空氣質(zhì)量
  • A3.根據(jù)空氣質(zhì)量級(jí)別的優(yōu)劣反饋相應(yīng)提示

接下來,你只需要在對(duì)話腳本(script)文檔里,發(fā)揮你強(qiáng)大的語言天賦,進(jìn)行完型填空就可以了。

“script”有“撰寫電影腳本”的含義,而整個(gè)設(shè)計(jì)對(duì)話過程確實(shí)很像設(shè)計(jì)電影腳本,有來言有去語,通過問答的互動(dòng)形式幫助用戶完成任務(wù)。

綜上所述,設(shè)計(jì)任務(wù)導(dǎo)向型對(duì)話場(chǎng)景是一項(xiàng)關(guān)乎人類最自然的對(duì)話和AI最智能的技術(shù)結(jié)合的復(fù)雜而有趣的工作,希望這篇文章對(duì)從事語音交互產(chǎn)品設(shè)計(jì)的同學(xué)們有所幫助。

 

作者:Rachel Hu,阿里云OS VUI交互設(shè)計(jì)師

本文由 @Rachel Hu 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. ?? 棒棒的~!

    來自上海 回復(fù)
  2. 正在準(zhǔn)備做語音交互功能,非常感謝,很有指導(dǎo)意義

    回復(fù)
  3. 贊贊噠

    來自浙江 回復(fù)
    1. ?? ??

      來自北京 回復(fù)
  4. 請(qǐng)問對(duì)話指令集中的句型,[][][外面]有(霧霾|污染)嗎
    1.[]代表詞槽
    2.[外面]代表什么?
    3.(霧霾|污染)()代表可選項(xiàng)
    4.霧霾|污染 代表或

    來自浙江 回復(fù)
    1. 尖括號(hào)代表槽
      []代表可選語法 ()代表必選語法

      來自北京 回復(fù)
  5. 想提問個(gè)問題,在最上面的流程圖中,按照地址>時(shí)間的順序設(shè)計(jì)流程是否合適?如果用戶先說時(shí)間的話,系統(tǒng)是否一致提示請(qǐng)告知地址……..?

    來自廣東 回復(fù)
    1. 其實(shí)也是可以的,流程的設(shè)計(jì)并非一成不變,只要按照合理的交互邏輯設(shè)計(jì)就好

      來自北京 回復(fù)
  6. 哈哈,我也搞了篇vui+gui 的 方便加個(gè)微信否。

    來自廣東 回復(fù)
  7. 感謝~ 唯一一篇VUI的文章,多交流

    來自上海 回復(fù)
    1. 哈哈 我也寫了一篇,不過沒牽扯技術(shù),光設(shè)計(jì)

      來自廣東 回復(fù)
  8. 作者以后寫文章的時(shí)候,對(duì)于一些比較專業(yè)的術(shù)語,建議不要只是寫英文,最好有一個(gè)中文的解釋,因?yàn)橛⒄Z名詞如果不是在這個(gè)行業(yè)做過的話理解起來會(huì)有偏差。

    來自安徽 回復(fù)
    1. 很好的建議

      來自北京 回復(fù)