語音交互——任務(wù)型對話設(shè)計原則

0 評論 8986 瀏覽 30 收藏 15 分鐘

編輯導(dǎo)語:在語言交互設(shè)計中,任務(wù)型對話也是常見的業(yè)務(wù)設(shè)計之一。合理的任務(wù)型對話設(shè)計可以協(xié)助用戶高效獲取信息、完成任務(wù)、達(dá)成目的。本篇文章里,作者總結(jié)了語音交互設(shè)計中任務(wù)型對話的設(shè)計原則與注意事項,一起來看一下。

設(shè)計腳本的本質(zhì)是讓用戶理解對話的邊界,幫助用戶快速完成任務(wù)。如果對話過程中需要多輪對話,腳本能引導(dǎo)用戶給出夠用的正確的信息,然后執(zhí)行用戶希望完成的任務(wù)。

腳本可以模擬用戶和智能助手之間的對話,就像電影或戲劇里一樣,它是確定對話如何互動的好方法,還能幫助你發(fā)現(xiàn)一些你設(shè)計時沒考慮到的狀況。一個好的腳本應(yīng)該是站在人們?nèi)绾谓徽劦囊暯沁M(jìn)行的,而不是通過閱讀和寫作視角進(jìn)行刻板設(shè)計。

設(shè)計對話腳本時我們關(guān)注以下幾點。

一、提升對話內(nèi)容的多樣性

嘗試在固定回答上加入不同的對白,可以使你的語音技能聽起來更真實,對于那些常用或重復(fù)交互來說可以減少機械感和枯燥感。

當(dāng)用戶調(diào)用技能時,可以考慮豐富多變的歡迎語,包括首次使用歡迎語、回歸歡迎語和個性化的歡迎語,然后詢問用戶他們想要做什么;當(dāng)用戶多次調(diào)用技能后可以縮短問候語,幫助用戶快速獲取他們所希望的交互結(jié)果。

除此之外,可以考慮在此處提供關(guān)于技能基本功能的提示。設(shè)計固定回復(fù)時可以通過同義詞為答案增加變化,然后從這些答案里隨機選擇一個作為回復(fù)。

除了固定回答的多樣性,你的智能助手應(yīng)該提供盡可能多的信息以促進(jìn)對話。

二、尊重用戶的時間

回復(fù)內(nèi)容盡量在短時間內(nèi)將必要的信息表達(dá)出來,避免輸出不相關(guān)的信息影響用戶。智能助手的回應(yīng)越冗長,用戶越難跟上和記住溝通的內(nèi)容。

而且在交談中,說得太多與說得太少一樣不合作。從用戶的角度出發(fā),保持簡短和最佳相關(guān)性有助于理解。

三、保持文案的一致性

寫腳本時保持語句中動詞、名詞搭配時語法的一致性,還有對用戶、智能助手自己的稱呼。

這里有一個文案小技巧,能用“咱”時就不用“你”字,通過共同感可以拉近用戶和智能助手的距離。

四、減輕用戶的認(rèn)知負(fù)擔(dān)

透過一致的稱謂來稱呼同一事物,能幫助用戶降低對同一事物的認(rèn)知負(fù)擔(dān),并且避免不一致的心智傳達(dá)給用戶。統(tǒng)一的稱呼可以讓用戶更清楚他正在進(jìn)行的操作,不用再花時間去理解新稱謂是指代什么。

人們在談話中會自然而然避免含糊不清的表達(dá),使用熟悉的單詞和短語也有助于減輕用戶的認(rèn)知負(fù)擔(dān)。因此編寫對話內(nèi)容時,應(yīng)盡量避免使用“科技術(shù)語”、“專業(yè)詞匯”、“方言用語”等,避免編寫出不具普遍性的對話內(nèi)容。

五、逐步向用戶獲取信息

用戶在進(jìn)行語音交互的大部分時候,無法圓滿地將完成意圖所需的關(guān)鍵參數(shù)都提供出來,此時應(yīng)避免壟斷對話,一口氣向用戶提出所有選項/問題,而是將信息分解成單個的獨立問題,一條一條提問引導(dǎo)用戶給出所有的答案。

六、盡量提供少于三個的選項

盡管在語音設(shè)計中提供選擇列表的行為是不被鼓勵的,但當(dāng)用戶提出一個開放性需求/問題時,多少會遇到需要進(jìn)行選擇的時刻。

盡量提供少于三個的選項供用戶選擇,如果選項過多則為用戶找出與輸入預(yù)期匹配度最高的前三個選項,列表中的第一項應(yīng)與用戶剛剛采取的操作最為相關(guān),這樣可以幫助用戶節(jié)省時間和精力。

七、不要假設(shè)用戶會準(zhǔn)確地把你設(shè)想的對白表達(dá)出來

在“合作原則”中,所說的話應(yīng)該滿足交際所需的信息量,所以用戶經(jīng)常提供比語言助手真正需要的更多信息。

例如用戶可以說“計劃旅行”時,他也許會圖方便地直接說“計劃去夏威夷的旅行”,甚至把出發(fā)日期都直接說出來了。請把這種“過度回答”當(dāng)做一個禮物,因為你不需要再問很多問題,用戶把答案都預(yù)先告訴你了。

除此之外,包容多種對話口吻風(fēng)格。用戶在對話時會通過不同的說法來表示自己的意圖,所以設(shè)計腳本時盡量把用戶可能會說的句子、短語和單詞最大范圍地呈現(xiàn)出來,這樣才能保證用戶可以更好地使用你的技能。

但是有一種情況在設(shè)計上沒有很好地解決辦法,那就是用戶說話時突然改變主意會立刻進(jìn)行更正。

比如,用戶可能會說“不”或者“我是說”,后面跟著正確的信息。這種情況非常依賴語音交互系統(tǒng)的泛化能力,在意圖、詞槽設(shè)計上沒有較好的解決辦法。

八、不要假設(shè)用戶知道該怎么做或會發(fā)生什么

不要猜測用戶的意思,提供事實信息讓用戶自己做決策,當(dāng)用戶需要提供信息時給出提示。

另外一個情況是,用戶回答的順序和劇本流程設(shè)計的不一致,例如買電影票時用戶有可能先選電影院,或者先選電影,甚至是先選時間段,在設(shè)計劇本時要考慮全部情況。

九、在追問過程中為用戶提供指導(dǎo)

用戶給的指令或者提出的問題通常是不完整的。當(dāng)用戶給予的關(guān)鍵實體詞不滿足意圖的需求時,智能助手需要與用戶進(jìn)行多輪交互獲取更多的關(guān)鍵參數(shù)。

提出問題引導(dǎo)用戶輸入,是一種自然的提示方式。追問時要么直接問問題,要么在提示的結(jié)尾處拋出問題,這樣用戶就會知道如何立即回復(fù)。反之,如果問得很繞彎子,或者在應(yīng)答的中段問問題,可能會導(dǎo)致用戶在麥克風(fēng)打開之前或者提示還沒說完之前就開始回答,極易造成識別錯誤。

在設(shè)計多輪交互的追問句中,建議包含“當(dāng)前情境”和“需進(jìn)行的操作或選項”,這樣的追問句能為用戶提供繼續(xù)對話的線索,并指導(dǎo)用戶下一步該說什么。

十、避免用戶進(jìn)行復(fù)雜或帶來高歧義性的輸入

通過語音交互填寫郵箱、密碼和網(wǎng)址對用戶來說是一件非常痛苦的事情,因為中間摻雜了中文、大小寫數(shù)字、數(shù)字甚至是標(biāo)點符號,朗讀起來一點都不自然;對計算機來說,這些輸入簡直就是天災(zāi)。

另外,多音字、同音異義詞的識別準(zhǔn)確率也非常低,所以盡量避免讓用戶進(jìn)行復(fù)雜或帶來高歧義性的輸入。

十一、針對重要請求,向用戶發(fā)出顯式確認(rèn);針對風(fēng)險較低的請求,可以采用隱式確認(rèn)方式

確認(rèn)是語音界面與用戶溝通的一種方式,用于檢查用戶的問題、命令和回復(fù)是否被正確理解,它可以保證對話的流暢度和準(zhǔn)確度,讓用戶知道系統(tǒng)已經(jīng)理解了自己的話,有利于建立用戶信任并且提升語音交互的體驗。

在對話中有兩種類型的確認(rèn)方式:顯式確認(rèn)和隱式確認(rèn),筆者建議系統(tǒng)根據(jù)不同的情境和置信區(qū)間選擇合適的確認(rèn)方式。

顯式確認(rèn)通常要與用戶核實其提供的輸入是否被正確地處理,或者請求用戶允許操作。

采用顯式確認(rèn)時,智能助手在得到用戶確認(rèn)之前不會執(zhí)行后續(xù)操作。對于某些難以撤銷的操作,采用顯式確認(rèn)方式征得用戶口頭同意是較為合適的,例如資金轉(zhuǎn)賬的最終確認(rèn)環(huán)節(jié)和免責(zé)協(xié)議的確認(rèn),但是過度的確認(rèn)會讓用戶感到厭煩。

采用隱式確認(rèn)方式,意味著VUI在回復(fù)中融入了用戶話語中的關(guān)鍵信息,以便表明VUI理解的內(nèi)容。對于識別準(zhǔn)確性為中到高,并且潛在的負(fù)面影響較低時,采用隱式確認(rèn)的方式是較為適合的。

隱式確認(rèn)的優(yōu)點是效率高,缺點是用戶經(jīng)常會不知道如何讓對話重回正軌。

十二、盡量少用語氣助詞

在句末使用“阿、啊、啦、唉、呢”等助詞可以增強語氣和氣勢。

常見的語氣詞有以下這些分類:疑問語氣、祈使語氣、感嘆語氣、肯定語氣和停頓語氣。

目前的TTS技術(shù)很難通過文字和語境將正確的語氣表達(dá)出來,大部分的語氣助詞只能平調(diào)朗讀出來,效果很不佳,因此寫腳本時注意語氣助詞的使用。

十三、檢查對話內(nèi)容是否符合人物設(shè)定

不同性格的人說的話的特征是不一樣的,就像一名傲嬌少女突然降低音調(diào)大吼“拿命來”的話會讓用戶嚇了一跳。最重要的一點,切勿用高人一等的口吻和用戶說話。

十四、在引起用戶負(fù)面情緒的關(guān)鍵點上加入情感化設(shè)計

用戶最討厭別人對他說“我不知道你在說什么”,如果智能助手連續(xù)多次和用戶說“我不知道你在說什么”,用戶會對智能助手產(chǎn)生憤怒甚至絕望的感情,同時對智能助手失去信任。

為了避免這種災(zāi)難事故的發(fā)生,建議在設(shè)計對話時引入用戶體驗地圖,在引起用戶負(fù)面情緒的關(guān)鍵點上加入情感化設(shè)計或者轉(zhuǎn)移話題。

撒嬌也是一種能緩解用戶情緒低落的好方法,例如第一次聽不懂時可以試著回答“不好意思,這項技能我還沒學(xué)會哦”;第二次聽不懂時可以試著回答“回去后我會好好努力學(xué)習(xí)的,要不換個問題?”;第三次仍然聽不懂時試著回答“我真的不會嘛,不要為難人家好不好”。

十五、在合適的場景說合適的話

如果深夜用戶設(shè)置一個鬧鐘結(jié)果智能助手的回復(fù)時長高達(dá)15秒,相信用戶一定會發(fā)瘋。

在權(quán)限允許的情況下,如果我們能獲取到用戶的時間和定位信息,筆者建議對話設(shè)計時一定要考慮時間和定位信息,智能助手和人一樣,要在合適的場景說合適的話。

十六、考慮多種交互方式

語音交互不一定只能通過對話進(jìn)行交互,還可以結(jié)合結(jié)構(gòu)化的文字和圖像進(jìn)行表達(dá)。有些比較復(fù)雜的內(nèi)容需要播放很長的文案,例如天氣預(yù)報。

這時候采取視覺可視化的方法讓用戶一眼就能看完,能有效提高整個交互效率。

十七、優(yōu)先撰寫愉悅路線

先寫一個可以完成任務(wù)并且完整簡單的對話,它從開始到結(jié)束,中間沒有任何分支,這就是我們想要的愉悅路線。

完成愉悅路線以后,我們考慮其他可以完成任務(wù)的對話路線。這些路線和愉悅路線所完成的任務(wù)是一樣的,但是中間多了一些小插曲,例如用戶并沒有表達(dá)出所有信息,需要語音助手去引導(dǎo)。

#專欄作家#

薛志榮,微信公眾號:薛志榮,人人都是產(chǎn)品經(jīng)理專欄作家。暢銷書《AI改變設(shè)計-人工智能時代的設(shè)計師生存手冊》作者,全棧開發(fā)者,專注于交互設(shè)計和人工智能設(shè)計。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議。

專欄作家

薛志榮,微信公眾號:薛志榮,人人都是產(chǎn)品經(jīng)理專欄作家。暢銷書《AI改變設(shè)計-人工智能時代的設(shè)計師生存手冊》作者,全棧開發(fā)者,專注于交互設(shè)計和人工智能設(shè)計。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!