語音交互實(shí)例:從切換播放模式細(xì)節(jié)想到的

7 評論 7534 瀏覽 34 收藏 14 分鐘

這一段項(xiàng)目時間不是很緊張,比較有時間去探討一些細(xì)節(jié)的問題,有些東西可以做有些東西可以不做,去探究背后的原因是一件很有趣的事情。

一、簡單介紹VUI

想必大家對于語音交互并不是很了解,而車載方面的語音交互更是陌生。這里我先來科普下大背景,至于對這個方面比較感興趣的可以查找一下資料,想必其他的文章會很詳細(xì)的介紹理論。這里我先討論在實(shí)際應(yīng)用當(dāng)中的需求探索。

首先語音交互是從交互式語音應(yīng)答系統(tǒng)(Interactive Voice Response,IVR)而來,它是通過電話來執(zhí)行任務(wù),和10086不同的是,它能夠識別人們說的話,由于擅長處理帶有大量信息的復(fù)雜句子,應(yīng)用場景比較廣泛。

后面智能手機(jī)高速發(fā)展,于是誕生了VUI(Voice User Interactive ),像Siri、Cortana都是比較典型的應(yīng)用,語音交互一直被稱作“最為自然的交互入口”,優(yōu)點(diǎn)和缺點(diǎn)都很明顯。

車載場景的語音交互,有個很明顯的優(yōu)勢:無需司機(jī)分心操作,直接語音指令即可達(dá)到想要的目的。所以在車內(nèi)使用語音交互,任務(wù)型需求會占大多數(shù)。

二、實(shí)際應(yīng)用中遇到的問題

今天看到之前的產(chǎn)品文檔中有這樣一個設(shè)計:

當(dāng)前的設(shè)計都由于技術(shù)的限制,不支持的說法不能進(jìn)行下一輪的對話,所以這里在反饋完畢后直接退出語音。并沒有什么大問題,很多車機(jī)語音交互直接提示不支持的說法,后面的說法提示都沒有。但這個方案對于用戶來講,依舊大大打擊了他們使用語音的積極性,這樣的設(shè)計至少有下面幾點(diǎn)不是很合適的點(diǎn):

  1. 在人工智能不是很智能的情況下,盡量理解用戶意圖并允許用戶繼續(xù)交談。
  2. 功能點(diǎn)設(shè)計要考慮可發(fā)現(xiàn)性,對于語音交互,看不到的交互方式更要提高它的可發(fā)現(xiàn)性。
  3. 已知的對話原則中有一點(diǎn):方式準(zhǔn)則,即說話需清晰明了,這里可以做簡化,但也需要針對不同的用戶群體。

三、從用戶出發(fā),了解說出這句話的初始意圖

在我看來語音交互是一個比較繁瑣的設(shè)計過程,因?yàn)椴煌瑘鼍坝脩魰f什么樣的話很難預(yù)測,所以我會選取幾個最常見的使用場景,然后為每個場景按照最優(yōu)路徑(同樣結(jié)合業(yè)務(wù)流程)寫出示例對話,同時還要加上異常情況。

這個就是在切換播放模式時的一種異常情況:

User:幫我切換到隨機(jī)播放/隨機(jī)播歌/按照隨機(jī)播放歌…

TTS:隨機(jī)播放

(TTS:從文本到語音,Text To Speech,一般是由產(chǎn)品、交互設(shè)定的內(nèi)置文本,當(dāng)用戶說了某句話命中某個說法,那么就播報該說法對應(yīng)的反饋語。這整個過程就算做是一個完整的對話交互設(shè)計了。)


再來看看用戶為什么會這樣說“切換播放模式”吧:

  1. 在手機(jī)APP上,切換播放模式,都是點(diǎn)擊切換到自己想要的播放模式,三個播放模式是固定的順序,所以在車機(jī)上用戶也會想要延續(xù)這樣的操作習(xí)慣,才會有這樣的說法。
  2. 知道播放模式有哪些,但是不知道車機(jī)上語音對音樂的操控有哪些,所以試探性的嘗試。
  3. 不清楚有哪些播放模式,所以只是想看下有哪些播放模式

不論從哪個出發(fā)點(diǎn),最終的目的導(dǎo)向都是:想要切換播放模式。

四、根據(jù)不同意圖,對用戶進(jìn)行分類,尋找更好的解決方案

根據(jù)上面三種情況,其實(shí)可以分為:

  1. 對音樂比較熟悉的用戶,對車機(jī)端的語音控制探索使用。
  2. 對音樂不怎么熟悉的用戶,對車機(jī)端的語音控制探索使用。

再來看看語音切換播放模式的需求想要解決的問題:

  1. 無需關(guān)注界面,直接下達(dá)語音指令達(dá)到目標(biāo);
  2. 縮短用戶操作路徑:比方說手機(jī)上切換播放模式,有時候需要點(diǎn)擊兩次;而車機(jī)上直接下達(dá)明確指令,直接完成。

來,先來分析上面兩種用戶群體的更深層的用戶定位。

1.對音樂比較熟悉的用戶

手機(jī)上的操作大部分是因?yàn)樵诓シ旁斍轫摰牟僮靼粹o過多,所以把播放模式收入到一個按鈕中去,下面是不同的音樂界面,特意選擇了一些不常用的音樂App,出乎意料酷狗是可以選擇,基本其他的應(yīng)用都采用點(diǎn)擊切換播放模式的交互;

再深入一點(diǎn),手機(jī)用戶切換播放模式的時候分兩種場景:

  • 第一種,熟悉播放模式的人,在操作之前會有一個心理預(yù)期,所以會設(shè)定為她想要的播放模式,而播放模式的切換最多點(diǎn)擊三次,用戶成本不會很高,所以這也是大部分手機(jī)APP將它收入一個icon當(dāng)中的原因;
  • 第二種,不是很熟悉的人,他們在操作的時候可能會想了解有什么播放模式,最后再去確定最終的心理預(yù)期,所以點(diǎn)擊會超過三次。

綜合上述,不論是熟悉程度如何,都會有一個既定的心理目標(biāo),有比較明確的操作意圖。

而對音樂APP比較熟悉的用戶群體基本集中在:18-40歲左右,他們基本上都知道有這三種播放模式,所以可以有以下做法:

  • 做法一:經(jīng)過刻意引導(dǎo),讓他們的意圖更為明確,這樣就不會出現(xiàn)這樣的說法;直接下命令切換,也能夠減少用戶的操作路徑,降低用戶的操作成本。
  • 做法二:先完成用戶目標(biāo)用意:切換播放模式,再提示用戶有什么播放模式可以切換,讓用戶逐漸熟悉
  • 做法三:完成用戶目標(biāo)用意,不進(jìn)行提示,三種播放模式可能用戶就是比較懶,不想說出具體的播放模式名稱,這樣只記住一個說法即可達(dá)成。

2.對音樂不怎么熟悉的用戶

我專門找了我親愛的爸比,詢問了下他的中老年開車朋友們,年齡分布在40-50歲,大部分在45歲以下。下面是一些聊天記錄。

我的問題:你們在播放音樂的時候,知道能夠切換播放模式么?如果知道,那你們知道有幾種播放模式可以切換么?請說出你們印象中的名字。在這個過程中,不要打開音樂APP查看,靠自己的記憶~

很出乎我的意料,可能調(diào)查的目標(biāo)用戶在一線城市會結(jié)果又不一樣。但是生活在一線城市的中老年人人數(shù)又有多少呢?很大部分的中老年人都生活在非一線城市,對于他們而言,簡單的播放歌曲就能滿足他們對音樂的需求。

但是,有沒有必要像這一部分的人推送這個功能呢?

再來看會使用智能車機(jī)的人群分布:(網(wǎng)上扒來的數(shù)據(jù),隨意看下)

有65%的中國消費(fèi)者愿意接受車聯(lián)網(wǎng)功能,高于歐洲國家的40%和北美的32%。中國消費(fèi)者也更加愿意嘗試娛樂資訊方面的功能,比如社交媒體和車載視頻及音樂。

未來十年間55歲以上族群會增長近1億人,與此同時同時90后替代80后逐步成長為消費(fèi)市場主力,2015年數(shù)量已經(jīng)接近2億。年輕和老齡人群的消費(fèi)需求變化將值得深入挖掘,以贏得未來市場進(jìn)行提前布局。

所以中老年的需求有待挖掘,所以我覺得這里應(yīng)該要做的是音樂推薦的智能化,讓他們享受到人工智能帶來的好處;而不是引導(dǎo)他們使用新的功能,這樣對他們而言使用、操作成本都大大提升,也增加了他們的記憶負(fù)擔(dān),明明車機(jī)的語音交互只是想要減少用戶在開車中的干擾因素,這樣和我們想做的事情背道而馳。

五、結(jié)合推薦做法、語音交互優(yōu)化準(zhǔn)則,確定最后的方案

好了用戶群體分析、需求深入分析已經(jīng)告一段落,那么就要按照剛開始覺得做的不到位的點(diǎn),明確最后的方案。

根據(jù)二、四種可優(yōu)化的點(diǎn)和推薦的做法,我們來對比分析下:

做法一是交互引導(dǎo),其實(shí)在整體方案設(shè)計中就有考慮如何引導(dǎo)用戶了解語音交互,已有方案。

做法二、三,都符合理解用戶意圖、能夠提高可發(fā)現(xiàn)性,區(qū)別是后續(xù)的信息有沒有提示用戶。不過這里讓人糾結(jié)的點(diǎn)有以下考慮:

  1. 提示用戶,他們能夠明確知道還能夠說什么說法操作,不過說法提示過長,無法再精簡,對用戶來講也有一定的記憶負(fù)擔(dān);
  2. 不提示用戶,他們可能不了解直接說播放模式的名稱也可以操作,這樣更簡單有效。

我們再來明確設(shè)計目標(biāo):簡單、高效、不分散注意力;所以提示是必須的。明確這些,繼續(xù)參考資料-《語音界面用戶設(shè)計》這本書,根據(jù)語音用戶界面基本設(shè)計原則中的異常處理中,增強(qiáng)錯誤提示有這樣的實(shí)例對話:

天氣APP:我能為您提供天氣信息,請問您所在的州和城市是哪里?

User:恩…我在斯普林菲爾德。

天氣APP:抱歉,我沒聽懂,請說出所在的州和城市。

用戶:哦,我在明尼蘇達(dá)州,斯普林菲爾德。

這個異常處理有提示用戶需要明確的信息,那么我們的方案也可以采用這樣的方案:

User:切換播放模式

TTS:好的,請問您想切換為哪種播放模式呢?

User:隨機(jī)播放

TTS:已切換,您下次可以直接對我說隨機(jī)播放。再見~

這樣的方案是不是看起來不是那么智障呢?

做語音交互方案一直處于這樣的發(fā)現(xiàn)提升點(diǎn)、探索、制定方案、糾結(jié)、推翻、不斷優(yōu)化的過程中,關(guān)于這方面的教科書般的理論并不是很多,所以這里記錄下一個優(yōu)化小點(diǎn)從發(fā)散到制定優(yōu)化方案的小過程,可能比較瑣碎,分享下語音交互的日常工作,也希望能幫助想了解的人對此有點(diǎn)認(rèn)知。

 

作者:青絳,微信公眾號:慕七和大胖

本文由 @青絳 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Pixabay,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 很用心,支持一下

    來自上海 回復(fù)
  2. 樓主有微信嗎?一起學(xué)習(xí)呀!

    回復(fù)
    1. 好啊~微信:15521017512,記得備注~

      來自廣東 回復(fù)
  3. 多謝支持~

    來自廣東 回復(fù)
    1. Hello 欣賞你的作品??梢哉J(rèn)識一下嗎。 車載相關(guān)從業(yè),產(chǎn)品運(yùn)營。

      來自廣東 回復(fù)
    2. 好啊~微信:15521017512,記得備注~

      來自廣東 回復(fù)