亚洲国产精品成,国产综合无码一区二区三区

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

怎樣用聲紋識(shí)別，提升智能硬件產(chǎn)品的用戶體驗(yàn)？

小路

2018-08-27

4 評(píng)論 6460 瀏覽 58 收藏

12 分鐘

本文將談?wù)勗谥悄芤粝?、智能機(jī)器人等此類以語(yǔ)音為主要交互方式的智能硬件產(chǎn)品中，除了提升語(yǔ)音識(shí)別準(zhǔn)確率、語(yǔ)義理解效果外，怎樣使用聲紋識(shí)別來(lái)進(jìn)一步提升用戶體驗(yàn)，讓智能產(chǎn)品更加智能。

一、背景

當(dāng)前智能硬件產(chǎn)品中，最耀眼的莫過(guò)于百箱大戰(zhàn)的智能音箱、百“機(jī)”爭(zhēng)鳴的智能機(jī)器人，這些智能語(yǔ)音產(chǎn)品已逐漸走進(jìn)百姓的視線中。

在智能音箱市場(chǎng)中，且不說(shuō)國(guó)外的Amason Echo和Google Home，僅在國(guó)內(nèi)，去年雙十一，天貓精靈99元跳樓價(jià)賣了一百萬(wàn)臺(tái)，還有鋪天蓋地而來(lái)的小愛(ài)同學(xué)、叮咚音箱、小雅同學(xué)、出門問(wèn)問(wèn)等。

今年，百度推出比天貓精靈還低10元的小度智能音箱，僅賣89元，燒錢大戰(zhàn)一個(gè)比一個(gè)狠。在智能機(jī)器人市場(chǎng)也同樣打得火熱，這類智能音箱和智能機(jī)器人最明顯的特點(diǎn)，就是采用了語(yǔ)音作為全新的交互方式，力圖打造更接近于人與人交流的方式。

然而，大部分智能語(yǔ)音產(chǎn)品只能識(shí)別出說(shuō)話的內(nèi)容，對(duì)于相同的問(wèn)題都會(huì)給出相同的反饋信息。雖然交互方式是智能的，但交流方式仍然不夠智能。

所謂交流，即有明確對(duì)象，和不同對(duì)象交流應(yīng)有不同的回應(yīng)，聞聲即可識(shí)人，這才是更智能的體驗(yàn)。聲紋識(shí)別，正是可以實(shí)現(xiàn)這種聞聲識(shí)人的技術(shù)手段。

本文將談?wù)勗谥悄芤粝?、智能機(jī)器人等此類以語(yǔ)音為主要交互方式的智能硬件產(chǎn)品中，除了提升語(yǔ)音識(shí)別準(zhǔn)確率、語(yǔ)義理解效果外，怎樣使用聲紋識(shí)別來(lái)進(jìn)一步提升用戶體驗(yàn)，讓智能產(chǎn)品更加智能。

二、應(yīng)用場(chǎng)景

場(chǎng)景是需求的靈魂，拋開場(chǎng)景談需求都是耍流氓！

我們先對(duì)場(chǎng)景分分類，聲紋識(shí)別作為身份驗(yàn)證的一種手段，根據(jù)不同的安全性要求，我們將應(yīng)用場(chǎng)景分非關(guān)鍵應(yīng)用場(chǎng)景和關(guān)鍵應(yīng)用場(chǎng)景。

非關(guān)鍵應(yīng)用場(chǎng)景：即那些對(duì)安全性要求不高，即使誤識(shí)也不會(huì)產(chǎn)生明顯不良影響，但對(duì)用戶體驗(yàn)要求較高的場(chǎng)合，如：猜猜說(shuō)話人是誰(shuí)、個(gè)性化的服務(wù)推薦（歌曲推薦、餐廳推薦等）；
關(guān)鍵應(yīng)用場(chǎng)景：這類應(yīng)用場(chǎng)景有明顯的安全性要求，不能容忍有誤識(shí)情況，誤識(shí)會(huì)帶來(lái)明顯的不良影響，如：一些重要的權(quán)限控制（家電開關(guān)控制等）、聲音購(gòu)物支付等，這類型場(chǎng)景會(huì)犧牲一部分用戶體檢以保證安全性，畢竟魚和熊掌不可兼得！

三、應(yīng)用設(shè)計(jì)

聲紋識(shí)別在應(yīng)用上分為注冊(cè)和驗(yàn)證兩個(gè)流程，如下圖所示：

在智能音箱和智能機(jī)器人（家庭陪伴機(jī)器人）的產(chǎn)品中，聲紋識(shí)別其實(shí)就是1：N的應(yīng)用（N的值一般小于10），音箱和機(jī)器人一般都會(huì)有一個(gè)名字，即喚醒詞，就如同人的名字一樣，以下設(shè)計(jì)我們暫且給智能硬件起個(gè)名字叫“你好同學(xué)”。

1. 聲紋注冊(cè)流程設(shè)計(jì)

聲紋注冊(cè)是開啟聞聲識(shí)人的第一步，注冊(cè)者先說(shuō)幾句話，系統(tǒng)自動(dòng)將其中的聲紋特征提取出來(lái)作為說(shuō)話人身份的ID，這個(gè)過(guò)程如同像陌生人做自我介紹一樣，介紹完大家就認(rèn)識(shí)你了。

雖然聲紋注冊(cè)流程必不可少，但產(chǎn)品設(shè)計(jì)上卻希望這個(gè)流程越簡(jiǎn)單越好，最好是不需要注冊(cè)這個(gè)環(huán)節(jié)（當(dāng)然這是不可能的?。。。?。

在做注冊(cè)流程設(shè)計(jì)前，我們先搞清幾個(gè)問(wèn)題：

（1）注冊(cè)入口在哪里？

目前的智能語(yǔ)音產(chǎn)品在交互方式上，除了用語(yǔ)音，還會(huì)分為帶顯示屏和不帶顯示屏，即有部分帶有視覺(jué)交互。

所以，注冊(cè)入口可分為三種：

直接在設(shè)備上使用語(yǔ)音方式作為注冊(cè)入口，即直接對(duì)設(shè)備說(shuō)：你好同學(xué)，我要注冊(cè)聲紋；
在設(shè)備配套的APP上設(shè)置注冊(cè)入口，適合無(wú)屏的設(shè)備；
在設(shè)備自帶的屏幕上設(shè)置注冊(cè)入口，類似APP方式。

（2）在哪里采集注冊(cè)錄音？

對(duì)于注冊(cè)入口在APP上的情況，我們需要搞清楚錄音采集是在設(shè)備上，還是在手機(jī)上。

一般來(lái)說(shuō)，無(wú)論注冊(cè)入口在哪里，最終的驗(yàn)證入口都是在設(shè)備上，為了避免在不同設(shè)備上錄音效果不一樣，造成驗(yàn)證準(zhǔn)確率下降（我們叫這種現(xiàn)象叫信道失配，即注冊(cè)信道與驗(yàn)證信道不一致而帶來(lái)的準(zhǔn)確率下降的現(xiàn)象），我們會(huì)直接在設(shè)備上進(jìn)行注冊(cè)錄音的采集。

當(dāng)然，你非得在APP上錄音，也是可以的，呵呵！

（3）非關(guān)鍵應(yīng)用和關(guān)鍵應(yīng)用是否需要單獨(dú)注冊(cè)？

理論上來(lái)說(shuō)，注冊(cè)語(yǔ)音越長(zhǎng)，識(shí)別效果越好，但也需要考慮到用戶體驗(yàn)。所以，我們可以將注冊(cè)流程設(shè)計(jì)為基礎(chǔ)注冊(cè)+加強(qiáng)注冊(cè)，其中基礎(chǔ)注冊(cè)滿足非關(guān)鍵應(yīng)用場(chǎng)景，加強(qiáng)注冊(cè)主要是考慮到關(guān)鍵應(yīng)用場(chǎng)景的安全性問(wèn)題。

（4）聲紋注冊(cè)上還有哪些需考慮的點(diǎn)？

智能音箱和機(jī)器人一般都是遠(yuǎn)場(chǎng)語(yǔ)音應(yīng)用，交互距離最大可達(dá)5米，同時(shí)也覆蓋了近場(chǎng)語(yǔ)音，所以在說(shuō)話人離設(shè)備的距離不同時(shí)，采集的語(yǔ)音質(zhì)量也會(huì)存在差異。對(duì)語(yǔ)音識(shí)別來(lái)說(shuō)可能不會(huì)有太多的影響，但對(duì)于聲紋識(shí)別來(lái)說(shuō)，會(huì)造成聲紋特征的損失。所以在注冊(cè)時(shí)還需要考慮不同距離，比如：0.5米、3米、5米等。

另外，還需要考慮說(shuō)話的音量、語(yǔ)速等因素，相信隨著識(shí)別算法的提升，這些因素都將不會(huì)成為產(chǎn)品設(shè)計(jì)的考慮點(diǎn)。

（5）聲紋注冊(cè)有哪些表現(xiàn)形式？

在注冊(cè)的表現(xiàn)形式上，可分為兩種：

引導(dǎo)式注冊(cè)：根據(jù)界面或語(yǔ)音提示，引導(dǎo)用戶一步一步進(jìn)行注冊(cè)，這是最為常用的方式，也是目前最合適的方式。
無(wú)感知注冊(cè)：即不需要指定用戶執(zhí)行注冊(cè)流程即可完成聲紋注冊(cè)，打破常規(guī)的聲紋注冊(cè)-聲紋驗(yàn)證的應(yīng)用流程，在使用過(guò)程中自動(dòng)完成聲紋注冊(cè)，直接實(shí)現(xiàn)“聽聲辨人”，最大限度提升用戶體驗(yàn)。我們下次再來(lái)詳細(xì)講一下這種無(wú)感知注冊(cè)。

2. 聲紋注冊(cè)流程

3. 原型設(shè)計(jì)參考

以帶屏設(shè)備上或APP上注冊(cè)為例，原型僅供參考，在真實(shí)項(xiàng)目中仍需要考慮更多的交互細(xì)節(jié)。對(duì)于注冊(cè)內(nèi)容，一般建議使用“喚醒詞+常用短語(yǔ)”的方式。當(dāng)然，如果追求更簡(jiǎn)潔的注冊(cè)方式，也可以只讀兩次喚醒詞。

4. 聲紋驗(yàn)證流程設(shè)計(jì)

在聲紋驗(yàn)證環(huán)節(jié)，一般通過(guò)純語(yǔ)音交互來(lái)完成，我們按非關(guān)鍵應(yīng)用場(chǎng)景和關(guān)鍵應(yīng)用場(chǎng)景來(lái)設(shè)計(jì)。

（1）非關(guān)鍵應(yīng)用場(chǎng)景驗(yàn)證

最常用的自我身份驗(yàn)證：對(duì)設(shè)備說(shuō)出“你好同學(xué)，猜猜我是誰(shuí)”或“你好同學(xué)，我是誰(shuí)”，設(shè)備根據(jù)聲紋識(shí)別結(jié)果回應(yīng)說(shuō)話人，比如：設(shè)備回應(yīng)：哎喲，你就那玉樹臨風(fēng)、風(fēng)流倜儻、迷死萬(wàn)千少女兼大媽的彭魚宴。

非關(guān)鍵應(yīng)用場(chǎng)景有非常多的玩法，主要圍繞不同身份的個(gè)性化推薦來(lái)設(shè)計(jì)，具體大家可以根據(jù)實(shí)際產(chǎn)品及場(chǎng)景需求來(lái)思考。

另外，對(duì)于帶屏的設(shè)備，一般都會(huì)具備攝像頭，可以實(shí)現(xiàn)人臉識(shí)別功能。有些廠家可能會(huì)將人臉和聲紋結(jié)合起來(lái)做身份驗(yàn)證，這種多維度驗(yàn)證確實(shí)能提高安全性，但建議只在關(guān)鍵應(yīng)用場(chǎng)景下使用兩者作為驗(yàn)證手段，在非關(guān)鍵應(yīng)用場(chǎng)景中只使用聲紋識(shí)別。畢竟如果每次問(wèn)機(jī)器人我是誰(shuí)時(shí)，還要自己找到攝像頭正面看一會(huì)才能識(shí)別出身份，這樣的體驗(yàn)非常不好。

（2）關(guān)鍵應(yīng)用場(chǎng)景驗(yàn)證

此場(chǎng)景中，需要考慮二次身份核驗(yàn)，即在喚醒時(shí)已做一次身份識(shí)別，在說(shuō)話人做出關(guān)鍵操作確定后，比如：確定購(gòu)買商品，需要進(jìn)行身份核驗(yàn)。

由于是純語(yǔ)音交互，考慮到安全性，可采用讀4位隨機(jī)數(shù)字或喚醒詞的方式來(lái)驗(yàn)證，此種情況下聲紋識(shí)別必須具備活體檢測(cè)功能，以防止通過(guò)錄音的方式來(lái)假冒說(shuō)話人聲音。

（3）驗(yàn)證流程設(shè)計(jì)（實(shí)際流程遠(yuǎn)比這個(gè)復(fù)雜）

四、未來(lái)應(yīng)用

雖然目前的智能硬件仍在不斷完美語(yǔ)音識(shí)別和語(yǔ)義理解的效果，然而，我們相信增加聲紋識(shí)別必定會(huì)大大提升智能設(shè)備的使用體驗(yàn)，同時(shí)亦可增加情緒識(shí)別、性別識(shí)別、年齡識(shí)別，讓機(jī)器更懂你。

正如電影“her”中的薩曼莎，語(yǔ)音交互水平已達(dá)到了強(qiáng)人工智能水平，比與人類交互效果更好。因?yàn)閔er可以在一秒內(nèi)檢索完主人所提問(wèn)題關(guān)聯(lián)到相關(guān)知識(shí)信息，以更好給出回答，這是人類所不能達(dá)到的。要達(dá)到人類期望值中的語(yǔ)音交互效果，就必須讓設(shè)備能夠：聽得清、聽得懂、學(xué)得會(huì)、說(shuō)得出。

期待“her”的出現(xiàn)?。。?/p>

作者：Micos，在人工智能浪潮中推波助瀾的產(chǎn)品經(jīng)理，致力于用智能語(yǔ)音實(shí)現(xiàn)人與機(jī)器最自然的交互方式。

本文由 @Micos 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載

題圖來(lái)自Unsplash，基于CC0協(xié)議

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App

小路

公眾號(hào)：產(chǎn)品有套路

5篇作品 38384總閱讀量

ROI 超 4 的 5 種小紅書玩法！

09-225255 瀏覽

團(tuán)餐如何“互聯(lián)網(wǎng)化”？

04-146196 瀏覽

產(chǎn)品經(jīng)理技能提升之「時(shí)序圖」

08-113730 瀏覽

視頻號(hào)可能被神話了

01-162237 瀏覽

提效90%的列表，你想了解嗎？

11-234241 瀏覽

評(píng)論

dlwcn

寫得很深入。感謝分享

最近回復(fù)
Wanki

呃…寫的挺認(rèn)真的，可是進(jìn)來(lái)后感覺(jué)文不對(duì)題。實(shí)際沒(méi)有講怎樣用聲紋識(shí)別提升智能硬件產(chǎn)品的使用體驗(yàn)，像是介紹聲紋識(shí)別的流程和交互。

最近來(lái)自廣東回復(fù)
1. 小路作者回復(fù)Wanki
  
  本來(lái)文末附了一篇文章鏈接，編輯刪掉了，你可以多了解一下相關(guān)的文章。
  
  最近來(lái)自廣東回復(fù)