語音助手大比拼:蘋果Siri和華為小e

7 評論 5883 瀏覽 10 收藏 20 分鐘

編輯導讀:每一部智能機里面都有一款語音助手,它的作用是讓人們生活更加便利,“解放人”。本文將以蘋果Siri和華為小e為例,對這兩個語音助手進行比較分析,希望對你有幫助。

一、引言

現如今,智能設備的普及讓“人工智能”這個話題變得不再陌生而遙遠。

以前人們想訂購車票一定要到車站去購買;后來有了互聯網,人們可以在網站上自行查詢車票信息并購買,省去了去車站的時間,在家即可完成;再后來出現了語音助手,人們甚至可以通過語音助手查詢車票信息,省去了自己搜索查找的時間,說出想要了解的信息即可。

隨著科技的發(fā)展,人們的生活變得越來越便捷,而人工智能似乎一直致力于“解放人”。

用戶與智能設備的交互不再局限于鍵盤、鼠標之類的硬件,觸控交互、語音交互已經成為了當代人機交互的主流方式,用戶的操作也變得越來越便捷與直接。在技術欠缺的年代里,人們注重更多的是功能的實現,而在技術成熟的現在,人們注重更多的是如何“解放人”以及提升用戶的情感體驗。

自蘋果推出語音助手“Siri”后,各大智能企業(yè)也都相繼推出了自己的語音助手,它們不局限于手機這個載體,電腦、手表、家電等智能設備都可以通過語音助手進行操作。

正因如此,語音助手的泛濫給用戶帶來了許多困惑,這也是我想做這個課題的起因。希望通過此次實驗,能夠以蘋果智能語音助手Siri和華為語音助手小e為例,對這兩個語音助手進行操作比較評估,從而進行區(qū)分。

此次實驗主要針對手機平臺,觀察不同語音助手對同一用戶指令的完成情況。實驗選取了iPhone X及華為P20作為實驗體,并尋找了6名實驗對象。實驗對象需做兩組重復試驗,每次實驗都將對Siri、小e說出同樣的語音指令,觀察其反饋情況。若未能達到指令預期效果,則根據自身需要繼續(xù)補充,與語音助手進行交流,直到達到預期目的為止。記錄語音助手完成此任務的耗時,以及用戶滿意度。

通過此次試驗,可以直觀地看出Siri和小e在處理同一指令時的反饋。語音交互的功能覆蓋面雖然依舊不是很廣,但用戶體驗卻是其中至關重要的考量因素。交互時的任務完成度、耗時等都將影響用戶體驗。在測試結束后,讓每位測試用戶做問卷調查,希望能通過數據分析,對Siri及小e有初步的實用性比較評估。

圖1 手機語音助手

通過實驗數據可知,Siri執(zhí)行語音指令時的操作總耗時平均14.81秒,小e執(zhí)行語音指令時的操作總耗時平均25.18秒。Siri在操作耗時上整體比小e短,即能更快的對語音進行轉譯并給出反饋。

而通過實驗測試后的調查問卷,我們可以發(fā)現Siri與小e的用戶滿意度相近。但小e在服務質量方面更勝一籌,相較于Siri它能給用戶更多的引導提示,這對不了解語音助手功能的用戶而言更加友好。

只依靠操作耗時、用戶滿意度這兩個實驗數據我們無法斷言Siri與小e哪個在性能上更好,但這可以作為評估語音助手實用性的一種參考。單從操作耗時的角度上看,Siri明顯優(yōu)于小e;單從用戶滿意度的角度上看,小e尤其在服務質量上要優(yōu)于Siri。

二、實驗設計

2.1 實驗假設

蘋果智能語音助手Siri發(fā)布于2016年6月13日,開辟了手機端中語音交互的先河,因此在技術層面上可能較華為語音助手小e更為成熟。對于同一語音指令,兩者應該都能做到準確無誤的文字轉譯,但在操作耗時上Siri可能還是要領先于小e。同時,蘋果公司一直致力于用戶體驗研究,因此在用戶滿意度方面,Siri可能也會優(yōu)于小e。

2.2 實驗內容

現在的語音助手對于涉及基本功能的常規(guī)問題都能做到完美應答,因此在設計實驗時更應該考慮到日常生活的需要。

此次實驗內容旨在通過考查Siri與小e對同一語音指令的完成情況來評估兩者的實用性。實驗對象需分別對Siri和小e說出同一指令,并與其進行后續(xù)的人機交流,直至完成指令任務,記錄耗時。在用戶試驗測試完后讓其填寫調查問卷,用戶滿意度可根據實驗對象的調查問卷結果分析得出。

2.3 實驗的設備及環(huán)境

本實驗對環(huán)境沒有要求,為防止不同手機對實驗結果的影響,選取一部iPhoneX與一部華為P20作為固定的實驗設備。

圖2 蘋果智能語音助手Siri與華為小e產品界面比較

2.4 用戶

實驗對象一:

年齡:21 性別:女 專業(yè)背景:大學工科在讀

選擇理由:該實驗對象有5年蘋果產品的使用經驗,現正在使用iPhoneX,對蘋果iOS操作系統(tǒng)十分熟悉,而對安卓系統(tǒng)并不熟悉,并且從未使用過華為手機。由于平時所學專業(yè)的原因,對電子產品及其語音助手功能十分了解,因此,對Siri有基本認識,但對小e不曾了解。

實驗對象二:

年齡:20 性別:女 專業(yè)背景:大專在讀

選擇理由:該實驗對象有6年安卓產品的使用經驗,現正在使用華為P20,對安卓操作系統(tǒng)十分熟悉,而對蘋果iOS系統(tǒng)并不熟悉。由于平時所學專業(yè)的原因,對電子產品及其語音助手功能十分了解,因此,對小e有基本認識,但未曾使用過Siri。

實驗對象三:

年齡:25 性別:男 專業(yè)背景:互聯網從業(yè)者

選擇理由:該實驗對象有6年安卓產品的使用經驗,現正在使用華為P20 pro,對安卓操作系統(tǒng)十分熟悉。雖在此前該實驗對象對華為的語音助手功能并不了解,也從未使用過小e,但由于個人愛好的原因,對電子產品及其他語音助手有一定了解基礎。

實驗對象四:

年齡:23 性別:女 專業(yè)背景:普通從業(yè)者

選擇理由:該實驗對象有5年安卓產品的使用經驗,現正在使用華為。因為自身原因,平時對電子產品使用不多,屬于智能設備小白,因此從未使用過任何智能設備中的語音助手功能。

實驗對象五:

年齡:55 性別:女 專業(yè)背景:家庭主婦

選擇理由:該實驗對象有多年安卓產品的使用經驗,現正在使用華為。對智能電子設備的使用頻率較低,且對語音助手沒有任何了解。因此對其的實驗調查更能體現出語音助手是否真的便捷了用戶的操作。

實驗對象六:

年齡:35 性別:男 專業(yè)背景:研究交互方面的大學老師

選擇理由:該實驗對象常年做有關人機交互的學術研究,且在海外留學多年,在這方面有足夠深的造詣,清楚地了解語音助手背后的工作機理。作為語音助手人工智能等方面的高學歷用戶具有一定代表性,可與其他其他普通用戶進行對比。

2.5 實驗任務

實驗名稱:蘋果智能語音助手Siri與華為語音助手小e的實用性評估

實驗對象:6人

實驗設備:一臺iPhoneX、一臺華為P20

控制條件:因為本實驗對環(huán)境等外界要求不高,因此在這方面不做控制。實驗中取一部固定的iPhoneX作為Siri的實驗設備,一部固定的華為P20作為小e的實驗設備。

實驗步驟:

  1. 提前喚醒語音助手;
  2. 實驗對象大聲、連貫地念出一條指定好的語音指令;
  3. 語音助手將該語音指令轉譯為文字顯示,并執(zhí)行回復操作;
  4. 若操作未達到實驗預期效果,則讓實驗對象根據自身需求念出補充的語音指令,重復上述操作直至達到預期效果;
  5. 記錄操作耗時,并讓用戶填寫調查問卷。

分組實驗指令:

  • “給媽媽發(fā)微信祝她生日快樂”;
  • “發(fā)短信給媽媽說記得提醒我明天下午兩點去小劇場彩排節(jié)目”;

調查問卷:

  1. 您的性別
  2. 您的年齡
  3. 您的學歷
  4. 在使用語音助手時是否出現卡頓、閃退、打不開等現象
  5. 使用的語音助手界面是否直觀清晰,界面交互風格是否舒適
  6. 是否簡單上手、容易學會
  7. 我使用的語音助手是否能準確識別出我所說的話(包括普通話、方言、長句子等)
  8. 我所使用的語音助手閑聊持續(xù)久、聲音自然,能“像人”一樣交流
  9. 我所使用的語音助手為用戶提供操作指引,如“試試對我說……”
  10. 我所使用的語音助手能在交流過程讓我感到有趣,娛樂

2.6 實驗的過程

由于實驗設備固定,所以實驗對象無法同時進行實驗,必須按次序進行。同時,又因為有些語音指令無法一步完成,需要與語音助手進行后續(xù)的交流,所以不能同時開啟兩個語音助手進行實驗。

由此,需要每個實驗對象依次進行實驗,在了解要執(zhí)行的語音指令后,先對Siri(或小e)進行測試,再對另一語音助手進行測試。如此,算完成一組實驗測試。實驗共準備了兩個問題,所以實驗對象需重復以上動作完成兩組測試。

在測試過程中,主要需要記錄實驗對象開始說出指令時,便在一旁用手機計時器進行計時。若語音助手能順利完成任務,則在給出準確反饋時結束計時。

兩組測試完成后需要讓實驗對象填寫一份問卷調查,實驗對象需針對每個問題給出相應的分數(10分制),最后進行數據分析,得出該實驗對象對兩款語音助手服務質量、產品質量、內容質量,以及整體使用滿意度的分析結果。

三、實驗結果

此次實驗中的主要測試數據為實驗對象使用兩款語音助手執(zhí)行語音指令時的操作耗時,以及用戶在測試完兩組語音指令后對該兩款語音助手用戶滿意度進行反饋的調查問卷。

第1組:“給媽媽發(fā)微信祝她生日快樂”

從實驗對象說出語音指令時開始計時,直至達到預期效果,語音助手給出最后反饋結束計時,得出兩款語音助手在面對本指令時的操作耗時,數據如下圖所示:

圖3 Siri與小e在執(zhí)行指令1時的耗時比較

從上圖所示的圖表中我們可知:Siri的平均操作耗時為11.758秒,華為的平均操作耗時為30.302秒,在操作耗時方面Siri要明顯優(yōu)于小e。Siri的標準誤差為0.555,小e的標準誤差為2.075,相較于小e,Siri顯然要更穩(wěn)定一些,對不同用戶的語音都能進行準確轉譯與反饋,因此操作耗時相差無幾;而小e的操作耗時受不同用戶的影響更大,數據起伏大。

將該組實驗數據進行單因素方差分析,可得p值為6.01E-06,因為p<0.05,可知本次實驗中,不同的語音助手在操作耗時方面有極大的區(qū)別,數據如下表所示:

圖4 Siri與小e在執(zhí)行指令1時的單因素分析表

第2組:“發(fā)短信給媽媽說記得提醒我明天下午兩點去小劇場彩排節(jié)目”

從實驗對象說出語音指令時開始計時,直至達到預期效果,語音助手給出最后反饋結束計時,得出兩款語音助手在面對本指令時的操作耗時,數據如下圖所示:

圖5 Siri與小e在執(zhí)行指令2時的耗時比較

從上圖所示的圖表中我們可知:Siri的平均操作耗時為17.862秒,華為的平均操作耗時為20.055秒,在操作耗時方面兩者相近。Siri的標準誤差為1.253,小e的標準誤差為0.686,相較于Siri,小e要略穩(wěn)定一些。兩者的操作數據在此次試驗中受用戶的影響都較小,數據平穩(wěn)。

將該組實驗數據進行單因素方差分析,可得p值為0.156,因為p>0.05,可知本次實驗中,不同的語音助手在操作耗時方面的區(qū)別不是很大,數據如下表所示:

圖6 Siri與小e在執(zhí)行指令2時的單因素分析表

用戶滿意度:

在實驗對象結束兩組實驗后,對其進行問卷調查,調查問卷中的問題設置如前文所示。

調查問卷主要研究三個方面:產品質量、內容質量、服務質量。產品質量指該語音助手在運行時是否卡頓、界面設計是否舒適;內容質量指該語音助手在語音轉譯時是否正確,能否準確識別方言等;服務質量指該語音助手是否對用戶進行適當引導,在用戶提問出錯時對其進行類似“你可以試試對我說…”的引導性提問。

最終數據結果如下圖所示:

圖7 Siri與小e在執(zhí)行指令2時的單因素分析表

由上圖可知,Siri與小e在用戶滿意度上的區(qū)別并不是很大,在內容質量上兩者幾乎沒有差別,即Siri和小e的文字轉譯正確率都接近100%。

在產品質量上小e略高于Siri,而在服務質量上小e以較明顯的優(yōu)勢壓過Siri。大部分測試對象都反饋小e在用戶引導上有更好的設置處理,使得從未使用過語音助手的小白也能輕松上手,從而真正達到語音助手便捷用戶這個目的。且小e的操作可修改性較高,對于用戶的實際操作會根據需要拆分成幾個步驟,而Siri則是一步到位,若要修改必須從頭再來。

四、結論

通過此次“蘋果智能語音助手Siri與華為語音助手小e的實用性比較評估”實驗,我們可以得出以下結論:

Siri執(zhí)行語音指令的操作總耗時平均14.81秒,小e執(zhí)行語音指令的操作總耗時平均25.18秒。Siri在操作耗時上整體比小e短,即能更快的對語音進行轉譯并給出反饋。

而通過實驗測試后的調查問卷,我們可以發(fā)現Siri與小e的用戶滿意度相近。但小e在服務質量方面更勝一籌,相較于Siri它能給用戶更多的引導提示,這對不了解語音助手功能的用戶而言更加友好。

只依靠操作耗時、用戶滿意度這兩個實驗數據我們無法斷言Siri與小e哪個在性能上更好,但這可以作為評估語音助手實用性的一種參考。單從操作耗時的角度上看,Siri明顯優(yōu)于小e;單從用戶滿意度的角度上看,小e尤其在服務質量上要優(yōu)于Siri。

預期的實驗結果是Siri無論在操作耗時還是用戶滿意度方面都應領先于小e,而這與實驗的實際結果是不符的。操作耗時上確實是蘋果更勝一籌,但用戶滿意度兩者并沒有明顯差別,且小e在服務質量方面甚至要優(yōu)于Siri。因此我們看出,Siri與小e在實際應用中各有千秋。

 

本文由 @Manta 原創(chuàng)發(fā)布于人人都是產品經理。未經許可,禁止轉載

題圖來自 Unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 作者寫的真好!從實驗對比,分析出小e和Siri之間的反應速度和服務滿意度,得出Siri與小e在實際應用中各有千秋。用戶可以通過這篇文章來了解到這兩者之間的區(qū)別。

    來自湖北 回復
  2. 寫得不錯 ,分析的很透徹,沒有三年經驗寫不出來。

    回復
    1. 謬贊了謬贊了

      回復
  3. 作者通過兩款語音助手的比較,觀點深入淺出,分析層層推進,使我收益頗多。

    來自湖北 回復
    1. ??

      回復
  4. 分析的太好了

    來自湖北 回復
    1. 感謝!

      回復