語音助手大比拼:蘋果Siri和華為小e
編輯導(dǎo)讀:每一部智能機(jī)里面都有一款語音助手,它的作用是讓人們生活更加便利,“解放人”。本文將以蘋果Siri和華為小e為例,對這兩個語音助手進(jìn)行比較分析,希望對你有幫助。
一、引言
現(xiàn)如今,智能設(shè)備的普及讓“人工智能”這個話題變得不再陌生而遙遠(yuǎn)。
以前人們想訂購車票一定要到車站去購買;后來有了互聯(lián)網(wǎng),人們可以在網(wǎng)站上自行查詢車票信息并購買,省去了去車站的時間,在家即可完成;再后來出現(xiàn)了語音助手,人們甚至可以通過語音助手查詢車票信息,省去了自己搜索查找的時間,說出想要了解的信息即可。
隨著科技的發(fā)展,人們的生活變得越來越便捷,而人工智能似乎一直致力于“解放人”。
用戶與智能設(shè)備的交互不再局限于鍵盤、鼠標(biāo)之類的硬件,觸控交互、語音交互已經(jīng)成為了當(dāng)代人機(jī)交互的主流方式,用戶的操作也變得越來越便捷與直接。在技術(shù)欠缺的年代里,人們注重更多的是功能的實現(xiàn),而在技術(shù)成熟的現(xiàn)在,人們注重更多的是如何“解放人”以及提升用戶的情感體驗。
自蘋果推出語音助手“Siri”后,各大智能企業(yè)也都相繼推出了自己的語音助手,它們不局限于手機(jī)這個載體,電腦、手表、家電等智能設(shè)備都可以通過語音助手進(jìn)行操作。
正因如此,語音助手的泛濫給用戶帶來了許多困惑,這也是我想做這個課題的起因。希望通過此次實驗,能夠以蘋果智能語音助手Siri和華為語音助手小e為例,對這兩個語音助手進(jìn)行操作比較評估,從而進(jìn)行區(qū)分。
此次實驗主要針對手機(jī)平臺,觀察不同語音助手對同一用戶指令的完成情況。實驗選取了iPhone X及華為P20作為實驗體,并尋找了6名實驗對象。實驗對象需做兩組重復(fù)試驗,每次實驗都將對Siri、小e說出同樣的語音指令,觀察其反饋情況。若未能達(dá)到指令預(yù)期效果,則根據(jù)自身需要繼續(xù)補充,與語音助手進(jìn)行交流,直到達(dá)到預(yù)期目的為止。記錄語音助手完成此任務(wù)的耗時,以及用戶滿意度。
通過此次試驗,可以直觀地看出Siri和小e在處理同一指令時的反饋。語音交互的功能覆蓋面雖然依舊不是很廣,但用戶體驗卻是其中至關(guān)重要的考量因素。交互時的任務(wù)完成度、耗時等都將影響用戶體驗。在測試結(jié)束后,讓每位測試用戶做問卷調(diào)查,希望能通過數(shù)據(jù)分析,對Siri及小e有初步的實用性比較評估。
圖1 手機(jī)語音助手
通過實驗數(shù)據(jù)可知,Siri執(zhí)行語音指令時的操作總耗時平均14.81秒,小e執(zhí)行語音指令時的操作總耗時平均25.18秒。Siri在操作耗時上整體比小e短,即能更快的對語音進(jìn)行轉(zhuǎn)譯并給出反饋。
而通過實驗測試后的調(diào)查問卷,我們可以發(fā)現(xiàn)Siri與小e的用戶滿意度相近。但小e在服務(wù)質(zhì)量方面更勝一籌,相較于Siri它能給用戶更多的引導(dǎo)提示,這對不了解語音助手功能的用戶而言更加友好。
只依靠操作耗時、用戶滿意度這兩個實驗數(shù)據(jù)我們無法斷言Siri與小e哪個在性能上更好,但這可以作為評估語音助手實用性的一種參考。單從操作耗時的角度上看,Siri明顯優(yōu)于小e;單從用戶滿意度的角度上看,小e尤其在服務(wù)質(zhì)量上要優(yōu)于Siri。
二、實驗設(shè)計
2.1 實驗假設(shè)
蘋果智能語音助手Siri發(fā)布于2016年6月13日,開辟了手機(jī)端中語音交互的先河,因此在技術(shù)層面上可能較華為語音助手小e更為成熟。對于同一語音指令,兩者應(yīng)該都能做到準(zhǔn)確無誤的文字轉(zhuǎn)譯,但在操作耗時上Siri可能還是要領(lǐng)先于小e。同時,蘋果公司一直致力于用戶體驗研究,因此在用戶滿意度方面,Siri可能也會優(yōu)于小e。
2.2 實驗內(nèi)容
現(xiàn)在的語音助手對于涉及基本功能的常規(guī)問題都能做到完美應(yīng)答,因此在設(shè)計實驗時更應(yīng)該考慮到日常生活的需要。
此次實驗內(nèi)容旨在通過考查Siri與小e對同一語音指令的完成情況來評估兩者的實用性。實驗對象需分別對Siri和小e說出同一指令,并與其進(jìn)行后續(xù)的人機(jī)交流,直至完成指令任務(wù),記錄耗時。在用戶試驗測試完后讓其填寫調(diào)查問卷,用戶滿意度可根據(jù)實驗對象的調(diào)查問卷結(jié)果分析得出。
2.3 實驗的設(shè)備及環(huán)境
本實驗對環(huán)境沒有要求,為防止不同手機(jī)對實驗結(jié)果的影響,選取一部iPhoneX與一部華為P20作為固定的實驗設(shè)備。
圖2 蘋果智能語音助手Siri與華為小e產(chǎn)品界面比較
2.4 用戶
實驗對象一:
年齡:21 性別:女 專業(yè)背景:大學(xué)工科在讀
選擇理由:該實驗對象有5年蘋果產(chǎn)品的使用經(jīng)驗,現(xiàn)正在使用iPhoneX,對蘋果iOS操作系統(tǒng)十分熟悉,而對安卓系統(tǒng)并不熟悉,并且從未使用過華為手機(jī)。由于平時所學(xué)專業(yè)的原因,對電子產(chǎn)品及其語音助手功能十分了解,因此,對Siri有基本認(rèn)識,但對小e不曾了解。
實驗對象二:
年齡:20 性別:女 專業(yè)背景:大專在讀
選擇理由:該實驗對象有6年安卓產(chǎn)品的使用經(jīng)驗,現(xiàn)正在使用華為P20,對安卓操作系統(tǒng)十分熟悉,而對蘋果iOS系統(tǒng)并不熟悉。由于平時所學(xué)專業(yè)的原因,對電子產(chǎn)品及其語音助手功能十分了解,因此,對小e有基本認(rèn)識,但未曾使用過Siri。
實驗對象三:
年齡:25 性別:男 專業(yè)背景:互聯(lián)網(wǎng)從業(yè)者
選擇理由:該實驗對象有6年安卓產(chǎn)品的使用經(jīng)驗,現(xiàn)正在使用華為P20 pro,對安卓操作系統(tǒng)十分熟悉。雖在此前該實驗對象對華為的語音助手功能并不了解,也從未使用過小e,但由于個人愛好的原因,對電子產(chǎn)品及其他語音助手有一定了解基礎(chǔ)。
實驗對象四:
年齡:23 性別:女 專業(yè)背景:普通從業(yè)者
選擇理由:該實驗對象有5年安卓產(chǎn)品的使用經(jīng)驗,現(xiàn)正在使用華為。因為自身原因,平時對電子產(chǎn)品使用不多,屬于智能設(shè)備小白,因此從未使用過任何智能設(shè)備中的語音助手功能。
實驗對象五:
年齡:55 性別:女 專業(yè)背景:家庭主婦
選擇理由:該實驗對象有多年安卓產(chǎn)品的使用經(jīng)驗,現(xiàn)正在使用華為。對智能電子設(shè)備的使用頻率較低,且對語音助手沒有任何了解。因此對其的實驗調(diào)查更能體現(xiàn)出語音助手是否真的便捷了用戶的操作。
實驗對象六:
年齡:35 性別:男 專業(yè)背景:研究交互方面的大學(xué)老師
選擇理由:該實驗對象常年做有關(guān)人機(jī)交互的學(xué)術(shù)研究,且在海外留學(xué)多年,在這方面有足夠深的造詣,清楚地了解語音助手背后的工作機(jī)理。作為語音助手人工智能等方面的高學(xué)歷用戶具有一定代表性,可與其他其他普通用戶進(jìn)行對比。
2.5 實驗任務(wù)
實驗名稱:蘋果智能語音助手Siri與華為語音助手小e的實用性評估
實驗對象:6人
實驗設(shè)備:一臺iPhoneX、一臺華為P20
控制條件:因為本實驗對環(huán)境等外界要求不高,因此在這方面不做控制。實驗中取一部固定的iPhoneX作為Siri的實驗設(shè)備,一部固定的華為P20作為小e的實驗設(shè)備。
實驗步驟:
- 提前喚醒語音助手;
- 實驗對象大聲、連貫地念出一條指定好的語音指令;
- 語音助手將該語音指令轉(zhuǎn)譯為文字顯示,并執(zhí)行回復(fù)操作;
- 若操作未達(dá)到實驗預(yù)期效果,則讓實驗對象根據(jù)自身需求念出補充的語音指令,重復(fù)上述操作直至達(dá)到預(yù)期效果;
- 記錄操作耗時,并讓用戶填寫調(diào)查問卷。
分組實驗指令:
- “給媽媽發(fā)微信祝她生日快樂”;
- “發(fā)短信給媽媽說記得提醒我明天下午兩點去小劇場彩排節(jié)目”;
調(diào)查問卷:
- 您的性別
- 您的年齡
- 您的學(xué)歷
- 在使用語音助手時是否出現(xiàn)卡頓、閃退、打不開等現(xiàn)象
- 使用的語音助手界面是否直觀清晰,界面交互風(fēng)格是否舒適
- 是否簡單上手、容易學(xué)會
- 我使用的語音助手是否能準(zhǔn)確識別出我所說的話(包括普通話、方言、長句子等)
- 我所使用的語音助手閑聊持續(xù)久、聲音自然,能“像人”一樣交流
- 我所使用的語音助手為用戶提供操作指引,如“試試對我說……”
- 我所使用的語音助手能在交流過程讓我感到有趣,娛樂
2.6 實驗的過程
由于實驗設(shè)備固定,所以實驗對象無法同時進(jìn)行實驗,必須按次序進(jìn)行。同時,又因為有些語音指令無法一步完成,需要與語音助手進(jìn)行后續(xù)的交流,所以不能同時開啟兩個語音助手進(jìn)行實驗。
由此,需要每個實驗對象依次進(jìn)行實驗,在了解要執(zhí)行的語音指令后,先對Siri(或小e)進(jìn)行測試,再對另一語音助手進(jìn)行測試。如此,算完成一組實驗測試。實驗共準(zhǔn)備了兩個問題,所以實驗對象需重復(fù)以上動作完成兩組測試。
在測試過程中,主要需要記錄實驗對象開始說出指令時,便在一旁用手機(jī)計時器進(jìn)行計時。若語音助手能順利完成任務(wù),則在給出準(zhǔn)確反饋時結(jié)束計時。
兩組測試完成后需要讓實驗對象填寫一份問卷調(diào)查,實驗對象需針對每個問題給出相應(yīng)的分?jǐn)?shù)(10分制),最后進(jìn)行數(shù)據(jù)分析,得出該實驗對象對兩款語音助手服務(wù)質(zhì)量、產(chǎn)品質(zhì)量、內(nèi)容質(zhì)量,以及整體使用滿意度的分析結(jié)果。
三、實驗結(jié)果
此次實驗中的主要測試數(shù)據(jù)為實驗對象使用兩款語音助手執(zhí)行語音指令時的操作耗時,以及用戶在測試完兩組語音指令后對該兩款語音助手用戶滿意度進(jìn)行反饋的調(diào)查問卷。
第1組:“給媽媽發(fā)微信祝她生日快樂”
從實驗對象說出語音指令時開始計時,直至達(dá)到預(yù)期效果,語音助手給出最后反饋結(jié)束計時,得出兩款語音助手在面對本指令時的操作耗時,數(shù)據(jù)如下圖所示:
圖3 Siri與小e在執(zhí)行指令1時的耗時比較
從上圖所示的圖表中我們可知:Siri的平均操作耗時為11.758秒,華為的平均操作耗時為30.302秒,在操作耗時方面Siri要明顯優(yōu)于小e。Siri的標(biāo)準(zhǔn)誤差為0.555,小e的標(biāo)準(zhǔn)誤差為2.075,相較于小e,Siri顯然要更穩(wěn)定一些,對不同用戶的語音都能進(jìn)行準(zhǔn)確轉(zhuǎn)譯與反饋,因此操作耗時相差無幾;而小e的操作耗時受不同用戶的影響更大,數(shù)據(jù)起伏大。
將該組實驗數(shù)據(jù)進(jìn)行單因素方差分析,可得p值為6.01E-06,因為p<0.05,可知本次實驗中,不同的語音助手在操作耗時方面有極大的區(qū)別,數(shù)據(jù)如下表所示:
圖4 Siri與小e在執(zhí)行指令1時的單因素分析表
第2組:“發(fā)短信給媽媽說記得提醒我明天下午兩點去小劇場彩排節(jié)目”
從實驗對象說出語音指令時開始計時,直至達(dá)到預(yù)期效果,語音助手給出最后反饋結(jié)束計時,得出兩款語音助手在面對本指令時的操作耗時,數(shù)據(jù)如下圖所示:
圖5 Siri與小e在執(zhí)行指令2時的耗時比較
從上圖所示的圖表中我們可知:Siri的平均操作耗時為17.862秒,華為的平均操作耗時為20.055秒,在操作耗時方面兩者相近。Siri的標(biāo)準(zhǔn)誤差為1.253,小e的標(biāo)準(zhǔn)誤差為0.686,相較于Siri,小e要略穩(wěn)定一些。兩者的操作數(shù)據(jù)在此次試驗中受用戶的影響都較小,數(shù)據(jù)平穩(wěn)。
將該組實驗數(shù)據(jù)進(jìn)行單因素方差分析,可得p值為0.156,因為p>0.05,可知本次實驗中,不同的語音助手在操作耗時方面的區(qū)別不是很大,數(shù)據(jù)如下表所示:
圖6 Siri與小e在執(zhí)行指令2時的單因素分析表
用戶滿意度:
在實驗對象結(jié)束兩組實驗后,對其進(jìn)行問卷調(diào)查,調(diào)查問卷中的問題設(shè)置如前文所示。
調(diào)查問卷主要研究三個方面:產(chǎn)品質(zhì)量、內(nèi)容質(zhì)量、服務(wù)質(zhì)量。產(chǎn)品質(zhì)量指該語音助手在運行時是否卡頓、界面設(shè)計是否舒適;內(nèi)容質(zhì)量指該語音助手在語音轉(zhuǎn)譯時是否正確,能否準(zhǔn)確識別方言等;服務(wù)質(zhì)量指該語音助手是否對用戶進(jìn)行適當(dāng)引導(dǎo),在用戶提問出錯時對其進(jìn)行類似“你可以試試對我說…”的引導(dǎo)性提問。
最終數(shù)據(jù)結(jié)果如下圖所示:
圖7 Siri與小e在執(zhí)行指令2時的單因素分析表
由上圖可知,Siri與小e在用戶滿意度上的區(qū)別并不是很大,在內(nèi)容質(zhì)量上兩者幾乎沒有差別,即Siri和小e的文字轉(zhuǎn)譯正確率都接近100%。
在產(chǎn)品質(zhì)量上小e略高于Siri,而在服務(wù)質(zhì)量上小e以較明顯的優(yōu)勢壓過Siri。大部分測試對象都反饋小e在用戶引導(dǎo)上有更好的設(shè)置處理,使得從未使用過語音助手的小白也能輕松上手,從而真正達(dá)到語音助手便捷用戶這個目的。且小e的操作可修改性較高,對于用戶的實際操作會根據(jù)需要拆分成幾個步驟,而Siri則是一步到位,若要修改必須從頭再來。
四、結(jié)論
通過此次“蘋果智能語音助手Siri與華為語音助手小e的實用性比較評估”實驗,我們可以得出以下結(jié)論:
Siri執(zhí)行語音指令的操作總耗時平均14.81秒,小e執(zhí)行語音指令的操作總耗時平均25.18秒。Siri在操作耗時上整體比小e短,即能更快的對語音進(jìn)行轉(zhuǎn)譯并給出反饋。
而通過實驗測試后的調(diào)查問卷,我們可以發(fā)現(xiàn)Siri與小e的用戶滿意度相近。但小e在服務(wù)質(zhì)量方面更勝一籌,相較于Siri它能給用戶更多的引導(dǎo)提示,這對不了解語音助手功能的用戶而言更加友好。
只依靠操作耗時、用戶滿意度這兩個實驗數(shù)據(jù)我們無法斷言Siri與小e哪個在性能上更好,但這可以作為評估語音助手實用性的一種參考。單從操作耗時的角度上看,Siri明顯優(yōu)于小e;單從用戶滿意度的角度上看,小e尤其在服務(wù)質(zhì)量上要優(yōu)于Siri。
預(yù)期的實驗結(jié)果是Siri無論在操作耗時還是用戶滿意度方面都應(yīng)領(lǐng)先于小e,而這與實驗的實際結(jié)果是不符的。操作耗時上確實是蘋果更勝一籌,但用戶滿意度兩者并沒有明顯差別,且小e在服務(wù)質(zhì)量方面甚至要優(yōu)于Siri。因此我們看出,Siri與小e在實際應(yīng)用中各有千秋。
本文由 @Manta 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于CC0協(xié)議
作者寫的真好!從實驗對比,分析出小e和Siri之間的反應(yīng)速度和服務(wù)滿意度,得出Siri與小e在實際應(yīng)用中各有千秋。用戶可以通過這篇文章來了解到這兩者之間的區(qū)別。
寫得不錯 ,分析的很透徹,沒有三年經(jīng)驗寫不出來。
謬贊了謬贊了
作者通過兩款語音助手的比較,觀點深入淺出,分析層層推進(jìn),使我收益頗多。
??
分析的太好了
感謝!