快速合意性測試:用戶情緒測量的方法與案例
快速合意性測試的主要目的在于讓用戶真切的表達,以便設(shè)計團隊更全面真實的了解用戶的情緒反應(yīng)。
譯者心得:做用戶研究時,行為、態(tài)度往往最容易測量,而測量情緒反應(yīng)很難——我們的很多研究方法都依賴于用戶的自我報告,但是人們往往對自己的情緒反應(yīng)缺乏清晰的認知。尤其是對于視覺設(shè)計,如果我們想知道某種視覺風格究竟喚起了用戶怎樣的認知和情緒,直接詢問用戶很難得到可靠的結(jié)果。
本文提供了一種來自微軟的簡單而有效的方法,能夠幫助用戶去探索和表達,也幫助團隊全方位地了解某個設(shè)計方案喚起的情緒反應(yīng)。
以下是原文:
在我們公司所遵循的設(shè)計流程中,一旦我們對一個特定的設(shè)計定義了概念方向和內(nèi)容策略,并通過用戶研究和迭代式可用性測試提煉出設(shè)計方向后,我們就開始進行視覺設(shè)計。一般來說,我們會選擇一個已經(jīng)確定了結(jié)構(gòu)和功能的關(guān)鍵頁面——比如,主頁或者后臺管理頁面(dashboard page)的一種布局——然后探索三種視覺設(shè)計方案。這三種備選方案包括了相同的內(nèi)容,但是反映了對配色和圖象的不同選擇。
這是為了向企業(yè)所有者和關(guān)鍵決策者展示不同的視覺設(shè)計方案以供選擇。有時候關(guān)鍵決策人會有一個清晰的偏好,或者從品牌的角度可以選出最合適的方案。但是,項目團隊成員常常會對應(yīng)該選擇哪個設(shè)計方向有不同意見。如果我們做得夠好,每個不同的設(shè)計方案中會有關(guān)于設(shè)計決策的原理闡述,但是即使如此,團隊成員也可能會對哪種原理闡述最合適產(chǎn)生分歧。
作為以用戶為中心的設(shè)計的實踐者,我們很自然地希望通過用戶研究來幫助指導(dǎo)選擇視覺設(shè)計的過程。但是傳統(tǒng)的可用性測試和相關(guān)的方法看起來并不非常適合評估視覺設(shè)計,理由有二:
- 當我們尋求用戶對視覺設(shè)計選項的反饋時,關(guān)鍵決策人一般會尋求較大樣本——比典型的定性可用性研究更大。
- 我們尋求的用戶反饋更加情感化——也就是說,更少關(guān)注用戶完成任務(wù)的能力,而更多地關(guān)注他們對一個給定設(shè)計的情感反應(yīng)。
考慮到這些,我開始對Christian Rohrer最近在他的博客上提到的合意性測試感到著迷。在其中一篇文章中,Christian認為合意性測試是允許你評估用戶對美學(xué)和視覺吸引力的態(tài)度的一種定性與定量結(jié)合的方法。受到他對這種方法的觀點的啟發(fā),我們深入研究了合意性測試并在我們的一個項目上嘗試了這個方法的調(diào)整版本。
這篇文章回顧了經(jīng)過我們仔細考慮的合意性測試的變體,以及我們在自己的項目上執(zhí)行合意性測試來評估我們的視覺設(shè)計的過程中學(xué)到的東西。
為什么合意性很重要?
從可用性的角度,視覺設(shè)計的重要作用是以我們期望的方式帶領(lǐng)用戶體驗設(shè)計的不同層次。通過元素的數(shù)值對比、顏色、尺寸和布局,可以幫助支持產(chǎn)品底層的信息架構(gòu)和交互設(shè)計。
在設(shè)計過程的早期階段,我們關(guān)注于設(shè)計的這些功能層面,并且通過研究確保整體的解決方案能夠提供一個令用戶感興趣的價值主張。我們也致力于優(yōu)化可用性并且讓用戶能夠很容易地意識到這個方案的好處并且最終完成他們的目標。
有價值的功能,直覺化的信息架構(gòu)以及交互設(shè)計自然會影響產(chǎn)品整體的合意性。但是,功能和易性跟情感和易性不同,后者源于美學(xué)、外觀和感覺。視覺元素可以支持一個交互設(shè)計方案,但是它們也能夠激發(fā)用戶特定的情感反應(yīng)。理解和利用這些情感反應(yīng)可以幫助設(shè)計師適當?shù)赜绊懹脩簟?/p>
有趣的是,Lindegaard及其同伴發(fā)現(xiàn)一個設(shè)計可以非常快速地引發(fā)情感反應(yīng)。在他們的研究報告中,他們列出了自己做的一系列關(guān)于人們從一個視覺設(shè)計中形成觀點需要多長時間的實驗。正如你從題目中可以猜到的,他們發(fā)現(xiàn)設(shè)計可以非??焖俚丶ぐl(fā)情感反應(yīng)——大約相當于讀一個單詞所需要的時間。
這非常重要,因為這種情感反應(yīng)的光暈效應(yīng)會導(dǎo)致,用戶對設(shè)計的第一印象會影響用戶對產(chǎn)品的實用性、可用性和可信度的認知。一般來說,用戶更多地是通過對產(chǎn)品的視覺美學(xué)和圖象的情感反應(yīng)而不是特定功能的交互來形成對產(chǎn)品的第一印象。研究者將這個效應(yīng)判定為積極或者消極。
比如,如果一個用戶對產(chǎn)品的視覺設(shè)計有一個積極的第一印象,他們會更傾向于忽視或者原諒產(chǎn)品不良的可用性和有限的功能。如果對產(chǎn)品有一個消極的第一印象,用戶更可能在交互中找到錯誤,即使產(chǎn)品的整體可用性很好并且產(chǎn)品提供了實際的價值。
這對于很多領(lǐng)域來說都有特殊的意義。比如,在一個電商環(huán)境中,用戶覺得一個網(wǎng)站有多值得信任,會影響用戶的購買決策或者用戶與網(wǎng)站交互的意愿。對交互式應(yīng)用來說,對組織的感覺會影響用戶感知到的可用性并最終影響到用戶對產(chǎn)品的整體滿意度。
那為什么不直接問用戶他們喜歡哪個設(shè)計?
正如前面所說的,在我所在的公司的設(shè)計流程中,我們嘗試著通過用戶反饋和可用性測試迭代式地提高我們的概念方向和交互設(shè)計。
通常來說,在測試過程中,我們要求用戶think-aloud并且詢問用戶解釋他們更喜歡哪種設(shè)計以及理由。對于視覺設(shè)計方案,我們會在可用性測試環(huán)節(jié)結(jié)束后向用戶展示視覺設(shè)計方案并詢問他們更喜歡哪個。這聽起來足夠直接,并且,我們發(fā)現(xiàn)這通常就是關(guān)鍵決策人對收集用戶反饋的想法。
這個簡單方法的問題在于用戶對自己的喜好的解釋不一定會跟設(shè)計的商業(yè)或者品牌目標相關(guān)。比如說,當我以前問這個問題的時候,我會聽到用戶說他們喜歡一個設(shè)計是因為這是他們最喜歡的顏色。他們的描述可能是可信的,但是這些類型的反應(yīng)并不能幫助研究者去評估設(shè)計帶來的情感反應(yīng)或者它與我們期望的品牌屬性的符合程度。
另外,有一些用戶會很難清晰地表達出自己為什么喜歡或者不喜歡一個設(shè)計。在一次訪談中,用戶可能可以選擇一個更喜歡的設(shè)計,但是如果沒有一個結(jié)構(gòu)化的反饋機制,當需要他們描述為什么他們喜歡或者不喜歡時,用戶可能就會遇到困難。
我們也發(fā)現(xiàn)了,當我們在一個定性研究比如可用性測試中詢問用戶對設(shè)計的偏好時,小樣本并不符合關(guān)鍵決策人對驗證一個設(shè)計的期待。尤其是公開的網(wǎng)站或者應(yīng)用,視覺設(shè)計是對公司品牌的最重要的描繪之一,關(guān)鍵決策人和贊助商通常想要大量的用戶反饋以確保設(shè)計方向是正確的。
一些潛在的研究方法
除了簡單地詢問用戶對特定設(shè)計的偏好之外,我們發(fā)現(xiàn)幾種其他的結(jié)構(gòu)化研究方法可以幫助進行設(shè)計選擇,包括:
- 三角比較法(triading)
- 體驗問卷(experience questionnaires)
- 快速曝光記憶測試(experience questionnaires)
- 生理指標測量(measurement of physiological indicators)
三角比較法
在這個問題上,三角比較法提供了一種解決方案,因為它是對不同方案進行對比的結(jié)構(gòu)化的方法。三角比較法的思路是,以不受研究者影響的方式,引出研究參與者和目標用戶可能會用來比較不同方案的一些特性。
給定三個設(shè)計選項,研究員會要求用戶選擇兩個自認為與第三個不同的設(shè)計,并且描述為什么不同。這個過程幫助研究者理解目標用戶比較不同的設(shè)計時什么維度是重要的。這個方法可以用于從交互設(shè)計的視角,評估競爭性的風景畫和不同的概念選項。但是,這個方法很難用于大樣本研究,并且很難向想要知道怎么做出最佳設(shè)計選擇的關(guān)鍵決策人展示出圖表化的結(jié)果。
體驗問卷
另一種可能的方法是通過綜合的體驗問卷來評估設(shè)計方案。像SUS、QUIS和WAMMI這些廣泛的、基于體驗的問卷,會包含有關(guān)視覺吸引力和美學(xué)的問題。在可用性專家協(xié)會(Usability Professionals’ Association)2014年的報告中,Tom Tullis 和Jacqueline Stetson寫了一個比較這些問卷的有效性的研究。他們發(fā)現(xiàn),所有這些問卷都能夠可信地評估不同網(wǎng)站之間的差別,只是程度不同。
問卷具有的比較不同設(shè)計方案在用戶認知中的差異的能力令人感興趣。這些問卷相對來說比較直接并且容易在大規(guī)模樣本中實施。但是很多問卷也包含了大量關(guān)于交互的問題并且要求參與者與產(chǎn)品已經(jīng)有了一定水平的交互。如果要對靜態(tài)的視覺方案進行快速對比,這些問題就不太合適了。另外,我們不止想要在這些設(shè)計中找到勝出者,我們也想知道每一個方案激發(fā)了怎樣的情感反應(yīng),我們才能繼續(xù)優(yōu)化好的設(shè)計。這些問卷的結(jié)果并不能滿足這個要求。
快速曝光記憶測試
我們看到的第三種方法是快速曝光記憶測試。在這個方法中,研究者向參與者在很短時間內(nèi)展示一個用戶界面,然后就將其拿開。然后,他們要求參與者從剛才簡短的曝光中回憶出他們能記得的關(guān)于用戶界面的信息。參與者與產(chǎn)品之間的交互有限,所以理論上,他們能夠讓你窺探到他們的第一印象——有什么東西還保留在他們的記憶里。在可用性測試中,我們曾經(jīng)嘗試過用這種方法激發(fā)對主頁和其他開始頁面的討論,這個方法對于評估布局考量和信息設(shè)計很有幫助。
有一個叫做fivesecondtest的在線服務(wù),可以幫助你在相對短的時間內(nèi)收集反饋,并且有還不錯的樣本量——也就是50個參與者。我們不選擇這個服務(wù)作為我們的視覺設(shè)計對比研究的首選方法,因為我們認為這個方法太過于關(guān)注人們對特定項目的記憶,而不是情感反饋,但是如果只有少量的預(yù)算和精力,這個方法在某些情況下會是有用的。
生理指標測量
最后,在尋找合意性測試的潛在方法的過程中,我們評估了關(guān)于能夠用來評估情感反應(yīng)的生理指標的大量知識。在一篇文章評估網(wǎng)頁設(shè)計的多種方法中,Westerman和其他作者總結(jié)了一些可用方法:
- 腦電圖 (EEG)測量了大腦部分區(qū)域的活動,這些區(qū)域可以與特定的情緒反應(yīng)聯(lián)系起來。
- 肌電圖(EMG)測量了與興奮水平相關(guān)的肌肉反應(yīng)。
- 皮膚電活動 (EDA)測量了汗腺的活動,汗腺活動據(jù)說與喚起和興奮水平有關(guān)。
- 血液容量和血壓(BVP)測量了血管的擴張,這跟喚起程度有關(guān)。
- 瞳孔擴張與喚起水平和心理工作負荷相關(guān)。
- 呼吸作用測量可以指示負化合價或者喚起水平。
與眼動追蹤類似,在這些研究中,當研究者向參與者展示設(shè)計方案的時候,多種感應(yīng)器會追蹤這些生理指標。一種或者多種指標的改變反映了某種特定情緒反應(yīng)。研究者通常將這些測量和自我報告的態(tài)度問卷結(jié)合起來,以對參與者對設(shè)計的情感反應(yīng)獲得多角度的了解。這種對情緒反應(yīng)進行定量測量的生理學(xué)方法非常好。但是,因為我們很多項目的時間和預(yù)算限制,我們尋找的是能夠在實驗室之外甚至在互聯(lián)網(wǎng)上使用的方法,這樣才能獲得大樣本的反饋。
我們選擇的評估視覺設(shè)計合意性的方法
對所有我們考慮過的方法,最適合我們的目標的是微軟的Joey Benedek和Trish Miner在他們的文章測量合意性:在可用性實驗室環(huán)境中評估合意性的新方法中描述的方法。
與一個多學(xué)科團隊一起合作,Benedek和Miner發(fā)展出了一套研究參與者可以用來描述他們對一個用戶界面的情感反應(yīng)的形容詞。他們把所有形容詞(如下圖)放在可以與參與者交互的產(chǎn)品反應(yīng)卡中。但是重要的部分是他們開發(fā)了一組術(shù)語,作為用戶界面的潛在的描述詞并且對于他們的研究來說可能較突出。這些形容詞代表了人們可能覺得積極或者消極的描述的組合。他們會向參與者展示一個用戶界面,然后要求他們從這個列表中選擇3-5個自認為最能描述這個界面的詞語。
通過分析參與者的結(jié)果數(shù)據(jù),研究者可以將特定的形容詞和每個視覺設(shè)計方案結(jié)合起來,并且評估哪個方案與企業(yè)試圖喚起的情感反應(yīng)和品牌屬性更加符合。研究者可以在一對一的情境中或者問卷調(diào)查中使用這個方法。一對一的方法的好處是研究者可以詢問用戶為什么選擇特定的形容詞,這個過程可能會發(fā)現(xiàn)一些額外的洞見。
很明顯,如果使用問卷調(diào)查的方法,研究者會錯失一對一研究中的定性層面,但是他們可以收集到更大樣本量的反饋。不管哪種方式,這個研究的結(jié)構(gòu)化會讓數(shù)據(jù)分析變得相對簡單。另外,向關(guān)鍵決策人報告參與者對每個視覺設(shè)計最頻繁選擇的形容詞,會非常有力并且容易理解。
我們的經(jīng)驗
我們在最近的一個項目中嘗試使用這個方法進行合意性測試,看看它是否能夠幫助我們提煉出我們的公開網(wǎng)站的視覺設(shè)計方向。一旦在我們的整體設(shè)計流程中到達了已經(jīng)確定了內(nèi)容、通知和信息架構(gòu)的時候,我們就開始設(shè)計網(wǎng)站的多種視覺概念。
這個網(wǎng)站的目標是說服客戶注冊一個能夠在現(xiàn)金支付的醫(yī)療費用中為用戶提供優(yōu)惠的折扣健康計劃。我們設(shè)計網(wǎng)站和情緒影響的目標如下:
- 我們想要描繪出一個專業(yè)的和值得信賴的形象,戰(zhàn)勝客戶可能有的任何反對,如果他們對品牌不太熟悉的話。
- 我們不想讓顯得花哨和過度推銷的網(wǎng)站嚇跑顧客。
- 我們想要設(shè)計一個能夠讓潛在顧客覺得友好和親切的網(wǎng)站。
- 由于健康護理開支的敏感性,我們希望訪客對網(wǎng)站感到舒適,并且讓設(shè)計富于同理心。
有了這些目標,我們設(shè)計了兩種備選視覺方案。在第一種方案中,如下圖1,我們使用干凈的邊緣和大膽的顏色,為了讓網(wǎng)站看上去更加保守和穩(wěn)定。我們的假設(shè)是訪客可以在這個網(wǎng)站和其他他們很熟悉的知名品牌之間找到相似點。這會讓他們對這個網(wǎng)站產(chǎn)生信任感。在下圖2顯示的第二種方案中,我們選擇了更加柔和和溫暖的配色,使用圓角和歡迎圖片讓這個網(wǎng)站看上去更加友好。
方案1
方案2
為了測試哪種方案最符合我們的既定目標,我們使用產(chǎn)品反應(yīng)卡做了一場合意性測試。在對早期的用戶研究進行評估之后,我們從完整的微軟卡片列表開始,選擇了那些我們認為對這個品牌來說重要的形容詞。我們將最終的形容詞列表減少到只有60個,但是按照Benedek和Miner的建議保持積極詞匯和消極詞匯比例為6:4。
我們通過問卷調(diào)查執(zhí)行了這個研究,將參與者分為三組。
- 第一組我們只展示方案1,要求他們從列表中選擇自認為最能夠描述這個設(shè)計的五個形容詞。
- 第二組只展示方案2,其他要求相同。因為設(shè)計是靜態(tài)截圖,參與者不能夠與其中任何一個進行交互。
- 我們對第三組展示了兩個設(shè)計方案——對展示的順序進行隨機以減少順序偏差——然后詢問參與者他們最喜歡哪個。
我們假設(shè)對第三組的數(shù)據(jù)分析會比較難,但是委托方非常熱衷于詢問這個簡單的偏好問題,所以我們這么做了。最終,我們讓所有參與者有機會通過評論給出他們選擇的形容詞或者偏好的理由。通過我們的研究,我們在三個組中分別收集了50個人的反應(yīng)數(shù)據(jù)。
正如我們預(yù)期的,第三組的結(jié)果比較不確定。這一組的參與者在偏好上分布均勻并且他們對自己選擇的解釋也非常廣泛。但是,另外兩個從列表中選擇詞匯的組的數(shù)據(jù)表非常有用。我們找出了參與者最常選擇的形容詞,并且計算每個設(shè)計中積極詞匯和消極詞匯的總數(shù)。
與我們在做這個研究之前的假設(shè)相反,參與者認為第一個設(shè)計易理解和清晰,但也覺得它是枯燥的、復(fù)雜的、沒有人情味的。我們試圖喚起的信任感并沒有在這個設(shè)計中被選擇。
正如我們預(yù)料的,參與者認為第二個設(shè)計是親切的、友好的,但是令人驚訝的是,他們也認為這是專業(yè)的和可信賴的。很明顯,所有這些形容詞都符合我們期待的情感反應(yīng)。另外,第二個設(shè)計相比第一個獲得了明顯更多的積極評價。
相比于那個簡單的問題“你更喜歡哪個設(shè)計”,我們對于產(chǎn)品形容詞的調(diào)查在幫助我們對設(shè)計決策達成一致時表現(xiàn)更好?;谖覀兊难芯堪l(fā)現(xiàn)和對參與者評論的總結(jié),我們在設(shè)計師和關(guān)鍵決策人之間達成了一致,選擇第二個方案作為設(shè)計改進的起點。最好的是,當項目團隊之外的人因為自己喜歡其他風格而質(zhì)疑設(shè)計元素的合理性時,我們可以提供一個基于研究的解釋,可以最小化個人偏好的差異并且?guī)椭覀兏玫赝瓿身椖俊?/p>
我們最終的設(shè)計
結(jié)論
測量人們對不同設(shè)計方案的情感反應(yīng)然后選擇最佳方案的想法常常令人畏懼。每個人都有不同的觀點,而從簡單偏好的大量數(shù)據(jù)中艱難前行,也往往事與愿違。再加上,測量人們對一個設(shè)計的情感反應(yīng)的研究本質(zhì)上是很復(fù)雜的。
人們對一個視覺設(shè)計的體驗是多面的,并且很多不同的設(shè)計層面都會影響他們對產(chǎn)品的反應(yīng)。對生理反應(yīng)的測量通過測量人對產(chǎn)品的整體情感反應(yīng),相對比較客觀,但是并不是所有人都能夠有實驗室和測量設(shè)備。
我所描述的合意性研究中的設(shè)計-形容詞方法既容易執(zhí)行,又能夠幫助我們抽離出視覺設(shè)計的情感反應(yīng)。我的公司至今已經(jīng)使用這個方法很多次,我們?yōu)榻Y(jié)果所提供的清晰見解感到開心。
我們的合意性研究不止能夠幫助我們選擇設(shè)計方向,而且我們從中獲得的洞見也挑戰(zhàn)了我們作為設(shè)計師的假設(shè)并且讓我們更好地修正我們選擇的設(shè)計方向。
把合意性測試加入到你的研究工具箱中。然后,如果下次項目的高級主管說“改成紫色——我女兒最喜歡這個顏色”,合意性測試也許能夠拯救你!
翻譯:cyan_zheng
原文地址:http://www.uxmatters.com/mt/archives/2010/02/rapid-desirability-testing-a-case-study.php
本文由 @cyan_zheng 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
- 目前還沒評論,等你發(fā)揮!