當融入人工智能時,用戶體驗研究會失去信心嗎?

蔣昌盛
0 評論 1640 瀏覽 3 收藏 17 分鐘

隨著人工智能技術(shù)的快速發(fā)展,用戶體驗(UX)研究領(lǐng)域也迎來了新的挑戰(zhàn)與機遇。本文通過作者親身實踐,探討了AI在用戶體驗研究中的應(yīng)用現(xiàn)狀及其對研究者的影響。

自 2012 年以來,我一直從事用戶體驗 (UX) 領(lǐng)域。

我的大部分工作都是以研究為導(dǎo)向的,這意味著我要站在網(wǎng)站用戶、應(yīng)用程序用戶、設(shè)備用戶的立場上……數(shù)百甚至數(shù)千人。無數(shù)小時的歡笑、沮喪,甚至淚水。

像我這樣的用戶研究人員在整個職業(yè)生涯中,整天、整年地向他人敞開心扉。

用戶研究專業(yè)人員通常在情商測試中得分較高,并且長期以來,在很多行業(yè)中,情商被吹捧為工作成功的重要因素。

而現(xiàn)在……人工智能(AI)是一個閃亮的新事物,它應(yīng)該會讓你在職業(yè)生涯中脫穎而出。

感覺要想取得進步就必須掌握即興寫作技巧

人工智能工具的粉絲們宣稱:“它可以在幾分鐘內(nèi)完成以前需要幾個小時才能完成的工作!”

在過去的幾年里,我聽到行業(yè)播客、網(wǎng)絡(luò)研討會和會議發(fā)言人告訴我們,那些擁抱人工智能并將其融入工作的專業(yè)人士將超越所有老前輩,并迎來一支新的、高度適應(yīng)性強、速度極快的勞動力隊伍。

甚至有供應(yīng)商告訴我,他們已經(jīng)收集了足夠多的真實用戶的數(shù)據(jù),可以預(yù)測他們對未來設(shè)計的反應(yīng)。所以就像……他們在模擬測試參與者,而不是真正招募人類進行研究。

好的。

我想我需要每天練習提示寫作,學習如何向人工智能提出正確的問題,并嘗試識別更多可以求助于它的時機。

我猜測,一個由數(shù)千個數(shù)據(jù)點組成的工具可能能夠發(fā)現(xiàn)一些趨勢,并根據(jù)人類的記憶而不是現(xiàn)實安全地得出結(jié)論。

但有時在用戶研究的背景下使用人工智能感覺就像撕裂自己的心一樣。

“但是 Ki,”我聽到你疑惑道,“你顯然是在使用 AI 為這篇文章制作圖片。所以你滿嘴都是廢話,不是嗎???”

我的答復(fù)是:

  • 首先,你確實需要更新你的俚語。胡說八道?真的嗎?
  • 其次,在 Medium 上寫作并不是用戶研究實踐的必修課,它只是一種愛好,而且……
  • 最后,我非常希望避免成為這樣的人:

這意味著我必須接受有關(guān)人工智能的事情。

我必須反思它在我的工作中融入了哪些方面,并更積極地嘗試如何讓人工智能補充我自己的工作。

我仍然認為自己對這項技術(shù)還很陌生,并且非常不愿意讓人工智能承擔繁重的工作。但我想記錄一些我迄今為止嘗試過的人工智能 + 用戶研究合作,以及我對結(jié)果的看法:

一、撰寫調(diào)查/訪談腳本的初稿

我想?yún)^(qū)分完整的測試計劃和腳本。測試計劃包括研究目標、方法、利益相關(guān)者角色……基本上是與測試相關(guān)的所有內(nèi)容。腳本是測試人員完成項目時要經(jīng)歷的篩選問題、說明和問題。

在攻讀法學碩士之前,我與利益相關(guān)者討論了這個項目,并制定了一套明確的目標和理想的方法。然后我將其插入老式的人工智能機器,并希望獲得最好的結(jié)果。

它實際上相當不錯地開發(fā)了 15 個左右的問題,但對我來說,它們感覺僵硬且正式。

我嘗試告訴它這一點,但它所做的只是道歉。?? 我想,這是一個改進提示寫作的教訓(xùn)。

AI 寫的問題也相當直白,基本上就是重復(fù)我的目標/方法中的詞語,然后將其重新包裝成直接問題。我是轉(zhuǎn)述的,但想想類似這樣的東西:

  • 我:“我們的目標是了解顧客在網(wǎng)上購物時面臨的挑戰(zhàn)”
  • AI:“問題 4(開放式):您在網(wǎng)上購物時面臨哪些挑戰(zhàn)?”

它也沒有包括后續(xù)內(nèi)容或任何分支邏輯。同樣,我可能會提示它做某事,但它開始感覺它很快就浪費了我的時間。

事實上,我花在編寫重塑提示上的時間(然后閱讀更新的版本并尋找更改)比我自己按照自己想要的方式編寫調(diào)查問卷所花的時間要多。

因此對于編寫測試腳本…4/10 星。除非您討厭編寫測試腳本,否則我不會推薦。如果是這樣,您還是研究人員嗎?

二、分析單個會話記錄

我們的研究庫包括逐個會話級別的 AI 分析。我打開一個上傳的視頻,點擊那個花哨的按鈕,他們的 AI 就會突出顯示視頻中它認為相關(guān)的時刻。

理論上是個好主意,但當我開始梳理建議的時刻時,我卻一直搖頭。就好像用戶在抱怨網(wǎng)絡(luò)會議工具,而不是我們正在測試的工具?;蛘咚l(fā)現(xiàn)用戶在轉(zhuǎn)述別人的話,談?wù)撍麄冇卸嘞矚g某樣?xùn)|西。

視頻頂部有一小塊區(qū)域,我可以在其中提出一個問題,平臺會嘗試突出顯示視頻的相關(guān)片段,但我不想一個接一個地輸入我的研究問題,也不想閱讀并接受/拒絕每個建議。

在某些時候,只需閱讀一次整個成績單并標記與我的研究目標相關(guān)的內(nèi)容即可節(jié)省時間。

因此,對于分析單個用戶的單獨會話/數(shù)據(jù)…4/10。如果我可以一次性插入所有研究問題,并且只需對建議的重點內(nèi)容進行一次審核,那么得分可能會更高。

三、分析一批用戶訪談筆記

不久前,我有機會在邁阿密的一家市場研究辦公室進行經(jīng)典的玻璃后觀察測試。

我和其他 4 個人花了 3 天時間做筆記(并喝古巴咖啡)。利益相關(guān)者希望快速獲得結(jié)果,而我正準備去度假。

因此,在回家的航班上,我打開了我們的內(nèi)部 LLM 工具并上傳了我的筆記,看看它是否可以為我總結(jié)一些事情。

令我驚訝和高興的是,這種方法效果非常好——我只覺得需要調(diào)整一兩個要點,并且只需進行極少的重新提示。

在我去 PTO 之前,我在 AI 生成的項目符號旁邊放了幾張截圖,并發(fā)送了電子郵件摘要。

這就是我認為此方法效果更好的原因

  • 當我記筆記時,我已經(jīng)將內(nèi)容翻譯成我們的內(nèi)部語言。用戶不斷忽略特定頁面上的“繼續(xù)”CTA,每次發(fā)生這種情況時,我都會在筆記中以相同的方式引用該問題(“VFT 頁面上的橫幅失明”)。如果它一直在分析記錄,我懷疑人工智能會知道人們卡住的頁面名稱或了解他們卡住的原因。
  • 我的筆記是大綱形式。當用戶從一個主題或網(wǎng)站部分移動到另一個時,我會用主題或頁面名稱指向一個新部分,并跟蹤他們說了什么和做了什么。就其本身而言,我認為人工智能無法很好地分析后者。

因此,使用 AI 分析一批會議記錄8/10!如果你有(或者你是)一個堅持做筆記的人,這可能會為你節(jié)省一些時間來總結(jié)你的采訪或非主持會議中的趨勢。

四、總結(jié)我們多次測試過的關(guān)于某個頁面、術(shù)語或功能的所有信息

再次強調(diào),這個例子來自我們的研究存儲庫工具,它保存了用戶體驗研究、分析、實驗和數(shù)字戰(zhàn)略團隊兩年多來收集的有關(guān)用戶的集體知識。

總會有人更換團隊、加入團隊或者要求我們重述我們所知道的有關(guān)我們網(wǎng)站某些部分的所有信息。

雖然我們的內(nèi)部標簽是提取信息的一種方式,但我們的存儲庫工具還具有 AI 匯總功能,可以讓我們提出這樣的問題:“用戶在嘗試在線構(gòu)建和定價車輛時遇到了什么問題?” 幾秒鐘內(nèi),就會出現(xiàn)一份由 AI 生成的摘要,其中包含指向數(shù)據(jù)和報告的鏈接注釋,以幫助了解情況。

在人工智能之前,這項活動通常需要一個完整的文獻綜述項目,這可能需要數(shù)周時間并且往往有點乏味——如果它被認為足夠優(yōu)先完成的話。

現(xiàn)在人們只需幾分鐘就能掌握最新知識……

…這就是讓我停下來思考的原因。

因為就像我在這篇文章開頭所說的那樣,我們的研究中充滿了豐富的情感時刻。有高潮,也有低谷。

一個故事或 5 分鐘的對話就能讓用戶的痛苦變得生動起來,并點燃相關(guān)利益者的心火。它可以讓他們集中注意力,產(chǎn)生動力,并有能力優(yōu)先考慮對企業(yè)和客戶都有益的事情。

人工智能生成的摘要能夠提供這種啟發(fā)的可能性有多大?

我會給予我的利益相關(guān)者信任,并希望他們不僅僅閱讀人工智能生成的摘要。也許他們會點擊源材料并花一點時間進行了解。

但是,當對人工智能的熱情贊揚與節(jié)省時間有關(guān)時,我不禁擔心我們只是將其用作一種避免與用戶建立真誠聯(lián)系的方式

因此,當談到使用人工智能來總結(jié)我們關(guān)于某個主題的集體知識時,我會給它6.5/10分。

五、人工智能生成的設(shè)計評估

我們的一家供應(yīng)商已經(jīng)對眾多行業(yè)進行了數(shù)千次網(wǎng)頁設(shè)計測試。他們針對每種設(shè)計都提出了標準化的基準測試問題。他們的參與者在這些設(shè)計的關(guān)鍵頁面上標記了喜歡和不喜歡的內(nèi)容,并附上了開放式評論來解釋他們的選擇。

供應(yīng)商利用這些大量數(shù)據(jù)來開發(fā)新產(chǎn)品——你上傳一個設(shè)計或提交一個鏈接,它會預(yù)測用戶可能喜歡或不喜歡該設(shè)計的哪些方面。

它還會產(chǎn)生一些您可能需要考慮的潛在角色(因為我們在汽車領(lǐng)域工作,所以我們的角色是電動汽車購物者、負責接送孩子參加體育賽事的父母、跑車愛好者等)。

這個工具還很新,我并沒有期待太多。但我不得不承認……我對結(jié)果再次感到滿意。

例如,我上傳了一個頁面,在其中一個標題中使用了“badass”一詞,這與我們的樣式指南并不相符。

果然,它突出顯示了使用“badass”的標題,并建議謹慎使用可能顯得非正式和不專業(yè)的語言。

這些人物角色的名字很俗氣,比如“足球媽媽蘇西”(不是真的,只是一個例子),但它們也制作得相當精良。與我們自己使用的目標人群和篩選標準類似。

我對人工智能模擬用戶的概念感到很反感,但無論出于什么原因,這種人工智能應(yīng)用(基于真實的、最近的人類反饋)對我來說感覺沒那么“不對勁”。它更像是一個幽靈或一個人的回聲,而不是真實的東西……但也許它有它的用途。

我謹慎樂觀的部分原因是,我確切地知道他們使用了什么方法,他們捕獲了什么樣的數(shù)據(jù)。成千上萬的人都做過標準化的問題和活動。我在自己的項目中也看到過類似的評論,感覺很真實、很人性化。人工智能由一個清晰而封閉的數(shù)據(jù)源提供數(shù)據(jù)(至少據(jù)我所知)。

我也欣賞他們的建議和警告措辭恰當——他們不是說“用戶會討厭這個東西”;而是說“一些重視 X 的用戶可能會遇到這個東西的問題”。他們提供方向性指導(dǎo)和思想啟蒙,而不是讓設(shè)計師偏離他們已經(jīng)做出的選擇。

雖然我不喜歡我們的設(shè)計師依賴人工智能預(yù)測的想法,但現(xiàn)實情況是:我們團隊的設(shè)計師與研究人員的比例約為 8:1

UXR 團隊沒有能力要求每位設(shè)計師定期進行測試。設(shè)計師在制定強有力的測試目標或自行開展項目的能力方面存在很大差異。在這些情況下,我認為使用這樣的評估工具可以作為對設(shè)計的“直覺檢查” ,一種預(yù)測潛在風險的方法,或許也是一種制定更清晰的研究目標或假設(shè)的方法。

如果在關(guān)鍵時刻我能為設(shè)計師提供的最好的幫助就是人類洞察力的幽靈,我想我會同意的。8.5/ 10。

就像我在開頭所說的,優(yōu)秀用戶研究員的標志之一就是開放。他們自己是開放的,并且鼓勵其他人也保持開放。

作為一名用戶研究員,有很多事情不能也不應(yīng)該由人工智能來完成。(這值得專門寫一篇文章;敬請期待。)

當談到將人工智能分層到用戶研究活動中時,有時我仍然會交叉雙臂并搖頭。

但是現(xiàn)在我已經(jīng)花了一些時間記錄自己的經(jīng)歷,我感覺沒有必要去對著云朵尖叫。

我今年定了一個目標,放松一點,每周花一些時間學習。我已經(jīng)找到了一些視頻和文章,其中有提示、技巧和演示,可以讓我入門并提高技能。

為這篇文章創(chuàng)建圖片是我第一次使用人工智能圖像生成器。盡管有些結(jié)果很不準確,我不得不重寫提示幾次,但我不得不承認:我玩得很開心!

當我看到人工智能侵入用戶研究領(lǐng)域時,我時不時會感到沮喪。但我可以嘗試接受那些有意義且感覺正確的東西?,F(xiàn)在我意識到我甚至可能在這一過程中獲得樂趣。

原作者:Ki Aguero

原文鏈接:https://medium.com/user-experience-design-1/every-ux-research-project-should-start-with-a-plan-edc808305207

譯者:蔣昌盛

本文由 @蔣昌盛 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!