AI搜索產(chǎn)品發(fā)展重點和體驗評價體系
本文將深入探討AI搜索與傳統(tǒng)搜索的差異、AI搜索產(chǎn)品的競爭策略,以及AI搜索產(chǎn)品在短中長期的能力規(guī)劃和體驗評價體系,帶你一窺AI搜索產(chǎn)品的未來發(fā)展趨勢。
無論是AI搜索還是傳統(tǒng)搜索都是解決用戶的需求,傳統(tǒng)搜索只能解決需求過程的一部分,但其實也在為幫助用戶完整的解決問題而努力,像一些簡單的任務(wù),查個股價、找個網(wǎng)站其實傳統(tǒng)搜索產(chǎn)品已經(jīng)可以很好的滿足了,+AI之后這些任務(wù)的體驗其實并沒有提升,所以在討論+AI之后搜索產(chǎn)品的變化的時候,要先明確+AI更多的是為之前那些無法被直接快速完成的復(fù)雜任務(wù)做出新的解決方案。
復(fù)雜的任務(wù)可以是找到一個復(fù)雜問題的答案、可以是得到一張要放在PPT里的圖片,在面對這些復(fù)雜問題時,交互體驗提升和服務(wù)范圍延展將是兩方面重點。
交互體驗提升是說用戶可以用更自由的方式與搜索產(chǎn)品互動,以前只能打字,現(xiàn)在可以是不同媒體類型、不同模態(tài)通道,服務(wù)范圍延展是說以前我需要通過搜索產(chǎn)品找到一張圖片,下載之后再用電腦上的PS工具處理細(xì)節(jié)、調(diào)整大小才能放到PPT,現(xiàn)在不需要了,用戶可以在圖片搜索結(jié)果中直接使用變清晰、摳圖、調(diào)整尺寸等等能力,不需要再像以前一樣在多個工具里輾轉(zhuǎn)。
就像今天的會議,是先坐地鐵再倒公交最后掃了個共享單車才到會場,還是專車直達(dá),兩種體驗自然區(qū)別很大。
而越復(fù)雜的需求在解決過程中的體驗給用戶的印象會越深,就像在公司內(nèi)部,能解決越復(fù)雜困難的問題的員工會得到更好的評價,這決定了這家公司是否繼續(xù)聘請這名員工(用戶是否選擇使用某款產(chǎn)品)
一、用戶如何選擇AI搜索產(chǎn)品
人類在選擇工具時會有一些規(guī)律,手機可以錄音,但一個高頻率做采訪的朋友大概率會使用錄音筆,大模型可以回答兩個數(shù)字的計算答案,但用戶更傾向使用計算機,用戶在選擇工具時會根據(jù)已形成的用戶心智來選擇產(chǎn)品。
用戶心智的含義可以理解為用戶認(rèn)為面對某一問題時應(yīng)該選擇哪款產(chǎn)品來解決。
那么對于AI搜索產(chǎn)品來說,決定用戶決策結(jié)果的因素是什么呢?我認(rèn)為是一站式服務(wù),即能讓用戶在更沉浸的狀態(tài)中完整的完成任務(wù)。
這里的完成任務(wù)和傳統(tǒng)軟件中的完成任務(wù)區(qū)別較大,傳統(tǒng)軟件即使找到對業(yè)務(wù)非常熟悉的產(chǎn)品經(jīng)理,依然是把實際業(yè)務(wù)中核心的、高頻的需求做了數(shù)字化,就像現(xiàn)在很多ToB產(chǎn)品,客戶經(jīng)常要求做一些定制化的功能。這些定制化的就是某特定用戶需要的但不高頻的功能。如果提供一個標(biāo)準(zhǔn)化的SaaS產(chǎn)品這些需求就沒有辦法被滿足,回到剛剛說的,就是任務(wù)無法完成。
而在今天大模型的能力恰巧能滿足這些個性化的需求,包括在傳統(tǒng)搜索產(chǎn)品中很多長尾小眾的問題沒有搜不到答案一樣,大模型也可以解決這部分問題。
剛剛我提到的是能讓用戶在更沉浸的狀態(tài)中完整的完成任務(wù)。這句話還有一個重點是在沉浸的狀態(tài)中,沉浸的含義是不需要用戶在多個產(chǎn)品中切換。
對比幾個頭部的AI搜索產(chǎn)品,我們其實會發(fā)現(xiàn)功能范圍非常趨同,無非是圖文音視頻理解、總結(jié)與生成。這樣就會有一個非?,F(xiàn)實的問題,當(dāng)用戶面對總結(jié)一份文檔的需求時,是會選擇夸克這樣的AI搜索產(chǎn)品還是WPS這樣的文檔處理類產(chǎn)品(WPS+AI也有相同的功能)。用戶面對這兩塊產(chǎn)品時做出的選擇決策,就是由用戶過去形成的心智模型決定的。
因此,我認(rèn)為在現(xiàn)階段各個AI搜索產(chǎn)品的競爭過程中,搶占用戶心智將是重中之重,因為各個產(chǎn)品(不限于AI搜索產(chǎn)品)具備的AI能力是沒有很大差別的。在用戶體驗上也只能從較為表層的地方產(chǎn)生一些小優(yōu)勢。不會成為競爭的決定性因素。
今天在高鐵站候車時偶然看到了豆包的廣告,說是很多教英語的老師在建議學(xué)生使用豆包練習(xí)口語,昨天孫老師也提到現(xiàn)在很多用戶在用豆包寫公文。
這兩件事啟發(fā)了我,建立用戶心智的過程如果是「豆包是新一代AI智能助手」這樣的概念是很難的,因為太寬泛了,用戶接受度會有問題。
相對而言更具體的概念更容易建立起用戶心智,例如豆包練口語效果很好,豆包可以寫公文。
一個細(xì)分的具體的心智被建立起來之后再在用戶使用的過程中可以再逐漸做心智擴展。引導(dǎo)到【豆包是個全功能AI助手】這樣的大概念,繼而引導(dǎo)用戶探索其他使用場景,完成更多停留時長的目標(biāo)。
和傳統(tǒng)搜索產(chǎn)品相比AI搜索的價值更多體現(xiàn)在解決復(fù)雜任務(wù)的場景下,那么解決復(fù)雜任務(wù)的搜索還是不是搜索?任務(wù)重點部分在哪里完成?用戶操作的起點是搜索,但重點是后續(xù)服務(wù)。在觀察了三款國內(nèi)第一梯隊的AI搜索產(chǎn)品后,其實我們也會發(fā)現(xiàn)這三款A(yù)I搜索產(chǎn)品的思路由明顯區(qū)別。
這里先講一下我主觀感受中的國內(nèi)第一梯隊AI搜索產(chǎn)品,有三款分別是夸克、360和豆包。
夸克已經(jīng)在產(chǎn)品名稱中不再強調(diào)瀏覽器了,無論是PC還是安卓和蘋果的應(yīng)用商店完全看不到瀏覽器的概念。我猜測這可能與希望逐漸過渡用戶心智有關(guān)。
360在瀏覽器領(lǐng)域積累最深,用戶心智的就是瀏覽器,所以依然沿用了瀏覽器的概念,很早就打360AI瀏覽器的概念。這么做可以令他們把存量用戶轉(zhuǎn)移到AI產(chǎn)品中更加容易,但后續(xù)瀏覽器概念的轉(zhuǎn)變會落后一分。
豆包則比較激進(jìn)的直接使用了AI助手的概念,包括產(chǎn)品的圖標(biāo)也使用了一個人物形象來貼合助手的概念,好處是在AI助手這個領(lǐng)域搶占了先機,但同時也可以失去很多認(rèn)知還停留在瀏覽器產(chǎn)品的用戶。
下載了豆包之后,可以在系統(tǒng)級層面使用劃詞觸發(fā)AI的能力,這一點是非常領(lǐng)先的,像莫妮卡等chrome插件的形式也僅僅是在瀏覽器層面,能夠觸發(fā)的用戶場景相對于系統(tǒng)級還是少了很多。
這樣來看的話,其實擁有更底層權(quán)限和可以更自由定義體驗的操作系統(tǒng)其實可以把AI能力和用戶場景結(jié)合的更好,但目前其實還沒看到實際發(fā)布的產(chǎn)品,不知道是不是在憋大招,可以期待一下。
做AI搜索時有幾點決策是比較牛的,第一是和客戶端綁定,意味著體驗更可控和留存有基礎(chǔ)。把客戶端下載到設(shè)備之后,也可以增加很多被用戶看到的機會,這就和網(wǎng)站形態(tài)有很大的區(qū)別了。第二是淡化瀏覽器的概念,這個夸克和豆包已經(jīng)在做了。
現(xiàn)在的 AI 搜索的產(chǎn)品形態(tài)只是一個暫時的一個形式,為了讓傳統(tǒng)搜索引擎用戶,能夠很順暢地遷移到新形態(tài)的 AI 搜索上去。但是隨著技術(shù)和產(chǎn)品的迭代,我相信新的交互形式、新的產(chǎn)品形式都會在 AI 搜索上展現(xiàn)。
二、AI搜索產(chǎn)品短中長期能力規(guī)劃
1. 短期
- 更多類型的圖示。目前都支持了思維導(dǎo)圖和PPT,但常用的其他圖示如流程圖魚骨圖還不支持,這方面的需求是非常明確的,作者在群里也看到過數(shù)次用戶在清晰的描述這些需求。
- 更多媒體類型的輸入輸出??梢允∪ビ脩粼谳斎氕h(huán)節(jié)手動轉(zhuǎn)換不同模態(tài)信息的工作,可以在輸出環(huán)節(jié)令信息的輸出形態(tài)與環(huán)境更適應(yīng)。
- 問題轉(zhuǎn)寫小模型。針對這種小模型的優(yōu)化工作相對于提升大模型能力成本更低,需要時間更短,可以更快看到效果。
- 信息源選擇規(guī)則。對問題分類后準(zhǔn)確的選擇來源可以明顯的提升結(jié)果質(zhì)量,例如做菜類問題的來源,寫代碼類問題的來源,沒有什么技術(shù)難度,就是個信息整理的工作。
2. 中期
1)信息源總量與輸入token總量提升(基于模型大降價)
目前的RAG過程會選擇搜搜結(jié)果中的前X篇內(nèi)容來進(jìn)行聚合總結(jié)生成,根據(jù)信息源選擇的規(guī)則可以基本做到拿到的X篇內(nèi)容都是質(zhì)量還不錯的,但是萬一某個優(yōu)秀的觀點出現(xiàn)在X之外,那么結(jié)果質(zhì)量就會受到影響。
當(dāng)未來token價格大幅度下降之后,可能在聚合階段就可以聚合10X篇內(nèi)容,這樣就可以令結(jié)果質(zhì)量更好。(結(jié)果質(zhì)量是AI搜索產(chǎn)品最重要的體驗指標(biāo)之一)
2)多模態(tài)融合交互
不同模態(tài)的信息傳遞方式在人機交互中有諸多特點,視覺模態(tài)對信息的接收效率很高,可以以整體的角度認(rèn)知大量信息的集合。也可以跳躍式的閱讀文字信息,不像聽覺一樣完全依賴時間線順序接收信息。但視覺模態(tài)不擅長輸出信息,眼動交互的操作效率很差,即使以蘋果公司的技術(shù)能力也只能作為一種輔助殘障人群使用智能設(shè)備的輔助交互方式。
聽覺模態(tài)則接收信息時具有被動性、環(huán)繞性、和瞬態(tài)性,在輸出信息時則具有穿透性。被動性是指只要聲波在用戶周圍產(chǎn)生了那么就可以被接收到,不需要用戶主動尋找信息。
鬧鐘就是符合聲音模態(tài)接收被動性的案例。環(huán)繞性則是相對于視覺模態(tài)而言,聲音在人的任意方向產(chǎn)生都可以被人接收到,而視覺大約只可以接收130°的范圍。瞬態(tài)性是聲音在不依賴外部設(shè)備時是不可以留存的,用戶只能在聲音持續(xù)產(chǎn)生的過程中接收,聲音停止接收也會停止,想再次接收只能再產(chǎn)生一次聲音,這一特征相對于通過視覺模態(tài)接收文字信息劣勢較大。
最后的穿透性則有兩方面的含義,一是在物理世界內(nèi)即使人與聲音之間存在一定程度的阻隔,聲音依然可以被人接收到。這一點相對于視覺模態(tài)可以適應(yīng)不同場景下的信息接收方式。
穿透性的第二方面含義是在軟件產(chǎn)品中可以不依賴屏幕顯示出來的內(nèi)容對功能進(jìn)行控制,傳統(tǒng)的GUI方式想進(jìn)行一項操作,必須點擊屏幕中顯示的元素觸發(fā),沒有顯示出來的元素只能通過切換頁面切換層級先找到再觸發(fā),而聲音的穿透性可以直接被設(shè)備識別后觸發(fā)對應(yīng)的功能,不依賴屏幕可顯示空間。
觸覺模態(tài)則在安全感建立和真實感方面有較大影響,包括人類五感中另外的嗅覺和觸覺,在今天應(yīng)用到人機交互方面很少,可能在未來的虛擬現(xiàn)實產(chǎn)品中才能得到實際應(yīng)用。
以上僅是介紹了多模態(tài)交互問題中各個模態(tài)的簡單特點,實際上多模態(tài)交互最重要的部分是多模態(tài)融合,具體到產(chǎn)品中應(yīng)用則是能解決用戶在多任務(wù)場景下的交互帶寬問題。
例如人類無法同時看清兩幅畫的細(xì)節(jié),無法同時聽清楚兩首歌的旋律,這都是由于單一模態(tài)在交互過程中的限制,而使用多模態(tài)融合交互的方式則可以解決這個問題(有極限)。
例如傳統(tǒng)的計算器,當(dāng)用戶按下按鍵時就會發(fā)出與按鍵對應(yīng)的聲音,【7】【加/減】【等于63】,用戶在使用時可以用視覺模態(tài)看著賬本、用觸覺模態(tài)確認(rèn)自己按下的按鍵,用聽覺模態(tài)核查按鍵是否正確和接收計算結(jié)果。這樣就可以利用多個模態(tài)協(xié)同的效果更高效的完成算賬任務(wù)。
多模態(tài)融合交互的另一方面意義在于信息之間的轉(zhuǎn)化和非文字信息,不同模態(tài)信息之間的轉(zhuǎn)化意味著可用于回答用戶問題的數(shù)據(jù)總量提升了。
例如用戶問:北京XX書店有休息區(qū)嗎?這樣非常具體的問題以前需要依賴其他熱心網(wǎng)友給與回復(fù),但未來如果搜索引擎找到了一張北京XX書店的照片,照片內(nèi)有休息用桌椅的話,就可以直接回答用戶這個問題。
非文字信息是指情緒、語氣、語速、停頓、重音等等(還有很多),同樣一句話使用不同語氣說出來可能意思完全不同,陰陽怪氣是個很準(zhǔn)確的描述詞。
3)用戶界面?zhèn)€性化
面對不同的問題,用戶界面的顯示形式可以完全不同,例如問題【小米14和華為mate60對比】就可以使用表格的形式來列舉寫明每一項參數(shù)的對比,而不適合用大段文字來描述。
網(wǎng)上很多文章中都有提到在回答不同問題時可以使用不同的agnet來回答促進(jìn)答案質(zhì)量,但答案生成后在UI設(shè)計角度如何呈現(xiàn)給用戶同樣重要,也是使用不同的agnet來回答促進(jìn)答案質(zhì)量的最終面對用戶形式。
4)廣告體驗
廣告與用戶匹配越精準(zhǔn),廣告的負(fù)面屬性就會越低,未來當(dāng)能收集到用戶的信息維度變得更多,能保留的長期記憶(上下文)更多,傳感器能接收到的超模態(tài)信息更多之后,廣告的精準(zhǔn)度一定會有大幅提升。即使是短期內(nèi)來看,通過統(tǒng)一廣告與自有用戶界面的視覺樣式,也可以獲得更好的廣告體驗。
3. 長期
1)從多模態(tài)到超模態(tài)
模態(tài)一詞原指人類可以接收信息的通道,人的主要信息通道就是人的五感,過去的智能設(shè)備基本依賴視覺輸出和觸覺輸入,后來逐漸增加了聲音模態(tài)的輸入和輸出,但距離多模態(tài)融合的人機交互還有不短的距離,以一個非常簡單的計算器APP為例,當(dāng)融入多模態(tài)能力后,完全可以做到眼睛看著一堆賬單,聲音同時讀出賬單上的數(shù)字和計算方式,這樣就不必來回轉(zhuǎn)動頭部在賬單和計算器之間切換,同時還可以利用計算器帶有的揚聲器來檢驗輸入是否有誤。
多模態(tài)融合的交互方式就像是從一個人變成了一個團隊,團隊中有擅長方向的成員,視覺可接收信息速度最快,聽覺則可以在360度的方向上接收信息,觸覺能帶給人安全感知,嗅覺和味覺可以接收更多維度的信息。團隊中多個成員協(xié)同工作后就能面對更加復(fù)雜的工作任務(wù)。
多模態(tài)交互無疑是人機交互過程的進(jìn)步,但更令人興奮的是超模態(tài),這個概念是我自己起的名字。人的主要信息通道(模態(tài))只有5種,但對于智能設(shè)備來說則不然,對智能設(shè)備來說,有多少種傳感器就有多少個信息通道(模態(tài))。手機利用光強度傳感器接收到環(huán)境亮度信息后可以做到自動調(diào)節(jié)屏幕亮度。手機OS融合了用戶行為數(shù)據(jù)和時間、地點等信息后可以形成智能建議,變?nèi)苏曳?wù)為服務(wù)找人。
AI搜索產(chǎn)品中有個非常重要的能力是意圖識別,只有對用戶意圖識別的足夠強才能在下一步意圖與工具/內(nèi)容的匹配時更加準(zhǔn)確,而眾多傳感器傳遞聚合后的各種信息就是意圖識別判斷過程中的推理基礎(chǔ)。根據(jù)湖北日報的新聞,全球傳感器種類有2.6萬余種,雖然這些并不都能夠運用到產(chǎn)品設(shè)計領(lǐng)域,但相對于人類的5種已經(jīng)不是一個數(shù)量級了,所以未來當(dāng)智能設(shè)備集成更多種傳感器(或從其他地方收到多種傳感器感知到的信息)后,非常有可能實現(xiàn)從人找服務(wù)變成服務(wù)找人,即使是短期來看,也是對搜索結(jié)果準(zhǔn)確性的重要增強,這意味著AI搜索產(chǎn)品最核心體驗的提升。
模態(tài)一詞原指人能接收信息的通道,人類常用的信息通道就是常說的五感,目前在與設(shè)備交互時又以視聽觸三感居多,但對智能設(shè)備而言,接收信息的通道可能比人類不是一個數(shù)量級的,設(shè)備集成了多少傳感器就可以有多少種信息通道,也可以做出基于這些超越人類模態(tài)信息的數(shù)據(jù)的能力,例如手機基于光強度傳感器可以做到自動調(diào)節(jié)屏幕亮度,基于GPS可以快速確定位置,都可以利用這些信息做到更智能的交互體驗。
目前,僅基于用戶行為數(shù)據(jù)和人的五種信息通道,已經(jīng)可以做到非常智能的推薦策略,傳感器的種類按照湖北日報的報道,全球共有26000多種,這與人類能夠接收到的信息種類完全不在一個數(shù)量級(當(dāng)然信息種類不會有這么多,有很多同類信息不同用途的傳感器),但總體來說依然比人類五感的模態(tài)種類不在一個數(shù)量級。
所以作者認(rèn)為,未來基于更多來源、更大數(shù)量的信息,AI搜索產(chǎn)品及全部需要意圖識別能力的產(chǎn)品體驗都會得到很大提升,甚至從意圖識別進(jìn)化到意圖預(yù)測,變?nèi)苏曳?wù)為服務(wù)找人(現(xiàn)在也有這個說法但實用性較差)。
2)定制化功能
有贊的白鴉總曾在一次直播中說他們的產(chǎn)品功能繁雜,做SAAS產(chǎn)品必然有很多定制化需求,所以當(dāng)客戶變多之后整個產(chǎn)品易用性會下降。
各種功能眼花繚亂導(dǎo)致用戶真正需要的功能難以發(fā)現(xiàn),其實當(dāng)產(chǎn)品有1000個功能,一萬家客戶,可能每家客戶需要的只有300個功能,因此未來使用大模型能力如果能做到功能的個性化那么對產(chǎn)品整體的體驗會有很大提升。
3、用戶記憶融合。為了更精準(zhǔn)的識別用戶意圖,除了用戶在產(chǎn)品中的行為數(shù)據(jù)外,融合用戶本身的數(shù)據(jù)進(jìn)行預(yù)測也是非常重要的一環(huán),未來在不同產(chǎn)品中都必然用到用戶本身數(shù)據(jù)來提供更好的服務(wù),但不同產(chǎn)品用戶數(shù)據(jù)是割裂的,所以掌握了用戶數(shù)據(jù)的產(chǎn)品更容易達(dá)成優(yōu)秀體驗,或者也可能出現(xiàn)特定產(chǎn)品服務(wù)用戶儲存?zhèn)€人數(shù)據(jù)(長期記憶備份)。
4. 持續(xù)
- 模型能力。不必多講,需求之上一切服務(wù)的基礎(chǔ)。
- 意圖匹配。決定了精準(zhǔn)度,決定了服務(wù)方式、匹配什么工具
- 智能體數(shù)量。決定了產(chǎn)品可服務(wù)范圍,意圖識別后能否有對應(yīng)工具幫助用戶解決問題。
三、AI搜索產(chǎn)品體驗評價體系
如下圖,從用戶與產(chǎn)品交互的路徑為邏輯主線,按照5個不同環(huán)節(jié)分別列舉的體驗影響因素。
以上是在會議中我進(jìn)行分享的全部內(nèi)容,分享過后又討論了AI搜索將帶來哪些改變?
這個問題在討論中其實有老師認(rèn)為AI搜索會帶來挺多負(fù)面的影響,包括用戶寫論文和影響人與人之間的關(guān)系,以及很多社會學(xué)問題。這些作者不太懂,但作者有個腦洞是:
AI搜索產(chǎn)品給出的答案都是結(jié)構(gòu)化的信息,那么當(dāng)這一代學(xué)生在習(xí)慣使用AI搜索產(chǎn)品后,是不是就可以在長期閱讀結(jié)構(gòu)化信息的過程中逐漸形成結(jié)構(gòu)化思維?。
結(jié)構(gòu)化思維大家應(yīng)該不陌生,很多領(lǐng)域的大牛都認(rèn)為這是一種很高級的思維,在思考問題的全面性、邏輯性上效果都非常好,也可能促進(jìn)人思考問題的深度。
而長期閱讀結(jié)構(gòu)化信息應(yīng)該是對形成結(jié)構(gòu)化思維是具有引導(dǎo)作用的。如果這個猜想正確,那往大了說AI搜索產(chǎn)品甚至可以提升社會效率,提升新一代年輕人的思維模型。
專欄作家
杜昭,微信公眾號:AI與用戶體驗,人人都是產(chǎn)品經(jīng)理專欄作者,實戰(zhàn)派設(shè)計師,目前在某手機公司負(fù)責(zé)手機OS交互設(shè)計,所負(fù)責(zé)產(chǎn)品覆蓋用戶數(shù)億,主要研究AI與人機交互設(shè)計的融合及人因?qū)W對用戶體驗的影響。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Pixabay,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
我覺得AI需要具備更強的語義理解能力,這樣無論需要它做什么都能達(dá)到我們想要的結(jié)果
個人覺得AI搜索引擎這個發(fā)展方向特別好特別實用,但是目前技術(shù)性各個搜索平臺其實差異不大,期待未來的發(fā)展吧
我認(rèn)為AI搜索是一個雙刃劍,它的出現(xiàn)和發(fā)展確實帶來了很多便利,但不可否認(rèn)它會帶來挺多負(fù)面的影響,關(guān)鍵還是要看我們怎么運用吧。