六家“深度搜索”橫評,誰更懂用戶要什么?

Alter
1 評論 991 瀏覽 0 收藏 19 分鐘

傳統(tǒng)搜索的時代結(jié)束了,而我們正站在新時代的大門前,搜索不再是簡單的信息檢索,而是基于理解和洞察的信息重組與再創(chuàng)造。

兩年多前,Gmail的創(chuàng)建者之一Paul Buchheit在社交媒體上寫道:“谷歌可能只需要一兩年時間就會被徹底顛覆,AI將會消滅搜索引擎的結(jié)果頁面。”

時間驗證了Paul Buchheit的論斷,焦點卻是在中國市場。過去一個多月里,百度、夸克、微博、知乎、小紅書等平臺陸續(xù)接入DeepSeek,和大模型的深度思考能力融合,重新定義了內(nèi)容的呈現(xiàn)方式和用戶搜索習(xí)慣,悄然開啟了一場“深度搜索”戰(zhàn)事。

本期內(nèi)容將圍繞日常生活中經(jīng)常遇到的一些問題,包括健康、數(shù)碼、美妝、游戲和最新事件,對DeepSeek R1(聯(lián)網(wǎng)搜索)、百度AI搜索、夸克、微博智搜、知乎直答、小紅書孵化的AI搜索應(yīng)用“點點”進(jìn)行橫向?qū)Ρ?,測試下“深度搜索”能力哪家強(qiáng)?

需要說明的是,由于“思考過程”比較長,截圖僅展示最終答案。

假如對結(jié)果的真實性存疑,可自行測試。

第一題:兒童換季過敏有哪些特別注意事項?

因為家里的寶寶是易過敏體質(zhì),就把很多家長正在頭疼的問題作為測試的第一道題,用來驗證內(nèi)容的權(quán)威性和可信度。

先說結(jié)論:六個產(chǎn)品都達(dá)到了及格線,都提到了常見的過敏原,過敏的主要癥狀,日常護(hù)理需要注意的事項等等。原先需要查看幾十篇文章或視頻的知識點,現(xiàn)在只需要等待幾十秒的時間。

DeepSeek R1意外沒有標(biāo)記內(nèi)容來源,但輸出的內(nèi)容和百度、夸克差別不大,并未出現(xiàn)太多“幻覺”。

百度AI搜索的答案相對簡潔了不少,聚焦在了花粉、螨蟲等過敏源,然后梳理了對應(yīng)的應(yīng)對措施,和DeepSeek R1不相上下。

夸克的答案更為詳實,將防護(hù)建議進(jìn)一步細(xì)化到了皮膚護(hù)理、呼吸道護(hù)理,以及飲食調(diào)整、藥物治療、中醫(yī)調(diào)理等建議,在內(nèi)容的多樣性方面比百度和DeepSeek R1有進(jìn)步。

微博智搜、知乎直答和“點點”,因為本身擁有大量的UGC內(nèi)容,表現(xiàn)出了各自的特色:“點點”沒有太多增量信息,但排版上有著鮮明的小紅書風(fēng)格,視覺上更加友好。

知乎直答的參考資料全部來自站內(nèi),也在某種程度上暴露了知乎在健康類內(nèi)容上的短板。

微博智搜的答案是讓我們最驚訝的,原因是在搜索結(jié)果中給到了更多的增量信息,而且包含了權(quán)威媒體和專業(yè)健康類博主的原創(chuàng)視頻,幾乎可以直接作為預(yù)防手冊使用。

第二題:電腦的內(nèi)存條是越多越好嗎?

這是一個很多人選配電腦時都會糾結(jié)的事,看起來比較專業(yè),其實里面留了一個坑,用來測試不同AI搜索的用戶友好性。

單從準(zhǔn)確性上看,六個產(chǎn)品沒有拉開明顯差距,均考慮到了不同的使用場景,兼容性和穩(wěn)定性,很多用戶選購內(nèi)存條時可能陷入的誤區(qū)。

比知識本身更重要的是,用戶在提問時想要的答案是什么呢?

百度和夸克不可避免地出現(xiàn)了搜索引擎的常見弊病,首先介紹通道配置、內(nèi)存性能等專業(yè)知識,最后簡單提了下“根據(jù)實際場景選擇”。

猜測癥結(jié)主要在于數(shù)據(jù)源,百度和夸克的來源站點都以長篇的圖文介紹為主,不少內(nèi)容來自內(nèi)存品牌的官網(wǎng),看似是從專業(yè)的角度切入,卻沒有顧及到“小白”群體的認(rèn)知能力。

相比之下,DeepSeek R1、微博智搜、知乎直答和“點點”都將使用需求放在了最前面,偏向于內(nèi)容博主講故事的風(fēng)格,先讓用戶按需求對號入座,再結(jié)合專業(yè)的知識高速用戶這么選的原因。

圖:微博智搜第二題答案

圖:知乎直答第二題答案

圖:小紅書點點

第二題答案其中微博智搜和“點點”都在答案中引用了專業(yè)數(shù)碼博主的科普視頻。

不同的是,微博智搜在排版上將視頻作為了答案的一部分,契合了小白群體的需求,譬如可以直接點擊觀看視頻,通俗易懂地學(xué)習(xí)相關(guān)知識點?!包c點”則將視頻放在最后,僅作為延伸了解。

第三題:含玻色因和視黃醇的護(hù)膚品能一起使用嗎?

前面兩個問題中,平臺的博主和UGC內(nèi)容在很大程度上左右了輸出內(nèi)容,于是我們找來了一個和美妝相關(guān)的問題。

結(jié)果和我們預(yù)料中的一樣。

因為時尚美妝是內(nèi)容營銷的“重災(zāi)區(qū)”,AI搜索能否處理營銷味兒比較重的內(nèi)容,給出一份客觀的答案呢?

鑒于DeepSeek R1從純技術(shù)角度進(jìn)行了回答,將作為判定其他內(nèi)容是否被營銷污染的“佐證”。

圖:百度AI搜索第三題答案

圖:夸克第三題答案

百度和夸克“終于扳回了一局”,盡管內(nèi)容中出現(xiàn)了珀萊雅逆時光瓶、珀萊雅黑繃帶等扎眼的產(chǎn)品名,整體上依然比較客觀,自動過濾到了一些“軟植入”,且成分介紹、注意事項、使用建議等都相對準(zhǔn)確。

“翻車”最嚴(yán)重的是“點點”,可以看到平臺想要規(guī)避營銷類內(nèi)容的努力,來源中特意增加了有來醫(yī)生、百家號等外部內(nèi)容,但“輔助方案”和引用的圖片,有著濃濃的營銷味兒。

同樣的問題,微博智搜優(yōu)先采用的是浙大一院主治醫(yī)生的視頻講解,對兩種成分的作用機(jī)制進(jìn)行了通俗易懂的介紹,使用建議和注意事項中也提到了相關(guān)產(chǎn)品,但營銷味兒弱了很多。

至于知乎直答,在這個問題下直接“擺爛”了,原因大概與第一題一樣,和知乎的用戶構(gòu)成和內(nèi)容側(cè)重有關(guān)。

第四題:《王者榮耀》最新版本里最適合上分的打野英雄是誰?

如果說前面幾道題都有相對確切的答案,我們找了到比較主觀的題目,比如對《王者榮耀》里打野英雄的排序。

預(yù)料之中的,我們看到了六個不同版本的答案,不僅提到的英雄不同,同一英雄的排名也不同。

為了盡可能客觀,我們仔細(xì)查看了思考過程和來源,看看哪個AI在“實事求是”,哪個AI在“弄虛作假”。

圖:DeepSeek R1第四題答案

圖:百度AI搜索第四題答案

圖:夸克第四題答案

有意思的是,DeepSeek R1、百度、夸克均采用了T0、T0.5、T1的分類方法,滿滿的專業(yè)評測范兒,只是英雄的排序全然不同。

在“思考過程”中可以看到,都注意了“網(wǎng)頁”的發(fā)布時間,并提出查看“過去三個月的內(nèi)容”,答案里仍采用了大量2023年乃至2018年的內(nèi)容,DeepSeek R1被網(wǎng)友詬病的“幻覺”問題,總算是“暴露”了。

微博智搜和“點點”主要參考的是2024年12月份以后的用戶內(nèi)容,其中微博智搜“挖”出了二十多篇三天內(nèi)的相關(guān)微博。

知乎直答遺憾地再一次“拉胯”了,猜測原因是同一個問題下有近期的回答,也有兩三年前的回答,知乎直答并未對舊內(nèi)容進(jìn)一步按時間過濾,導(dǎo)致答案和其他幾家出入最大。

第五題:平價的蜜雪冰城擁有塌房豁免權(quán)嗎?

既然“時間線”成了某些深度搜索的短板,不妨進(jìn)一步測試下——能否準(zhǔn)確回答或梳理過去一周內(nèi)發(fā)生的焦點事件?

起因是315晚會對蜜雪冰城門店使用隔夜檸檬片的報道,在輿論端卻出現(xiàn)了反差,不同于對“滬上阿姨”的口誅筆伐,網(wǎng)友們再一次“寬恕”了蜜雪冰城,衍生出了“塌房豁免權(quán)”的說法,吸引不少自媒體進(jìn)行解讀。恰恰是這個問題的答案,讓我們對“深度搜索”有了更深刻的認(rèn)知,絕非是一場同質(zhì)化的競賽,而是內(nèi)容差異化的較量。

圖:DeepSeek R1第五題答案

圖:夸克第五題答案

圖:百度AI搜索第五題答案

DeepSeek R1、夸克和百度主要參考的是新聞報道和自媒體文章,答案里的措辭有所不同,但有著相似的邏輯。同時也意味著,缺少UGC內(nèi)容的情感和真實體驗,很難拉開實質(zhì)性的差距。

微博智搜在回答中提到了消費平權(quán)、品牌形象的防御性建構(gòu)和危機(jī)傳播的娛樂化消解,讓我們看到了更多的維度,也再一次印證了微博在中文輿論場里的“陣地優(yōu)勢”;

“點點”在回答中提到了情感綁架、自我PUA式消費等議題,本質(zhì)上也是對平臺用戶價值觀的呈現(xiàn);

知乎直答的表現(xiàn)中規(guī)中矩,但提到了“消費降級”,同樣可以看到平臺內(nèi)容上的差異化……普通用戶分享生活、觀點、經(jīng)驗等真實感強(qiáng)的內(nèi)容,才是深度搜索的魅力所在。

寫在最后

由于時間關(guān)系,我們只測試了5道問題。

單就推理速度而言,百度、夸克位于第一梯隊,無形中印證了百度和阿里的技術(shù)硬實力,點點和知乎直答處于第二梯隊,微博智搜的思考速度稍慢了一些,用時和DeepSeek R1不相上下。

對于搜索的結(jié)果,暫時無法對幾個深度搜索平臺的優(yōu)劣做出確定性的結(jié)論,但不乏一些值得關(guān)注洞察:

1、大模型的深度思考能力決定了體驗的下限,但內(nèi)容決定了體驗的上限。

無論是百度、夸克,還是微博、小紅書、知乎,接入的都是DeepSeek R1滿血版,在底層的技術(shù)能力上實現(xiàn)了對齊,最大的差異其實在于各個平臺所擁有的內(nèi)容資源。

比如微博以前的搜索體驗差強(qiáng)人意,直接原因就是基于關(guān)鍵詞的搜索技術(shù),導(dǎo)致來自權(quán)威媒體、行業(yè)大V的優(yōu)質(zhì)內(nèi)容“沉沒”。接入DeepSeek R1后,原本零散、碎片化的優(yōu)質(zhì)信息,被高效整合成清晰、邏輯性強(qiáng)且具備參考價值的搜索結(jié)果,在用戶體驗上有了極大改善。

2、深度搜索不只是“找信息”,而是“找真實、權(quán)威、有可信度的信息”。

大模型本身“沒有價值觀”,影響輸出結(jié)果的是數(shù)據(jù),社交平臺上的UGC內(nèi)容也就成了一把雙刃劍:可能讓答案更有“人情味兒”,也可能“污染”生成內(nèi)容的準(zhǔn)確性。

就像小紅書里的美妝廣告,搜索結(jié)果中不可避免地夾雜了太多的營銷信息。并非沒有“避險方案”,比如在特定領(lǐng)域調(diào)整UGC內(nèi)容的權(quán)重,以外部可信內(nèi)容為主,UGC內(nèi)容為輔;或者像微博那樣引入權(quán)威媒體和垂直領(lǐng)域的專業(yè)博主,用大量權(quán)威、可信的內(nèi)容避免信息失真。

3、深度搜索的體驗是不可逆的,將帶來更加有效的商業(yè)變現(xiàn)路徑。

俞軍老師提出過一個著名的體驗公式,即用戶體驗=(新體驗-舊體驗)-遷移成本。鑒于深度搜索相較于傳統(tǒng)搜索的跨時代優(yōu)勢,用戶體驗在很大程度上是不可逆的。

新范式必然會帶來新的機(jī)會。以內(nèi)容付費為例,用戶更愿意為高權(quán)威、高可信的內(nèi)容付費,微博、小紅書、知乎等社交類平臺,或許可以在醫(yī)療、法律、財經(jīng)咨詢等垂直領(lǐng)域,構(gòu)建信任型內(nèi)容付費場景,通過搜索結(jié)果在專家和用戶間建立信任的紐帶,激勵專家持續(xù)生產(chǎn)優(yōu)質(zhì)內(nèi)容。

做一個總結(jié)的話:傳統(tǒng)搜索的時代結(jié)束了,而我們正站在新時代的大門前,搜索不再是簡單的信息檢索,而是基于理解和洞察的信息重組與再創(chuàng)造,屬于內(nèi)容平臺的下一個春天來了。

撰文|張賀飛 編輯|沈菲菲

本文由人人都是產(chǎn)品經(jīng)理作者【Alter】,微信公眾號:【Alter聊科技】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 每家搜索的回答內(nèi)容都不大一樣,但都是基于互聯(lián)網(wǎng)網(wǎng)頁爬取

    來自廣東 回復(fù)
  2. 確實,未來,深度搜索的發(fā)展需要在內(nèi)容質(zhì)量、用戶體驗和商業(yè)變現(xiàn)之間找到平衡,才能真正實現(xiàn)其價值。

    來自山東 回復(fù)