2025生成式AI平臺(tái)交互體驗(yàn)觀察(大語(yǔ)言模型篇)

0 評(píng)論 1184 瀏覽 8 收藏 21 分鐘

過(guò)去一年,大模型產(chǎn)品百花齊放,都開(kāi)始卷價(jià)格和應(yīng)用,對(duì)用戶來(lái)說(shuō)當(dāng)然是好事。但就實(shí)際上手來(lái)說(shuō),這些產(chǎn)品的表現(xiàn)怎么樣?這篇文章,我們來(lái)看看作者的分析。

The world is changing,it’s time we change too.

2024年是AI應(yīng)用元年,從2023年ChatGpt爆火到國(guó)內(nèi)百模大戰(zhàn),到現(xiàn)在AI技術(shù)應(yīng)用在C端、B端百花齊放,新一代互聯(lián)網(wǎng)商業(yè)模式MaaS(Model as a Service模型即服務(wù))應(yīng)運(yùn)而生。

盡管AI應(yīng)用很新潮,過(guò)去我們積累的用戶體驗(yàn)設(shè)計(jì)經(jīng)驗(yàn)也未必不管用。過(guò)去一年,我們看到了很多基于大語(yǔ)言模型的產(chǎn)品百花齊放,我想聊聊我的觀察。

一、找到切入點(diǎn)

AI產(chǎn)品很多,功能很復(fù)雜,我們需要找到一個(gè)切入點(diǎn),我想從黑箱理論說(shuō)起。

蘋(píng)果公司的黑箱理論:用戶不需要了解系統(tǒng)或功能背后的實(shí)現(xiàn)邏輯,只需要關(guān)注呈現(xiàn)在用戶眼前的交互界面即可。

很有意思的是,大語(yǔ)言模型從技術(shù)上來(lái)說(shuō)本身就存在黑盒特性,這些模型的內(nèi)部工作機(jī)制常常對(duì)我們而言就是一個(gè)“黑盒”。雖然這些模型的代碼、參數(shù)和訓(xùn)練方法是公開(kāi)透明的,但我們?nèi)匀浑y以追蹤和理解它們?nèi)绾螐奶囟ǖ妮斎肷商囟ǖ妮敵觥?/p>

這種復(fù)雜性源自于模型內(nèi)部多層次的非線性數(shù)據(jù)處理和海量參數(shù)的復(fù)雜交互,使得追溯和理解其決策路徑成為一項(xiàng)巨大挑戰(zhàn)。

就像人類(lèi)決策是由復(fù)雜的情感、多重動(dòng)機(jī)和豐富的個(gè)人經(jīng)驗(yàn)交織而成的。AI模型同樣如此,盡管我們了解它們的基礎(chǔ)架構(gòu)(類(lèi)似于人類(lèi)的基因)和訓(xùn)練過(guò)程(類(lèi)似于人類(lèi)的教育和經(jīng)歷),但模型如何綜合這些因素以做出特定響應(yīng)仍是復(fù)雜且難以預(yù)測(cè)的。

基于此,從黑盒理論和用戶的角度出發(fā),大語(yǔ)言平臺(tái)本質(zhì)上可以看成三個(gè)模塊,輸入模塊-分析模塊-輸出模塊,由此我們就有了相對(duì)直觀的觀察角度。

二、輸入模塊

輸入通俗地講叫向大語(yǔ)言模型提出“問(wèn)題”,比較專(zhuān)業(yè)的說(shuō)法叫“提示”或“指令”,也有一個(gè)專(zhuān)門(mén)的工程類(lèi)別叫“提示工程”;是將信息輸入到大模型中的必要前提。

很多時(shí)候一個(gè)好提示將決定結(jié)果的輸出質(zhì)量,并且一個(gè)問(wèn)題經(jīng)常是需要多次迭代才能生成最終的結(jié)果,用戶的真實(shí)想法往往和實(shí)際意圖之間差了好遠(yuǎn)。

吳恩達(dá)在《給每個(gè)人的大語(yǔ)言模型課》中說(shuō):“我不認(rèn)為有一個(gè)適合每個(gè)人的完美提示,用戶選擇輸入有一個(gè)從“想法”到“提示工程”到“模型回復(fù)”的過(guò)程,更有用的是有一個(gè)流程,當(dāng)我自己在使用大模型時(shí),經(jīng)常會(huì)嘗試和迭代,比如如果我不喜歡結(jié)果,我可能會(huì)澄清,如果仍沒(méi)有給我想要的確切結(jié)果,我可能會(huì)進(jìn)一步進(jìn)行澄清和迭代?!?/p>

在輸入模塊,提升用戶體驗(yàn)的核心點(diǎn)就在于如何更高效地幫助用戶從一個(gè)想法,不斷優(yōu)化提示,使其更快速地接近所需答案的過(guò)程。

國(guó)內(nèi)外生成式AI技術(shù)平臺(tái)為此做了很多的努力。輸入本身是有成本的,我根據(jù)用戶痛點(diǎn),對(duì)大語(yǔ)言模型平臺(tái)的核心功能點(diǎn)進(jìn)行了梳理。

降低輸入成本

OK,小朋友們,讓我們回到小時(shí)候的語(yǔ)文課堂,當(dāng)我們?cè)诿枋鲆患虑榈臅r(shí)候,通常會(huì)遵循5W1H原則,即什么人在什么時(shí)間點(diǎn)在哪里做了什么事情,是如何做的,為什么做。

同樣的,在向大語(yǔ)言模型輸入提示的時(shí)候,我們依然可以遵循這樣的原則。


但往往,可能是因?yàn)樵谡鎸?shí)的社交場(chǎng)景中,人與人在互相交流前就已經(jīng)事先共享了一部分信息,在描述事情的時(shí)候也不需要那么全面。

大語(yǔ)言模型盡管由海量的數(shù)據(jù)訓(xùn)練出來(lái),但面對(duì)單個(gè)用戶時(shí),雙方其實(shí)并沒(méi)有事先共享信息。所以幫助用戶降低輸入成本就比較重要。下面是部分解決辦法:

主動(dòng)理解意圖

當(dāng)面對(duì)交談的對(duì)象語(yǔ)無(wú)倫次,東一榔頭西一棒槌地描述的時(shí)候,我們會(huì)反問(wèn):“你想說(shuō)的是不是這個(gè)…意思?”。

在輸入模塊,平臺(tái)幫助用戶做的也是這么一件事情:你想表達(dá)的東西,我?guī)湍惚磉_(dá)一部分,你看看是不是這個(gè)意思。下面我會(huì)舉例:

ChatGpt的對(duì)話框下提供了多個(gè)用戶常見(jiàn)的場(chǎng)景,創(chuàng)建圖片|給我驚喜|總結(jié)文本|分析輸入|分析圖片|幫我寫(xiě)等。點(diǎn)擊之后推薦對(duì)應(yīng)場(chǎng)景的聯(lián)想問(wèn)題來(lái)幫助完善提問(wèn)。

用戶選擇代替用戶輸入

豆包和文心一言甚至更貼心地把常用技能模塊細(xì)分到更加具體的使用場(chǎng)景,進(jìn)一步明確用戶的目標(biāo),事先提供對(duì)應(yīng)場(chǎng)景的功能,并且提供對(duì)話模版,用戶只需要在對(duì)應(yīng)窗格中填充文字即可。

Copliot在界面上提供各式各樣的主題卡片,教育用戶如何提問(wèn)。

Kimi在輸入關(guān)鍵詞時(shí)向用戶推薦更加全面的相關(guān)的提示詞參考,提前理解用戶意圖。并且在后續(xù)的生成結(jié)果中,繼續(xù)提供用戶可能會(huì)提問(wèn)的問(wèn)題來(lái)引導(dǎo)用戶。

增加輸入?yún)⒖?/h3>

當(dāng)有些信息無(wú)法用簡(jiǎn)短的語(yǔ)言描述時(shí),比如圖片、文檔、網(wǎng)頁(yè),最簡(jiǎn)單直接的辦法就是直接上傳上去,作為輸入的附加參考。

用戶只需說(shuō):“參考這個(gè)內(nèi)容幫我做XXXX事情”,這些附件內(nèi)容會(huì)和文本信息會(huì)一起送進(jìn)大模型黑盒里去。如今上傳文件,上傳圖片,聯(lián)網(wǎng)搜索,語(yǔ)音輸入已經(jīng)成為了生成式AI平臺(tái)的標(biāo)配功能。

自定義智能體

除此之外,盡管大模型很通用,在對(duì)話時(shí),對(duì)于特定領(lǐng)域的業(yè)務(wù),還是需要針對(duì)不同的屬性進(jìn)行定制化,讓大語(yǔ)言模型先有一個(gè)明確的自我定位;比如是一個(gè)數(shù)據(jù)分析專(zhuān)家,或是健身教練,也可能是多角色的集合體AIAGent。

ChatGpt的探索模塊支持使用并創(chuàng)建自己的智能體,針對(duì)特定的使用場(chǎng)景:提高效率|體驗(yàn)交流|價(jià)值創(chuàng)造提供多種多樣的自定義版本的智能體。

Kimi+針對(duì)辦公提效|輔助寫(xiě)作|社交娛樂(lè)|生活實(shí)用的特定場(chǎng)景提供各種各樣的智能體。同樣類(lèi)似的還有文心一言、360AI、通義千問(wèn)等。

而豆包比較有趣,在網(wǎng)頁(yè)端,還比較正經(jīng),推薦了一些跟提效創(chuàng)作有關(guān)的智能體。

而到了手機(jī)端,豆包自己本身變成了一個(gè)幾乎和其他智能體權(quán)重平等的應(yīng)用,發(fā)現(xiàn)頁(yè)中推薦了各種各樣的情緒體驗(yàn)型智能體,主打和各種各樣的明星和數(shù)字人聊天、打電話、談戀愛(ài)、玩游戲,獲得陪伴體驗(yàn)。

在集體AI平臺(tái)都在卷AI硬知識(shí)技能時(shí),豆包選擇了將AI和娛樂(lè)掛鉤起來(lái),讓AI產(chǎn)品變得有趣,在年輕人的荷爾蒙中發(fā)酵,這是互聯(lián)網(wǎng)流量思維的玩法。

三、分析模塊

在分析模塊,當(dāng)前主流大模型盡管在語(yǔ)言理解和文本生成上表現(xiàn)優(yōu)異,但仍然在一些方面體驗(yàn)不佳:大模型回復(fù)等待時(shí)間長(zhǎng);不允許打斷、插話;存在幻覺(jué)等。我將從這三點(diǎn)聊聊體驗(yàn)設(shè)計(jì)在其中的應(yīng)用。

減少等待焦慮

在過(guò)去的加載頁(yè)面等待研究中,我們有這樣的共識(shí):用戶等待頁(yè)面加成功時(shí)的耐心程度一般在2-3秒范圍內(nèi),GooGle研究顯示,大約53%的移動(dòng)設(shè)備用戶會(huì)在加載超過(guò)3秒時(shí)離開(kāi),每增加1秒延遲,用戶轉(zhuǎn)化率可能下降7%或更多,過(guò)長(zhǎng)的等待時(shí)間會(huì)讓用戶感到不耐煩。

耐心時(shí)間范圍

  • 0-2秒:最佳用戶體驗(yàn),加載速度快的頁(yè)面會(huì)顯著提升用戶滿意度。
  • 3-5秒:用戶的注意力開(kāi)始下降。如果加載時(shí)間超過(guò)這一范圍,可能會(huì)導(dǎo)致用戶放棄。
  • 6秒以上:用戶放棄的可能性顯著增加。研究顯示,大約53%的移動(dòng)設(shè)備用戶會(huì)在頁(yè)面加載超過(guò)3秒時(shí)離開(kāi)。

因此,過(guò)去如果系統(tǒng)加載慢,用戶體驗(yàn)師會(huì)設(shè)計(jì)加載動(dòng)畫(huà)或進(jìn)度條,優(yōu)先加載關(guān)鍵內(nèi)容等方式來(lái)延長(zhǎng)用戶耐心,生成式AI平臺(tái)也通過(guò)類(lèi)似的方法來(lái)提升用戶體驗(yàn)。

ChatGPT通過(guò)逐步每次都將生成的部分內(nèi)容展示出來(lái),使用戶可以邊閱讀部分邊生成來(lái)延長(zhǎng)用戶的忍耐程度。如果你在python中調(diào)用過(guò)大模型的API的話,大模型只會(huì)在生成所有文本后返回結(jié)果。你會(huì)發(fā)現(xiàn)大模型在生成長(zhǎng)文本的時(shí)間其實(shí)還蠻長(zhǎng)的。

通義千問(wèn)和秘塔搜索通過(guò)展示加載分段式進(jìn)度條來(lái)告知用戶任務(wù)完成程度,降低時(shí)間感知,避免不確定等待。進(jìn)度條的存在也能顯示系統(tǒng)正在正常工作,增強(qiáng)用戶對(duì)平臺(tái)的信任。

Gemin通過(guò)logo動(dòng)畫(huà),更加自然的淡入淡出刷新文字的加載動(dòng)畫(huà),來(lái)進(jìn)一步體現(xiàn)所搭載的大語(yǔ)言模型性能

提供打斷工具

不允許打斷插話這一點(diǎn)當(dāng)前業(yè)內(nèi)普遍做法都是提供停止輸出工具,功能大多也大同小異。

不過(guò)最新的ChatGpt提供的畫(huà)布模式,支持了對(duì)分析結(jié)果的具體內(nèi)容進(jìn)行進(jìn)一步地編輯,引導(dǎo)用戶進(jìn)一步細(xì)化結(jié)果。

強(qiáng)化安全意識(shí)

由于大模型的黑箱特性,盡管RAG等數(shù)據(jù)投喂技術(shù)在一定程度上減少了大模型的幻覺(jué),但當(dāng)前業(yè)界最好的大模型推理一致性在97%左右,幻覺(jué)度約3%,距離ToB/ToH領(lǐng)域的規(guī)模應(yīng)用,如網(wǎng)絡(luò)規(guī)劃、儀表和電器精準(zhǔn)控制尚有差距。故AI生成能力本身的可信任度依然是需要擔(dān)憂的事情。為此,在用戶體驗(yàn)層面,設(shè)計(jì)的核心點(diǎn)在于增加大模型生成結(jié)果的客觀性。

降低信任預(yù)期

大模型需要告訴用戶生成的內(nèi)容僅具有參考性,也可能會(huì)犯錯(cuò),通常會(huì)在界面對(duì)話框底部強(qiáng)調(diào)。

增加生成內(nèi)容客觀性

通過(guò)RAG、LanGChain等技術(shù)與搜索引擎結(jié)合,從多個(gè)來(lái)源提取關(guān)鍵信息,實(shí)時(shí)檢索和驗(yàn)證,生成綜合性的回答,減少“幻覺(jué)”現(xiàn)象,提升答案的準(zhǔn)確性和可信度。

四、輸出模塊

在輸出模塊,我想聊聊大模型的記憶、反饋、多模態(tài)輸出的體驗(yàn)設(shè)計(jì)。

記憶

如果用python調(diào)用過(guò)大模型的API的話,我們會(huì)意識(shí)到大模型本身是沒(méi)有記憶的。但是在與用戶的對(duì)話中,平臺(tái)會(huì)將當(dāng)前會(huì)話的上下文信息作為輸入模型的一部分,利用注意力機(jī)制處理這些信息,從而生成與上下文相關(guān)的響應(yīng),使得模型能夠在單詞對(duì)話中保持對(duì)近期信息的記憶,從而提供連貫的回答。

然而,大模型的上下文窗口長(zhǎng)度是有限的,通常在數(shù)千個(gè)標(biāo)記(toKens)范圍內(nèi)。這意味著當(dāng)對(duì)話長(zhǎng)度超過(guò)上下文窗口的容量時(shí),早期的信息可能會(huì)被遺忘或忽略。技術(shù)層面研究人員為此提出了多種方法來(lái)增強(qiáng)模型的記憶能力。比如循環(huán)記憶、引入外部存儲(chǔ)機(jī)制等,但仍然存在一定的局限性。

于是我觀察到了針對(duì)這一場(chǎng)景的體驗(yàn)設(shè)計(jì):

ChatGpt提供了歸檔功能,通過(guò)歸檔功能,ChatGpt可以記住用戶在之前對(duì)話中的偏好、習(xí)慣或重要信息(如興趣愛(ài)好、工作方向),從而更接近用戶的需求。

Kimi/通義千問(wèn)/文心一言則通過(guò)設(shè)置常用語(yǔ)功能來(lái)應(yīng)對(duì)可能出現(xiàn)短期記憶突然失效的情況。

反饋

說(shuō)了這么多,生成式AI平臺(tái)的核心競(jìng)爭(zhēng)力說(shuō)到底依然是大模型本身的推理能力,如今的大模型依然容易繼承和放大訓(xùn)練數(shù)據(jù)中存在的偏差,AI大模型難以避免會(huì)寫(xiě)出看似合理但不正確或荒謬的答案。大模型開(kāi)發(fā)過(guò)程中很重要的環(huán)節(jié)是數(shù)據(jù)標(biāo)注,會(huì)耗費(fèi)大量的人力物力,ChatGpt的問(wèn)世離不開(kāi)背后大量工程師對(duì)模型數(shù)據(jù)微調(diào)校正標(biāo)注的努力。

同時(shí),AI平臺(tái)的模型能力的增強(qiáng)也需要用戶的反饋,通過(guò)每天用戶海量的生成結(jié)果,從反饋給平臺(tái)以進(jìn)一步優(yōu)化模型推理能力。越強(qiáng)推理能力的大模型平臺(tái)擁有越多的用戶,越多的用戶越增強(qiáng)大模型推理平臺(tái)的能力。

而這個(gè)反饋入口就在輸出結(jié)果的下方,用戶可以點(diǎn)擊喜歡/不喜歡進(jìn)行問(wèn)題反饋,幾乎所有的AI平臺(tái)都有這個(gè)看似不起眼,但非常重要的功能。

多模態(tài)輸出

盡管可能我們認(rèn)知里的大語(yǔ)言模型平臺(tái)更多是專(zhuān)注于文本類(lèi)型輸出,我觀察到國(guó)內(nèi)外很多的大模型平臺(tái)都在往多模態(tài)生態(tài)方向打造,大語(yǔ)言模型正在和文生圖、數(shù)字人、機(jī)器人、文生視頻、內(nèi)容理解、文本處理、社區(qū)等功能融合。背后的邏輯比較復(fù)雜,我將在下一個(gè)模塊再聊。

總結(jié)

AI的發(fā)展雖然很快,但也是經(jīng)歷了漫長(zhǎng)的過(guò)程,再偉大的創(chuàng)新,也會(huì)基于人們過(guò)往經(jīng)驗(yàn)的總結(jié)。技術(shù)再?gòu)?qiáng)大,也是服務(wù)于人的,AI應(yīng)用的風(fēng)在互聯(lián)網(wǎng)上吹了一陣又一陣,但殺手級(jí)的AI應(yīng)用到目前為止仍未出現(xiàn);場(chǎng)景不夠匹配,AI的局限性依然是擋在AI應(yīng)用路上的大山。

作為一個(gè)從業(yè)4年的交互設(shè)計(jì)師,我的心情無(wú)比復(fù)雜,不知道多少人和我一樣,眼看著所謂的大機(jī)遇就在眼前,但自己卻無(wú)力乘風(fēng),內(nèi)心無(wú)比焦慮。外面都在說(shuō)AI將顛覆整個(gè)互聯(lián)網(wǎng),又說(shuō)所有的互聯(lián)網(wǎng)產(chǎn)品都可以用AI重做一遍,擔(dān)心自己的飯碗不保,擔(dān)心自己跟不上時(shí)代的浪潮。但要我說(shuō),人們?cè)诿鎸?duì)未知時(shí)總是會(huì)放大恐懼,這些都不必過(guò)分擔(dān)心。

丘吉爾有一句話:如果你到了地獄,那就繼續(xù)保持前行。

讓我們繼續(xù)前行吧,朋友!

本文由 @為美好而設(shè)計(jì) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!