久久久婷婷,精品全国在线一区二区

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

開通會(huì)員

發(fā)布

注冊(cè) | 登錄

2025生成式AI平臺(tái)交互體驗(yàn)觀察（大語言模型篇）

為美好而設(shè)計(jì)

2025-01-02

0 評(píng)論 2773 瀏覽 12 收藏

🔗 产品经理的核心价值是能够准确发现和满足用户需求，把用户需求转化为产品功能，并协调资源推动落地，创造商业价值

過去一年，大模型產(chǎn)品百花齊放，都開始卷價(jià)格和應(yīng)用，對(duì)用戶來說當(dāng)然是好事。但就實(shí)際上手來說，這些產(chǎn)品的表現(xiàn)怎么樣？這篇文章，我們來看看作者的分析。

The world is changing,it’s time we change too.

2024年是AI應(yīng)用元年，從2023年ChatGpt爆火到國(guó)內(nèi)百模大戰(zhàn)，到現(xiàn)在AI技術(shù)應(yīng)用在C端、B端百花齊放，新一代互聯(lián)網(wǎng)商業(yè)模式MaaS(Model as a Service模型即服務(wù))應(yīng)運(yùn)而生。

盡管AI應(yīng)用很新潮，過去我們積累的用戶體驗(yàn)設(shè)計(jì)經(jīng)驗(yàn)也未必不管用。過去一年，我們看到了很多基于大語言模型的產(chǎn)品百花齊放，我想聊聊我的觀察。

一、找到切入點(diǎn)

AI產(chǎn)品很多，功能很復(fù)雜，我們需要找到一個(gè)切入點(diǎn)，我想從黑箱理論說起。

蘋果公司的黑箱理論：用戶不需要了解系統(tǒng)或功能背后的實(shí)現(xiàn)邏輯，只需要關(guān)注呈現(xiàn)在用戶眼前的交互界面即可。

很有意思的是，大語言模型從技術(shù)上來說本身就存在黑盒特性，這些模型的內(nèi)部工作機(jī)制常常對(duì)我們而言就是一個(gè)“黑盒”。雖然這些模型的代碼、參數(shù)和訓(xùn)練方法是公開透明的，但我們?nèi)匀浑y以追蹤和理解它們?nèi)绾螐奶囟ǖ妮斎肷商囟ǖ妮敵觥?/p>

這種復(fù)雜性源自于模型內(nèi)部多層次的非線性數(shù)據(jù)處理和海量參數(shù)的復(fù)雜交互，使得追溯和理解其決策路徑成為一項(xiàng)巨大挑戰(zhàn)。

就像人類決策是由復(fù)雜的情感、多重動(dòng)機(jī)和豐富的個(gè)人經(jīng)驗(yàn)交織而成的。AI模型同樣如此，盡管我們了解它們的基礎(chǔ)架構(gòu)（類似于人類的基因）和訓(xùn)練過程（類似于人類的教育和經(jīng)歷），但模型如何綜合這些因素以做出特定響應(yīng)仍是復(fù)雜且難以預(yù)測(cè)的。

做交互设计10年，我为何转岗到产品经理？

真正转岗之后，我发现很多工作还是超出了自己的想象。产品经理的工作确实比较杂。理论上，产品经理的工作包括了产品的方方面面，从市场研究、用户调研、数据分析...

查看详情 >

基于此，從黑盒理論和用戶的角度出發(fā)，大語言平臺(tái)本質(zhì)上可以看成三個(gè)模塊，輸入模塊-分析模塊-輸出模塊，由此我們就有了相對(duì)直觀的觀察角度。

二、輸入模塊

輸入通俗地講叫向大語言模型提出“問題”，比較專業(yè)的說法叫“提示”或“指令”，也有一個(gè)專門的工程類別叫“提示工程”；是將信息輸入到大模型中的必要前提。

很多時(shí)候一個(gè)好提示將決定結(jié)果的輸出質(zhì)量，并且一個(gè)問題經(jīng)常是需要多次迭代才能生成最終的結(jié)果，用戶的真實(shí)想法往往和實(shí)際意圖之間差了好遠(yuǎn)。

吳恩達(dá)在《給每個(gè)人的大語言模型課》中說：“我不認(rèn)為有一個(gè)適合每個(gè)人的完美提示，用戶選擇輸入有一個(gè)從“想法”到“提示工程”到“模型回復(fù)”的過程，更有用的是有一個(gè)流程，當(dāng)我自己在使用大模型時(shí)，經(jīng)常會(huì)嘗試和迭代，比如如果我不喜歡結(jié)果，我可能會(huì)澄清，如果仍沒有給我想要的確切結(jié)果，我可能會(huì)進(jìn)一步進(jìn)行澄清和迭代。”

在輸入模塊，提升用戶體驗(yàn)的核心點(diǎn)就在于如何更高效地幫助用戶從一個(gè)想法，不斷優(yōu)化提示，使其更快速地接近所需答案的過程。

國(guó)內(nèi)外生成式AI技術(shù)平臺(tái)為此做了很多的努力。輸入本身是有成本的，我根據(jù)用戶痛點(diǎn)，對(duì)大語言模型平臺(tái)的核心功能點(diǎn)進(jìn)行了梳理。

降低輸入成本

OK，小朋友們，讓我們回到小時(shí)候的語文課堂，當(dāng)我們?cè)诿枋鲆患虑榈臅r(shí)候，通常會(huì)遵循5W1H原則，即什么人在什么時(shí)間點(diǎn)在哪里做了什么事情，是如何做的，為什么做。

同樣的，在向大語言模型輸入提示的時(shí)候，我們依然可以遵循這樣的原則。

但往往，可能是因?yàn)樵谡鎸?shí)的社交場(chǎng)景中，人與人在互相交流前就已經(jīng)事先共享了一部分信息，在描述事情的時(shí)候也不需要那么全面。

大語言模型盡管由海量的數(shù)據(jù)訓(xùn)練出來，但面對(duì)單個(gè)用戶時(shí)，雙方其實(shí)并沒有事先共享信息。所以幫助用戶降低輸入成本就比較重要。下面是部分解決辦法：

主動(dòng)理解意圖

當(dāng)面對(duì)交談的對(duì)象語無倫次，東一榔頭西一棒槌地描述的時(shí)候，我們會(huì)反問：“你想說的是不是這個(gè)…意思？”。

在輸入模塊，平臺(tái)幫助用戶做的也是這么一件事情：你想表達(dá)的東西，我?guī)湍惚磉_(dá)一部分，你看看是不是這個(gè)意思。下面我會(huì)舉例：

ChatGpt的對(duì)話框下提供了多個(gè)用戶常見的場(chǎng)景，創(chuàng)建圖片｜給我驚喜｜總結(jié)文本｜分析輸入｜分析圖片｜幫我寫等。點(diǎn)擊之后推薦對(duì)應(yīng)場(chǎng)景的聯(lián)想問題來幫助完善提問。

用戶選擇代替用戶輸入

豆包和文心一言甚至更貼心地把常用技能模塊細(xì)分到更加具體的使用場(chǎng)景，進(jìn)一步明確用戶的目標(biāo)，事先提供對(duì)應(yīng)場(chǎng)景的功能，并且提供對(duì)話模版，用戶只需要在對(duì)應(yīng)窗格中填充文字即可。

Copliot在界面上提供各式各樣的主題卡片，教育用戶如何提問。

Kimi在輸入關(guān)鍵詞時(shí)向用戶推薦更加全面的相關(guān)的提示詞參考，提前理解用戶意圖。并且在后續(xù)的生成結(jié)果中，繼續(xù)提供用戶可能會(huì)提問的問題來引導(dǎo)用戶。

增加輸入?yún)⒖?/h3>
當(dāng)有些信息無法用簡(jiǎn)短的語言描述時(shí)，比如圖片、文檔、網(wǎng)頁，最簡(jiǎn)單直接的辦法就是直接上傳上去，作為輸入的附加參考。

用戶只需說：“參考這個(gè)內(nèi)容幫我做XXXX事情”，這些附件內(nèi)容會(huì)和文本信息會(huì)一起送進(jìn)大模型黑盒里去。如今上傳文件，上傳圖片，聯(lián)網(wǎng)搜索，語音輸入已經(jīng)成為了生成式AI平臺(tái)的標(biāo)配功能。

自定義智能體

除此之外，盡管大模型很通用，在對(duì)話時(shí)，對(duì)于特定領(lǐng)域的業(yè)務(wù)，還是需要針對(duì)不同的屬性進(jìn)行定制化，讓大語言模型先有一個(gè)明確的自我定位；比如是一個(gè)數(shù)據(jù)分析專家，或是健身教練，也可能是多角色的集合體AIAGent。

ChatGpt的探索模塊支持使用并創(chuàng)建自己的智能體，針對(duì)特定的使用場(chǎng)景：提高效率｜體驗(yàn)交流｜價(jià)值創(chuàng)造提供多種多樣的自定義版本的智能體。

Kimi+針對(duì)辦公提效｜輔助寫作｜社交娛樂｜生活實(shí)用的特定場(chǎng)景提供各種各樣的智能體。同樣類似的還有文心一言、360AI、通義千問等。

而豆包比較有趣，在網(wǎng)頁端，還比較正經(jīng)，推薦了一些跟提效創(chuàng)作有關(guān)的智能體。

而到了手機(jī)端，豆包自己本身變成了一個(gè)幾乎和其他智能體權(quán)重平等的應(yīng)用，發(fā)現(xiàn)頁中推薦了各種各樣的情緒體驗(yàn)型智能體，主打和各種各樣的明星和數(shù)字人聊天、打電話、談戀愛、玩游戲，獲得陪伴體驗(yàn)。

在集體AI平臺(tái)都在卷AI硬知識(shí)技能時(shí)，豆包選擇了將AI和娛樂掛鉤起來，讓AI產(chǎn)品變得有趣，在年輕人的荷爾蒙中發(fā)酵，這是互聯(lián)網(wǎng)流量思維的玩法。

三、分析模塊

在分析模塊，當(dāng)前主流大模型盡管在語言理解和文本生成上表現(xiàn)優(yōu)異，但仍然在一些方面體驗(yàn)不佳：大模型回復(fù)等待時(shí)間長(zhǎng)；不允許打斷、插話；存在幻覺等。我將從這三點(diǎn)聊聊體驗(yàn)設(shè)計(jì)在其中的應(yīng)用。

減少等待焦慮

在過去的加載頁面等待研究中，我們有這樣的共識(shí)：用戶等待頁面加成功時(shí)的耐心程度一般在2-3秒范圍內(nèi)，GooGle研究顯示，大約53%的移動(dòng)設(shè)備用戶會(huì)在加載超過3秒時(shí)離開，每增加1秒延遲，用戶轉(zhuǎn)化率可能下降7%或更多，過長(zhǎng)的等待時(shí)間會(huì)讓用戶感到不耐煩。

耐心時(shí)間范圍

0-2秒：最佳用戶體驗(yàn)，加載速度快的頁面會(huì)顯著提升用戶滿意度。
3-5秒：用戶的注意力開始下降。如果加載時(shí)間超過這一范圍，可能會(huì)導(dǎo)致用戶放棄。
6秒以上：用戶放棄的可能性顯著增加。研究顯示，大約53%的移動(dòng)設(shè)備用戶會(huì)在頁面加載超過3秒時(shí)離開。

因此，過去如果系統(tǒng)加載慢，用戶體驗(yàn)師會(huì)設(shè)計(jì)加載動(dòng)畫或進(jìn)度條，優(yōu)先加載關(guān)鍵內(nèi)容等方式來延長(zhǎng)用戶耐心，生成式AI平臺(tái)也通過類似的方法來提升用戶體驗(yàn)。

ChatGPT通過逐步每次都將生成的部分內(nèi)容展示出來，使用戶可以邊閱讀部分邊生成來延長(zhǎng)用戶的忍耐程度。如果你在python中調(diào)用過大模型的API的話，大模型只會(huì)在生成所有文本后返回結(jié)果。你會(huì)發(fā)現(xiàn)大模型在生成長(zhǎng)文本的時(shí)間其實(shí)還蠻長(zhǎng)的。

通義千問和秘塔搜索通過展示加載分段式進(jìn)度條來告知用戶任務(wù)完成程度，降低時(shí)間感知，避免不確定等待。進(jìn)度條的存在也能顯示系統(tǒng)正在正常工作，增強(qiáng)用戶對(duì)平臺(tái)的信任。

Gemin通過logo動(dòng)畫，更加自然的淡入淡出刷新文字的加載動(dòng)畫，來進(jìn)一步體現(xiàn)所搭載的大語言模型性能

提供打斷工具

不允許打斷插話這一點(diǎn)當(dāng)前業(yè)內(nèi)普遍做法都是提供停止輸出工具，功能大多也大同小異。

不過最新的ChatGpt提供的畫布模式，支持了對(duì)分析結(jié)果的具體內(nèi)容進(jìn)行進(jìn)一步地編輯，引導(dǎo)用戶進(jìn)一步細(xì)化結(jié)果。

強(qiáng)化安全意識(shí)

由于大模型的黑箱特性，盡管RAG等數(shù)據(jù)投喂技術(shù)在一定程度上減少了大模型的幻覺，但當(dāng)前業(yè)界最好的大模型推理一致性在97%左右，幻覺度約3%，距離ToB/ToH領(lǐng)域的規(guī)模應(yīng)用，如網(wǎng)絡(luò)規(guī)劃、儀表和電器精準(zhǔn)控制尚有差距。故AI生成能力本身的可信任度依然是需要擔(dān)憂的事情。為此，在用戶體驗(yàn)層面，設(shè)計(jì)的核心點(diǎn)在于增加大模型生成結(jié)果的客觀性。

降低信任預(yù)期

大模型需要告訴用戶生成的內(nèi)容僅具有參考性，也可能會(huì)犯錯(cuò)，通常會(huì)在界面對(duì)話框底部強(qiáng)調(diào)。

增加生成內(nèi)容客觀性

通過RAG、LanGChain等技術(shù)與搜索引擎結(jié)合，從多個(gè)來源提取關(guān)鍵信息，實(shí)時(shí)檢索和驗(yàn)證，生成綜合性的回答，減少“幻覺”現(xiàn)象，提升答案的準(zhǔn)確性和可信度。

四、輸出模塊

在輸出模塊，我想聊聊大模型的記憶、反饋、多模態(tài)輸出的體驗(yàn)設(shè)計(jì)。

記憶

如果用python調(diào)用過大模型的API的話，我們會(huì)意識(shí)到大模型本身是沒有記憶的。但是在與用戶的對(duì)話中，平臺(tái)會(huì)將當(dāng)前會(huì)話的上下文信息作為輸入模型的一部分，利用注意力機(jī)制處理這些信息，從而生成與上下文相關(guān)的響應(yīng)，使得模型能夠在單詞對(duì)話中保持對(duì)近期信息的記憶，從而提供連貫的回答。

然而，大模型的上下文窗口長(zhǎng)度是有限的，通常在數(shù)千個(gè)標(biāo)記（toKens）范圍內(nèi)。這意味著當(dāng)對(duì)話長(zhǎng)度超過上下文窗口的容量時(shí)，早期的信息可能會(huì)被遺忘或忽略。技術(shù)層面研究人員為此提出了多種方法來增強(qiáng)模型的記憶能力。比如循環(huán)記憶、引入外部存儲(chǔ)機(jī)制等，但仍然存在一定的局限性。

于是我觀察到了針對(duì)這一場(chǎng)景的體驗(yàn)設(shè)計(jì)：

ChatGpt提供了歸檔功能，通過歸檔功能，ChatGpt可以記住用戶在之前對(duì)話中的偏好、習(xí)慣或重要信息（如興趣愛好、工作方向），從而更接近用戶的需求。

Kimi/通義千問/文心一言則通過設(shè)置常用語功能來應(yīng)對(duì)可能出現(xiàn)短期記憶突然失效的情況。

反饋

說了這么多，生成式AI平臺(tái)的核心競(jìng)爭(zhēng)力說到底依然是大模型本身的推理能力，如今的大模型依然容易繼承和放大訓(xùn)練數(shù)據(jù)中存在的偏差，AI大模型難以避免會(huì)寫出看似合理但不正確或荒謬的答案。大模型開發(fā)過程中很重要的環(huán)節(jié)是數(shù)據(jù)標(biāo)注，會(huì)耗費(fèi)大量的人力物力，ChatGpt的問世離不開背后大量工程師對(duì)模型數(shù)據(jù)微調(diào)校正標(biāo)注的努力。

同時(shí)，AI平臺(tái)的模型能力的增強(qiáng)也需要用戶的反饋，通過每天用戶海量的生成結(jié)果，從反饋給平臺(tái)以進(jìn)一步優(yōu)化模型推理能力。越強(qiáng)推理能力的大模型平臺(tái)擁有越多的用戶，越多的用戶越增強(qiáng)大模型推理平臺(tái)的能力。

而這個(gè)反饋入口就在輸出結(jié)果的下方，用戶可以點(diǎn)擊喜歡/不喜歡進(jìn)行問題反饋，幾乎所有的AI平臺(tái)都有這個(gè)看似不起眼，但非常重要的功能。

多模態(tài)輸出

盡管可能我們認(rèn)知里的大語言模型平臺(tái)更多是專注于文本類型輸出，我觀察到國(guó)內(nèi)外很多的大模型平臺(tái)都在往多模態(tài)生態(tài)方向打造，大語言模型正在和文生圖、數(shù)字人、機(jī)器人、文生視頻、內(nèi)容理解、文本處理、社區(qū)等功能融合。背后的邏輯比較復(fù)雜，我將在下一個(gè)模塊再聊。

總結(jié)

AI的發(fā)展雖然很快，但也是經(jīng)歷了漫長(zhǎng)的過程，再偉大的創(chuàng)新，也會(huì)基于人們過往經(jīng)驗(yàn)的總結(jié)。技術(shù)再?gòu)?qiáng)大，也是服務(wù)于人的，AI應(yīng)用的風(fēng)在互聯(lián)網(wǎng)上吹了一陣又一陣，但殺手級(jí)的AI應(yīng)用到目前為止仍未出現(xiàn)；場(chǎng)景不夠匹配，AI的局限性依然是擋在AI應(yīng)用路上的大山。

作為一個(gè)從業(yè)4年的交互設(shè)計(jì)師，我的心情無比復(fù)雜，不知道多少人和我一樣，眼看著所謂的大機(jī)遇就在眼前，但自己卻無力乘風(fēng)，內(nèi)心無比焦慮。外面都在說AI將顛覆整個(gè)互聯(lián)網(wǎng)，又說所有的互聯(lián)網(wǎng)產(chǎn)品都可以用AI重做一遍，擔(dān)心自己的飯碗不保，擔(dān)心自己跟不上時(shí)代的浪潮。但要我說，人們?cè)诿鎸?duì)未知時(shí)總是會(huì)放大恐懼，這些都不必過分擔(dān)心。

丘吉爾有一句話：如果你到了地獄，那就繼續(xù)保持前行。

讓我們繼續(xù)前行吧，朋友！

本文由 @為美好而設(shè)計(jì) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可，禁止轉(zhuǎn)載

題圖來自Unsplash，基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App