大語言模型下的趨勢預(yù)測:大模型的形態(tài)預(yù)測、交互變化、應(yīng)用趨勢

Bay
0 評論 6962 瀏覽 23 收藏 16 分鐘

自從ChatGPT發(fā)布之后,大語言模型一時成為新的風(fēng)口,不論國內(nèi)國外,大家都在部署自己的LLM模型。本質(zhì)上LLM是一個可以在眾多領(lǐng)域使用的模型,但大家都這么玩,容易成為垂直領(lǐng)域的產(chǎn)品。還是說有更好的發(fā)展方向呢?這篇文章,作者為我們解讀,希望對你有所幫助。

本篇圍繞大模型在生態(tài)中的形態(tài)預(yù)測、大模型帶來的交互變化、應(yīng)用層產(chǎn)品可能性、投身 AI 產(chǎn)品的建議聊了聊~歡迎閱讀交流~

一、大模型未來會成為?

關(guān)于 LLM 的猜想眾多,有說大模型可能成為下一代操作系統(tǒng)的,有說可以成為新一代底層技術(shù)設(shè)施、有說可以成為萬物終端的。這里的出發(fā)點主要在于對大模型未來形態(tài)的思考。

我的判斷是首先 LLM 帶來的能力會作為底層通用技術(shù)對上層軟硬件產(chǎn)生影響,同時會出現(xiàn)一群圍繞大模型基礎(chǔ)能力構(gòu)建的生態(tài),也就是很多文章中說的「中間件」和「Apps」。

這里順帶解釋下很多文章中出現(xiàn)的「中間件」和「AI Infra」的含義。

AI中間件,是指在AI應(yīng)用程序和底層基礎(chǔ)設(shè)施之間提供中介服務(wù)的軟件,包括模型訓(xùn)練框架、推理引擎、數(shù)據(jù)處理工具等,它們可以提供人工智能應(yīng)用程序所需的功能和服務(wù),同時簡化了開發(fā)和部署過程。

Infra(Infrastructure),是指基礎(chǔ)設(shè)施或基礎(chǔ)架構(gòu),在大模型的生態(tài)系統(tǒng)中,Infra通常指的是為支持大模型訓(xùn)練和部署而構(gòu)建的各種底層技術(shù)設(shè)施,包括處理器、操作系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、云計算平臺等等。

AI Infra 是提供 AI 中間件所需要的底層基礎(chǔ)設(shè)施的一部分。

一些公司的大模型會作為終端能力接入各種軟硬件設(shè)備,這里最容易實現(xiàn)的有 Google、微軟、蘋果(雖然還沒有自己的大模型)、華為、百度這樣的公司。

大模型的競爭也將帶來操作系統(tǒng)、軟件市場、終端市場(特別是極度依賴多模態(tài)交互輸入、輸出的設(shè)備,如音箱、手表、車載 HMI、MR)的競爭格局變化,

但 LLM 本身很難獨立成為 OS 級別的系統(tǒng),這受限于幾點:

  • 純 CUI/VUI 的交互輸入局限性、人們還是需要鼠標、(軟、硬)鍵盤這樣的設(shè)備輔助輸入;
  • 輸入產(chǎn)生精力消耗,娛樂性質(zhì)的刷推薦 feeds、訂閱流仍會是大部分人的主要訴求;
  • 來自當(dāng)前 OS 系統(tǒng)的防御,也就是上面提到的巨頭公司們;
  • 開放的平臺和生態(tài)建立難:成為 OS 級別的系統(tǒng)需要有足夠的開放性和可擴展性,以支持不同類型的應(yīng)用和場景。需要有完善的生態(tài)系統(tǒng)和開發(fā)者社區(qū)的支持,才能吸引開發(fā)者輕松地創(chuàng)建和集成;
  • 短時間內(nèi)難以形成一家獨大的局勢:不論國內(nèi)還是國外,投身LLM戰(zhàn)場廝殺的巨頭有很多,未來幾年內(nèi)很難如 PC、手機操作系統(tǒng)形成部分頭部穩(wěn)定主導(dǎo)的場面,開發(fā)者也就不會專注在一個模型上做能力補充,而是更傾向于做獨立的,不完全依附單個LLM能力的產(chǎn)品(也就是傾向于做 API 可換甚至接入多個 API 的應(yīng)用而非為單個 LLM 建立 Plugin)

Perfect Prompt — 能夠給出不同模型在同一場景下的回復(fù)。

也許會有人做這個方向,純 LLM 的 OS 系統(tǒng) 受眾和應(yīng)用場景都比較受限。

以上判斷基于當(dāng)前的 AI 能力,也僅代表個人見解,如有不同看法歡迎討論~

二、大模型帶來的交互變化

判斷的基本邏輯在于:

  • 交互的本質(zhì)是輸入和輸出,大模型并沒有帶來信息格式的變化,而是加速了信息的生產(chǎn)和交流。
  • 大模型帶來的能力強化主要有文本(這里如果不局限于LLM,就還有圖像、視頻)理解能力、文本生成能力、總結(jié)和歸納能力、翻譯能力等。

1. 交互鏈條變短

這也是自然語言交互被增強帶來的最顯著優(yōu)勢,這點能夠直接打破現(xiàn)有產(chǎn)品交互的局限性?;蛘咻o助用戶決策、完成機械的流程化任務(wù)。

表現(xiàn)1 – 輸出結(jié)果:不用通過搜索在眾多的反饋中找目標,而是直達結(jié)果。

對應(yīng)場景:任何使用搜索的任務(wù),機票、酒店、某個解決問題的答案等。

表現(xiàn)2 – 輸入內(nèi)容:多個意圖能夠被一次性處理,縮短中間流程。

對應(yīng)場景:總結(jié)所有參會人的空閑時間,尋找合適的會議室,生成一場新的會議邀請。

也就是說,傳統(tǒng)設(shè)計領(lǐng)域致力于在有限的條件下幫助用戶梳理到達目的地的最佳路徑,為用戶清除流程上的障礙。而現(xiàn)在可以通過AI技術(shù)去大幅優(yōu)化現(xiàn)有產(chǎn)品的交互流程,同時縮短輸入和輸出過程,對傳統(tǒng)的交互方案帶來顛覆性的改善。

不過我對「產(chǎn)品 CUI 化」也保持謹慎,CUI 只是降低了一定的門檻,“持續(xù)對話”其實非常耗費腦力和精力,如果能點個按鈕就完成的事情,要 CUI 反而會將問題復(fù)雜化。

2. 改變輸入方式

更多場景可以轉(zhuǎn)變?yōu)?CUI、甚至 VUI 。

案例1:在一些政務(wù)服務(wù)場景,如果能夠通過對話的方式一步步引導(dǎo)填寫,對老年群體會更友好,同時填寫方式可以簡化成語言輸入;

復(fù)雜表單填寫中的一些錯誤提示也許可以通過對話的方式引導(dǎo)補充。

案例2:Prompt 命令生成圖像/視頻/音樂

Adobe firefly beta

但是目前看來,受限于大模型應(yīng)用的理解能力,用戶輕松駕馭 Prompt 還存在門檻(即弄清楚自己的需求 并懂得如何用 prompt 表達需求),輸入方式還沒有得到極致的簡化和易用。不過已經(jīng)有一些應(yīng)用開始補齊這方面的體驗。

Hayo —— 米哈游旗下AI社區(qū)

3. 信息反饋更多維

Chat GPT 已經(jīng)可以將信息組成新的格式,如表格、代碼等;GPT 4 能夠直接理解并處理圖像上的文本信息。

而 Meta 最新開源的 ImageBind,綁定了文字、聲音、圖像、深度、溫度、IMU 六種數(shù)據(jù)??蓪崿F(xiàn)音頻生成圖像、圖像生成音頻等,未來應(yīng)用的想象空間應(yīng)該會更大。(不過官網(wǎng)并沒有看到溫度、IMU 相關(guān)的案例…)

Meta ImageBind

4. 終端能力得到加持

這點也是基于前兩點即信息輸入方式和信息反饋的。未來大模型在音箱、手表、車載 HMI、MR 這些設(shè)備上的使用價值巨大。

最直接的價值則是強化語音助手的能力。

另外就是和具體的應(yīng)用結(jié)合,比如結(jié)合 Camera :通過檢測畫面信息,給出照片拍攝改進建議(角度、構(gòu)圖、參數(shù)設(shè)置等),不會拍照的男朋友們再也不用擔(dān)心被罵了…

大模型能力和傳感器能力的整合也更值得期待,比如根據(jù)實時運動信息、心率給出接下來的運動規(guī)劃。

5. 對工具類產(chǎn)品的沖擊大于內(nèi)容消費型產(chǎn)品

這點是從用戶信息獲取訴求上來判斷的,畢竟娛樂內(nèi)容消費場景更多的考慮不是效率而是多巴胺,而對于生產(chǎn)、工作場景,提升效率是核心指標。

從 Notion、釘釘?shù)葢?yīng)用中,大模型已經(jīng)開始對人們的工作流程產(chǎn)生正向影響,逐步減輕知識記憶、寫作、摘要、信息查找等流程化的工作。

6. 豐富C端場景

場景1:私人助理也許會成為可能,大模型通過調(diào)用所有應(yīng)用接口(日歷、郵件、行程等)獲取個人信息,成為私人顧問。

場景2:CUI 生成圖像/視頻/音樂的能力可以在各種活動玩法中發(fā)揮作用。

也許以后的網(wǎng)易云年度總結(jié)就會根據(jù)聽歌習(xí)慣生成一首符合你個人品味的音樂。加入一些簡單的用戶操作,人人都是「網(wǎng)易云音樂人」。

7. 廣告推薦形態(tài)產(chǎn)生變化

搜索、信息流為主的場景,變?yōu)槿谌雴柎?,做到更精準、高效的廣告分發(fā)。

就拿比較好商業(yè)化的美妝行業(yè)來說,假設(shè)淘寶對李佳琪做直播內(nèi)容分析和訓(xùn)練,做出了個 AI 版李佳琪,支持用戶通過問答的形式獲得商品推薦。專業(yè)背景+人設(shè)背書,一定不缺用戶,品牌商也會更愿意砸錢。

三、 這波大爆發(fā)中看到產(chǎn)品的哪些可能性?

判斷邏輯是,應(yīng)用前景、用戶需求程度、成本和商業(yè)化能力。可預(yù)見的是大模型研發(fā)成本太高,中小企業(yè)或團隊會專注在 AI 中間件、AI 應(yīng)用上發(fā)力。

這里我們聚焦應(yīng)用層看看。

1. 和現(xiàn)有產(chǎn)品的結(jié)合,快速且可預(yù)見的收益大

近期所有工具類產(chǎn)品都在發(fā)力,比較實用的有 Notion、釘釘。

2. 部分方向值得基于LLM的能力重構(gòu)

如搜索、語音助手(近期出現(xiàn)最多的 C 端應(yīng)用就是不同 character 的 Chatbot )、翻譯工具(可以舉例插件)、教育產(chǎn)品(語言、課程的私教方向很快就能出現(xiàn)頭部應(yīng)用)。

3. 助力超級個體,提升知識生產(chǎn)效率

如果說面向大眾的 AI 產(chǎn)品難商業(yè)化,那么考慮為第一批使用AIGC產(chǎn)品的人群提供服務(wù)也是個不錯的想法,受眾群體更聚焦,服務(wù)更剛需,也更容易產(chǎn)生付費轉(zhuǎn)化。這個方向近期已經(jīng)涌現(xiàn)了一批此類產(chǎn)品,比如協(xié)助開發(fā)、快速接入大模型 API、快捷創(chuàng)作 AI 產(chǎn)品、為自己的網(wǎng)站接入客服等。

此外,做輔助文字、圖像、視頻、音樂生產(chǎn),提高文字、設(shè)計、創(chuàng)作者的生產(chǎn)效率也是不錯的方向。游戲領(lǐng)域已經(jīng)有很多產(chǎn)品輔助 AI 生成角色、視頻、音樂、腳本提升游戲開發(fā)效率。

4. To C 個性化定制變得更重要

旅行、學(xué)習(xí)、購物、讀書等領(lǐng)域可以根據(jù)用戶訴求量身定做。

應(yīng)用層的詳細案例將在下一篇《番外篇》中展示。

四、投身 AI 產(chǎn)品的建議

1. 大量產(chǎn)品服務(wù)會持續(xù)涌現(xiàn),原因是個人開發(fā)者能力得到了第一批 AIGC 產(chǎn)品的加持,未來同賽道將涌現(xiàn)多個相似解決方案,做產(chǎn)品會逐漸從拼創(chuàng)意到拼速度、產(chǎn)品服務(wù)質(zhì)量和拼持久力。

2. 加深產(chǎn)品壁壘:

  • 場景和訴求的準確洞察仍應(yīng)被擺在首要位置,這將決定產(chǎn)品起跑線。
  • 考慮規(guī)模效應(yīng)帶來的價值,比如一些 Prompt 文案、AI 圖片分享平臺未來有成為AI社區(qū)的潛質(zhì)。
  • 考慮該場景用戶規(guī)模、使用頻次、消費時長,大模型能力出現(xiàn)前是否已經(jīng)有較成熟的解決方案。
  • 提前考慮商業(yè)化問題(瞄準剛需人群和場景解決問題)。
  • 避免功能受到大模型能力升級帶來的沖擊。

3. 當(dāng)精力和資源不足時,先深入某個場景解決小問題也是不錯的選擇,熟悉的領(lǐng)域扎根深挖反而能發(fā)現(xiàn)與眾不同的視角(如 Figma 插件 Magician ,只解決 UX 設(shè)計場景,提供文字描述生成圖標、UX 文案優(yōu)化能力)

相關(guān)參考文章推薦:

這篇寫的很好,我深度看了兩遍:

https://mp.weixin.qq.com/s/PDHWfclMVQrS-2MLCbDm0g?from_wecom=1

超級應(yīng)用出現(xiàn)和平臺的新特性息息相關(guān)」的一些結(jié)論可以引發(fā)思考:

https://mp.weixin.qq.com/s/RXgiIb7oqWmTysffMYim9Q?from_wecom=1

https://mp.weixin.qq.com/s/kjWScZshPAS61053GopJhg

關(guān)于 AI 產(chǎn)品商業(yè)化:

https://mp.weixin.qq.com/s/k16ZtaA-b0fPh-25ftDddg

https://mp.weixin.qq.com/s/wWWG

作者:Bay,騰訊體驗設(shè)計師,公眾號:Bay的設(shè)計奧德賽

本文由 @Bay 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
13837人已学习13篇文章
产品体验报告,是体验者在深入了解某个产品的商业模式、使用场景、产品功能等方面后,所作出的先有深度再到广度的图文分析报告。本专题的文章分享了不同产品的体验报告。
专题
34709人已学习13篇文章
有多少用户痛点,你是听回来的,而不是经过深思过后找出来的。
专题
33705人已学习16篇文章
信息流背后有着怎样的逻辑和策略?
专题
15279人已学习12篇文章
本专题的文章分享了互联网金融风控体系的设计指南。
专题
12881人已学习11篇文章
在工作中我们会跟客户/boss/用户等人对接需求,并把需求交付给设计师/开发等人,那么应该怎么做呢,本专题的文章分享了如何对接和交付需求。