誰在布局生成式AI?
本文概述了生成式人工智能(Generative AI或AIGC)的起源和發(fā)展歷程,特別強調(diào)了文生圖應用和ChatGPT對其發(fā)展產(chǎn)生的重要推動作用,并從大模型生態(tài)構(gòu)建和行業(yè)應用兩個方面剖析了其商業(yè)應用前景和技術(shù)挑戰(zhàn)。
縱覽生成式人工智能(Generative AI或AIGC,兩種表述均可,國內(nèi)更多用AIGC)進化史。從AI誕生之始,人們就試圖讓機器生成內(nèi)容,與其對話,并誕生了最早的圖靈測試標準。
多年來,生成式AI的發(fā)展一直不溫不火。直到去年Midjourney、Stable Diffusion等文生圖應用點燃了大眾的熱情,再到11月ChatGPT的橫空出世,更是引發(fā)了現(xiàn)象級熱潮,讓生成式AI走入了億萬用戶的視野。
本文結(jié)合國際企業(yè)實踐經(jīng)驗,從大模型生態(tài)構(gòu)建方式、行業(yè)應用的切入路徑這兩個視角切入,描繪生成式AI的行業(yè)應用版圖,分享我們初步的觀察與思考。
一、大模型的生態(tài)
1. 模型即服務(MaaS)的新生態(tài)加速形成
結(jié)合目前行業(yè)“基礎設施層-模型層(MaaS)-應用層”三層結(jié)構(gòu),我們預計未來可能形成一個模型即服務(MaaS)的新生態(tài)。
自下而上,三層結(jié)構(gòu)的構(gòu)成如下:
- 基礎設施層:GPU芯片、AI芯片、超級計算機等算法基礎設施,以及機器學習框架、云操作系統(tǒng)等軟件。
- 模型層(MaaS):通用AI大模型,以及基于大模型在垂直領(lǐng)域訓練生成的行業(yè)模型(中間層),即在預訓練AI大模型基礎上,可以快速微調(diào)或使用嵌入等方式、開發(fā)出場景化、定制化、個性化的中小模型,實現(xiàn)在不同行業(yè)、垂直領(lǐng)域、功能場景的工業(yè)流水線式部署,同時兼具按需使用、高效經(jīng)濟的優(yōu)勢。
- 應用層:AIGC技術(shù)面向終端用戶帶來的新的功能、產(chǎn)品、服務和應用等;正如之前的“互聯(lián)網(wǎng)+”一樣,“AIGC+”或者說“AI+”將來有望和各行各業(yè)深度結(jié)合,持續(xù)帶來新的應用形式。未來,一方面,現(xiàn)有的APP都可以用大模型重做一遍,另一方面,還會出現(xiàn)更多新的AI原生類APP,從而誕生更多新的獨角獸甚至巨頭企業(yè)。
2. 大模型走向通用性和垂直性并重的縱深布局
在AIGC技術(shù)應用布局上,通用性和垂直性并重。
所謂“通用性”指的是橫向能力,適用于各個行業(yè),具體而言包括語義多輪對話、知識庫構(gòu)建、智能搜索、企業(yè)級RPA、多模態(tài)內(nèi)容生成、代碼生成等方面:
- 語義多輪對話:AIGC技術(shù)在語義多輪對話中發(fā)揮著巨大的優(yōu)勢,尤其是在高客單價銷售和私域交流場景下。例如,直播話術(shù)中,AIGC能夠迅速學習并掌握最佳實踐,如各類Chatbot和IQ for sales。
- 知識庫構(gòu)建:AIGC技術(shù)從簡單的資料概括整理發(fā)展到幫助用戶閱讀理解、生成個性化資料庫,以及基于高效資訊歸納的新搜索功能。這使得AIGC既可應用于企業(yè)級人工智能,也可成為個人助理(如Mem)。
- 智能搜索:AIGC在智能搜索領(lǐng)域的應用也取得了顯著成果,如New Bing、Perplexity等。凡積累了知識庫的系統(tǒng),都可以借助AIGC實現(xiàn)語義搜索功能。
- 企業(yè)級RPA(Robotic Process Automation):結(jié)合LLM(Large Language Models)技術(shù)和RPA,AIGC在企業(yè)級應用中發(fā)揮著重要作用。典型應用包括微軟的Copilot以及CRM領(lǐng)域的Salesforce等,它們緊密結(jié)合行業(yè)場景,為用戶賦能。
- 多模態(tài)內(nèi)容生成:在智能寫作助手、廣告主視覺創(chuàng)作、智能NPC等領(lǐng)域,AIGC技術(shù)帶來了創(chuàng)新應用,除了文字,還可以生成圖片、視頻,甚至3D數(shù)字內(nèi)容。
- 代碼生成:代碼作為一種更標準化的文本,AIGC在代碼生成方面具有巨大潛力,如GitHub Copilo已經(jīng)有很不錯的表現(xiàn),在這個領(lǐng)域,正在有更多的代碼生成工具出出現(xiàn),有望大幅提升碼農(nóng)的生產(chǎn)力,也為普通的非技術(shù)工作者提供了更為便捷的工具,大幅降低了編程門檻。
所謂“垂直性”指的是縱向能力,通過對不同行業(yè)Know-how的學習,AIGC技術(shù)可以進化為行業(yè)專家,從而大幅加速各行業(yè)的數(shù)字化轉(zhuǎn)型。
結(jié)合國外企業(yè)的投融資信息,我們列舉了醫(yī)療、金融、零售和制造幾個行業(yè)的典型例子:
- 醫(yī)療(Zebra Medical Vision ,Aidoc 等使用AGI進行醫(yī)學圖像分析)。
- 金融(Bloomberg發(fā)布Terminal AI大模型提供金融智能化服務)。
- 零售(Stitch Fix 等公司使用生成式人工智能來實現(xiàn)個性化購物體驗、庫存管理和需求預測)。
- 制造(通用電氣等公司利用生成式人工智能優(yōu)化生產(chǎn)流程、預測性維護和供應鏈管理)。
3. 國外科技企業(yè)紛紛“卷”出了新高度
在OpenAI的直接帶動(微軟)或刺激(谷歌等)下,大模型已經(jīng)成為巨頭軍備競賽新的殺手锏。不僅加速大煉“大模型”,還在原有的產(chǎn)品中快速加入大模型的能力,以期在新的范式轉(zhuǎn)換和技術(shù)浪潮中占得先機。
先是5月初,谷歌I/O大會推出PaLM2大模型,其對話產(chǎn)品Bard未來也能像ChatGPT一樣,接入網(wǎng)絡,實時搜索網(wǎng)頁。同時推出Duet AI,給谷歌的辦公套件Workspace全新升級。
近日,微軟開發(fā)者大會則推出了Windows Copilot,打造每個人的AI助手。
Windows Copilot將直接集成到Windows 11中,在所有應用和程序中都可使用,就像我們在Edge、Office程序和GitHub中看到的Copilot側(cè)邊欄一樣。
除了傳統(tǒng)科技巨頭,創(chuàng)業(yè)企業(yè)同樣表現(xiàn)出極高的市場活力和技術(shù)實力,各模態(tài)應用快速落地,爆款產(chǎn)品不斷推出。
隨著技術(shù)不斷演進,尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商業(yè)化在多個領(lǐng)域開始落地,其中代碼生成、文本生成、圖像生成、音視頻/游戲等領(lǐng)域已有不少爆款級產(chǎn)品。
- 代碼領(lǐng)域,Github推出的Copilot用戶量破百萬。
- 文本領(lǐng)域,微軟已經(jīng)在Bing和Dynamic365等應用已接入ChatGPT/GPT-4接口。
- 圖像領(lǐng)域, Stable diffusion等文生圖應用已突破千萬級用戶量。
- 音視頻/游戲領(lǐng)域,起步較晚,對模型和算力要求更高,出現(xiàn)了不少Start-up。
更多頭部企業(yè)創(chuàng)新產(chǎn)品和解決方案可參見下表:
4. 大模型生態(tài)合作的5種典型方式
目前,大模型可能的生態(tài)合作和商業(yè)模式正在漸次展開,我們梳理了主要的5種。
其中API調(diào)用和插件是大多數(shù)公司接入大模型能力的主要方式。
1)API調(diào)用:大多數(shù)公司使用大模型的主要方式
在當前的技術(shù)環(huán)境下,API調(diào)用被廣泛應用于知識庫和客戶服務領(lǐng)域。
公司通過利用ChatGPT開放的Fine Tuning API,將自有的Knowledge Base(包括產(chǎn)品文檔、常見問答、客服歷史對話等)上傳到ChatGPT,從而建立私有模型。
值得注意的是,盡管如此,創(chuàng)業(yè)公司仍無法擁有該模型的所有權(quán)。
通過這種方式,ChatGPT的用戶可以擁有專屬的Chat Bot,它不僅具備常規(guī)對話功能,還可以利用企業(yè)自有、甚至非公開的訓練數(shù)據(jù)來提供高度針對性的服務。
以OpenAI的GPT-3/3.5/4為技術(shù)基礎,一些創(chuàng)新公司如QUANTUM ENGINE(類似Character.ai和Inworld,由創(chuàng)始人Jesse Lyu于2023年創(chuàng)建)旨在基于ChatGPT改善玩家體驗并提升生產(chǎn)環(huán)節(jié)效率。
這些公司通過引入開放式對話,重新探索NPC的價值,以提升沉浸感與交互方式。同時,實現(xiàn)了開放式游戲視覺引擎聯(lián)動的三個步驟:生成對話、行為與藍圖的自動化。
一個典型的示例是“當馬斯克想把特斯拉賣給比爾蓋茨”的Demo,該Demo展示了如何自由選擇角色并自動生成對話。價格方面,盡管不同類型、不同公司的定價方式各有千秋,但整體上大模型日益向生態(tài)擴展方向發(fā)展。
典型如OpenAI開放了GPT-4(純文本)、ChatGPT API和WhisperAPI(應用程序接口),允許開發(fā)者將ChatGPT集成至他們的應用程序和服務中。
2023年3月1日,OpenAI基于GPT 3.5 Turbo模型開放了ChatGPT API,API收費模式為0.002美元/1000tokens。相較于前一代開放接口GPT 3.5,性能更強的同時,價格下降90%,進一步加速了ChatGPT相關(guān)應用生態(tài)的發(fā)展。
2)插件模式:Plugin讓大模型有望成為新的OS
除API調(diào)用外,2023年3月24日,OpenAI公布了重磅消息:ChatGPT支持接入第三方插件,并一口氣上架了11個插件。
通過這些插件,用戶可以用ChatGPT購買商品,預定酒店、機票,搜索專業(yè)數(shù)據(jù)等,這大大解放了ChatGPT的生產(chǎn)力,為其發(fā)展帶來了更多的可能性。
這種插件模式為Plugin可能的應用方式和影響提供了豐富的發(fā)展前景。
總之,不管是作為操作系統(tǒng)還是應用商店,AI的轉(zhuǎn)折點已經(jīng)到來。
3)進一步的探討:機遇還是陷阱?護城河在哪里?
綜合上述API調(diào)用方式的分析,我們不禁產(chǎn)生一個靈魂之問:模型是OpenAI的,核心技術(shù)不在自己手里,AIGC應用層企業(yè)的護城河在哪里?
PitchBook調(diào)查數(shù)據(jù)顯示,僅在2022年,生成式AI(即AIGC)賽道就發(fā)生了78筆投資,總?cè)谫Y金額超過13.7億美元,幾乎相當于過去5年的融資總和。同期,出現(xiàn)了OpenAI、Stability AI、Jasper等估值超過10億美元的獨角獸。
預計2023年,生成式AI賽道的融資次數(shù)、額度將會更多。
然而,“GPT狂飆,AI投資突進,整個創(chuàng)投市場都熱得發(fā)燙。稀缺的公司分分鐘獨角獸,做大模型的人才出500萬年薪也難招,但與此同時,有的創(chuàng)業(yè)公司還沒來得及在市場上露出鋒芒,就已經(jīng)被一日千里的OpenAI拍倒在PPT階段,難以翻身”——AIGC應用層融資過熱,是否“虛假繁榮”?
換言之,ChatGPT“更強、更快、更便宜”了,現(xiàn)有應用還有市場嗎?
關(guān)于這個問題的回答我們將以Grammarly、Jasper.ai 的使用體驗及 Quantum-engine創(chuàng)始人的現(xiàn)身說法為例嘗試做出回答:
Q1: ChatGPT對Grammarly說:我干掉你,與你無關(guān)?
Grammarly為全球每天的3000萬用戶(包括50000個專業(yè)機構(gòu))提供語法校對服務。然而,在ChatGPT出現(xiàn)后,這一市場格局可能面臨挑戰(zhàn),據(jù)悉reddit、twitter 等地充滿了正在認真考慮退訂 Grammarly 。
Q2:Jasper“真香”,為什么?
Jasper支持各平臺廣告/博客圖文內(nèi)容生成,截至2022年12月底,Jasper付費用戶達到7萬,估值已達15億美元,旗下有多款產(chǎn)品接入GPT-3進行商業(yè)性文字創(chuàng)作。
雖然底層模型是OpenAI的(親測調(diào)整設問方式后可在ChatGPT中得到高度一致的營銷文案結(jié)果輸出,核心功能可替代),且Jasper定價更高。但截至目前Jasper的估值和用戶量并未受到影響,這引發(fā)了關(guān)于其發(fā)展和市場競爭力的思考。
A3:創(chuàng)始人視角:應用層壁壘在于前端用戶體驗
QUANTUM ENGINE 創(chuàng)始人表示ChatGPT在游戲行業(yè)的應用呈現(xiàn)出巨大潛力,包括游戲角色對話生成、劇情編寫、游戲元素創(chuàng)意等方面,為游戲開發(fā)者提供強大的支持。
作為對話生成應用,低延時性對用戶體驗至關(guān)重要,類似于在弱網(wǎng)條件下云視頻會議產(chǎn)品Zoom適當犧牲視頻質(zhì)量以優(yōu)先保障音頻流暢以保證用戶通話體驗。AIGC應用也需要關(guān)注此類需求,為用戶精準提供更舒適的前端用戶體驗。
由此觀之,行業(yè)應用層的獨特優(yōu)勢決定了未來百花齊放的生態(tài),深耕行業(yè)特性、優(yōu)化前端體驗才能應對大模型飛速迭代帶來的潛在危機。
二、行業(yè)應用的6類切入路徑
按用戶側(cè)類型劃分,生成式人工智能(AIGC)在C端和B端市場呈現(xiàn)出兩類路徑,其中C端已經(jīng)達到可用、甚至好用的臨界點,B端將從高價值先導領(lǐng)域向MaaS生態(tài)擴展。
1. C端市場已經(jīng)達到可用的臨界點
C端應用包括效率工具的下一代產(chǎn)品、游戲未來的新形態(tài)和制作新方式,以及為數(shù)字人、元宇宙、機器人等交叉領(lǐng)域帶來新空間。
此外,AIGC還帶來了內(nèi)容創(chuàng)作領(lǐng)域的大爆發(fā)。
2. B端市場,從高價值先導領(lǐng)域向MaaS生態(tài)擴展
1)生成式AI從效率角度切入,提升寫作和生產(chǎn)力。例如,會議、招聘、各類辦公助手(文檔助手、編程助手)等應用場景。
2)生成式AI在高價值領(lǐng)域如營銷、金融育等領(lǐng)域率先切入
以營銷為例,AIGC技術(shù)可以大幅降低創(chuàng)意成本、大量生成廣告素材和文案。Jasper作為市場上最為火爆的廣告、營銷圖文生成產(chǎn)品,在截至2022年12月底時,付費用戶達到7萬,2022年年收入7500萬美元,估值已達15億美元。
在金融領(lǐng)域中,AIGC應用探索方向集中在智能客服、智能投顧、商戶入網(wǎng)、欺詐檢測、智能營銷等領(lǐng)域。
然而,在算法風險、隱私保護、信息安全等方面仍然面臨較大的挑戰(zhàn)。
3)知識密集型領(lǐng)域蘊含著生成式AI應用的巨大潛力
在醫(yī)療領(lǐng)域,GPT-4作為一種醫(yī)學AI聊天機器人,在醫(yī)學領(lǐng)域的潛在應用方式主要包括醫(yī)療記錄、醫(yī)學知識和醫(yī)療咨詢,可以幫助醫(yī)護人員提升工作效率和患者問診體驗。
但它也存在局限性,并可能帶來系列潛在風險。
在教育領(lǐng)域的應用已較為成熟。以Duolingo為例,他們利用GPT-4推出了新產(chǎn)品“Duolingo MAX”學習平臺,提供了“解釋答案”和“角色扮演”兩項全新的AI功能。
在這些領(lǐng)域中,AIGC技術(shù)不斷拓展應用場景,為各行各業(yè)帶來了前所未有的效率提升和創(chuàng)新機遇。
但我們也應當關(guān)注到其中的挑戰(zhàn)與風險,確保技術(shù)在發(fā)揮潛能的同時,也能保障用戶的利益和安全。
除了千行百業(yè)的多模態(tài)應用,在B端市場,如下圖所示的模型層中AIGC技術(shù)業(yè)在逐漸圍繞頭部幾家大模型形成的MaaS生態(tài)發(fā)展:
三、進一步的探討
暢想未來,生成式人工智能將進一步與生產(chǎn)、生活深度融合。而大模型帶來的變革才剛剛開始。也特別歡迎大家聯(lián)系我們,一起探討大模型在行業(yè)應用主戰(zhàn)場落地的機會和挑戰(zhàn)。
1. 企業(yè)級RPA+大模型的AutoGPT方式可能顛覆現(xiàn)有的軟件模式
產(chǎn)業(yè)層面,企業(yè)級RPA(Robotic Process Automation)結(jié)合大模型的方式將在更多行業(yè)實現(xiàn)落地(譬如金融、零售、政府、制造、物流、地產(chǎn)、教育等),并財務,HR,客服等應用場景展現(xiàn)極為出色的能力,從而實現(xiàn)更高效的工作流程和業(yè)務處理。
譬如說AutoGPT已昭示Prompt 工程的下一個前沿,即便是非科班出身的小白,借助 AutoGPT不到 3 分鐘就能成功建立一個網(wǎng)站,完成一份詳實的市場調(diào)研也可以在彈指間輕松實現(xiàn)。
2. 組織變革和個人自雇等興起,將帶來應用軟件的全新革命
當一個人就能成為一支團隊,這將有可能誕生具有To C體驗的B端現(xiàn)象級產(chǎn)品。在產(chǎn)業(yè)變革的加速驅(qū)動下,未來在組織層面業(yè)將發(fā)生深刻變革,個人和小團隊模式可能成為重要形態(tài),引發(fā)To B和To C軟件的邊界進一步模糊……
當然這還只是我們的初步的思考,生成式AI技術(shù)影響下的未來勢必繼續(xù)顛覆我們的認知、持續(xù)突破想象的邊界,帶來生產(chǎn)力的新革命。無論如何,未來已呼嘯而至。
作者:白惠天,王強。
來源公眾號:騰訊研究院(ID:cyberlawrc),騰訊研究院是騰訊公司設立的社會科學研究機構(gòu)。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @騰訊研究院 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!