8個(gè)月過(guò)去了,中國(guó)大模型落地進(jìn)展如何?
在ChatGPT爆發(fā)之后,國(guó)內(nèi)外科技賽道都被掀起了巨大波瀾,隨后在國(guó)內(nèi)這段時(shí)間里,大量的大模型爭(zhēng)先恐后地出現(xiàn)。那么截止到現(xiàn)在,大模型在國(guó)內(nèi)土壤落地得怎么樣了?一起來(lái)看看本文的解讀。
距離ChatGPT爆發(fā)的那一天,已經(jīng)過(guò)去8個(gè)月了。
8個(gè)月的時(shí)間,中國(guó)諸多大模型拔地而起,以飛快的速度,不斷向各個(gè)行業(yè)場(chǎng)景滲透。但就目前為止,并未出現(xiàn)真正被大模型顛覆的場(chǎng)景或行業(yè)。
統(tǒng)計(jì)數(shù)據(jù)顯示,在大模型落地應(yīng)用中,45%的企業(yè)處于觀望階段、39%的企業(yè)處于探索可研階段、16%的企業(yè)處于試點(diǎn)應(yīng)用階段,而全面應(yīng)用的企業(yè)為零。
一個(gè)值得被看見的問(wèn)題是,如今在中國(guó)的土壤里,大模型的落地進(jìn)展究竟如何?
一、大模型落地,金融、能源先行
“請(qǐng)幫我查一下我今年8月份的用電量,以及哪天用電最多?”“幫我檢測(cè)一下這張圖片有什么缺陷”……在南方人工智能創(chuàng)新平臺(tái)上,通過(guò)語(yǔ)言交互,一項(xiàng)項(xiàng)數(shù)據(jù)清晰的被展現(xiàn)在眼前。
在這個(gè)平臺(tái)上,電力行業(yè)工作人員可以向電力大模型發(fā)布指令,讓其自動(dòng)生成數(shù)據(jù)處理結(jié)果,準(zhǔn)確識(shí)別缺陷場(chǎng)景的圖像細(xì)節(jié),幫助工作人員檢索處理電力巡檢過(guò)程中的數(shù)據(jù)。
目前,在南方電網(wǎng)客戶服務(wù)領(lǐng)域,60%的高頻問(wèn)題都可通過(guò)電力大模型解決,在識(shí)別客戶情緒波動(dòng)方面,電力大模型的效果甚至優(yōu)于人工。
此外,在輸配電領(lǐng)域,電力大模型已具備每分鐘處理100張問(wèn)題圖片的能力,還能同時(shí)識(shí)別20類缺陷,識(shí)別效率是傳統(tǒng)AI算法的10倍。
而在電力調(diào)度領(lǐng)域,電力大模型能夠協(xié)助調(diào)度部門針對(duì)電網(wǎng)異常情況快速自動(dòng)化生成處置預(yù)案,及時(shí)響應(yīng)電力市場(chǎng)調(diào)節(jié)要求,使預(yù)案更加安全、高效,成本更低。
這是大模型在能源領(lǐng)域落地的一個(gè)縮影。
據(jù)了解,部分能源頭部廠商已經(jīng)開啟了與科技公司在大模型應(yīng)用方面的合作,尤其在電網(wǎng)與礦山領(lǐng)域,形成了一些初步試點(diǎn)示范,如電網(wǎng)調(diào)度、缺陷/故障查詢、煤礦作業(yè)監(jiān)測(cè)等場(chǎng)景。
除了能源領(lǐng)域,金融領(lǐng)域也是目前大模型最大落地場(chǎng)景之一。
一份來(lái)自愛(ài)分析的報(bào)告中,也將能源、銀行列為了大模型落地進(jìn)展最快的兩大行業(yè)。
在金融領(lǐng)域的落地之廣,從大模型的數(shù)量和企業(yè)動(dòng)態(tài)也可見一斑。一組數(shù)據(jù)顯示,截止8月,國(guó)內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量高達(dá)116個(gè),其中金融行業(yè)大模型約18個(gè)。
此外,在半年報(bào)中,工商銀行、農(nóng)業(yè)銀行、中國(guó)銀行、交通銀行、招商銀行、中信銀行、興業(yè)銀行、華夏銀行、浙商銀行等9家銀行明確提出在探索大模型的應(yīng)用。
在大模型廠商側(cè),一些密集的行業(yè)模型發(fā)布也反映出金融場(chǎng)景落地的火熱程度。
例如5月下旬,度小滿發(fā)布了千億級(jí)中文大模型「軒轅」;6月份,騰訊云攜手神州信息開展金融大模型的合作,中國(guó)農(nóng)業(yè)銀行推出類ChatGPT的大模型應(yīng)用ChatABC,中國(guó)工商銀行發(fā)布了基于昇騰AI的金融行業(yè)通用模型。
7-8月,隨著《生成式人工智能服務(wù)管理暫行辦法》正式實(shí)施,包括騰訊、百度、科大訊飛、華為、字節(jié)跳動(dòng)等多家公司,又相繼釋放了最新的大模型進(jìn)展;9月,螞蟻集團(tuán)也正式發(fā)布了金融大模型,并開源生成式AI編程平臺(tái)CodeFuse。
金融領(lǐng)域,無(wú)疑是大模型落地的最多場(chǎng)景之一。
無(wú)論是能源領(lǐng)域還是金融領(lǐng)域,之所以能夠?qū)崿F(xiàn)大模型的領(lǐng)先落地,都源于這兩個(gè)行業(yè)的一些共性。
首先,能源和銀行業(yè)都是高度數(shù)據(jù)化的行業(yè),具有較好的數(shù)據(jù)基礎(chǔ)和數(shù)字化環(huán)境,這為大模型的訓(xùn)練和應(yīng)用提供了有利條件。
其次,兩大行業(yè)均有大量的數(shù)據(jù)處理和決策需求,而大模型的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)可以幫助行業(yè)解決這些難題,提高決策效率和準(zhǔn)確度。
再有,能源和銀行業(yè)的業(yè)務(wù)模式相對(duì)比較成熟,具有較高的商業(yè)價(jià)值,因此這些行業(yè)對(duì)大模型技術(shù)的需求也比較大,從而推動(dòng)了大模型的落地應(yīng)用。
可見,能源和銀行兩大行業(yè)在大模型落地進(jìn)展中相對(duì)較快,主要是由于其數(shù)據(jù)基礎(chǔ)好、技術(shù)需求大、商業(yè)價(jià)值高等多方面因素的綜合作用。
值得注意的是,即使在金融、能源這兩個(gè)落地場(chǎng)景中,大模型仍有一些目前難以跨越的難題。
二、達(dá)不到預(yù)期的場(chǎng)景價(jià)值
在金融行業(yè),營(yíng)銷、風(fēng)控、運(yùn)營(yíng)三個(gè)方向是諸多銀行關(guān)注較多的大模型應(yīng)用方向。
其中,智能問(wèn)答助手、智能客服、營(yíng)銷圖片自動(dòng)生成、貸后報(bào)告撰寫是當(dāng)下銀行等金融機(jī)構(gòu)積極布局的細(xì)分場(chǎng)景。但就目前而言,生成類場(chǎng)景如智能問(wèn)答助手、智能客服、營(yíng)銷圖片自動(dòng)生成等場(chǎng)景價(jià)值與預(yù)期相差無(wú)幾,但在如沉睡客戶喚醒、數(shù)字營(yíng)業(yè)廳這類決策、原生類應(yīng)用場(chǎng)景,大模型落地的預(yù)期和實(shí)際效果仍有差距。
例如在智能客服場(chǎng)景,過(guò)去智能陪練題庫(kù)少,缺少針對(duì)性。如今基于大模型生產(chǎn)個(gè)性化題庫(kù),可以縮短培訓(xùn)周期上;在營(yíng)銷圖片自動(dòng)生成場(chǎng)景,過(guò)去設(shè)計(jì)師在素材庫(kù)中選取并設(shè)計(jì),如今可以利用Midjourney自動(dòng)生成,可以降低版權(quán)成本和人力成本。
而在沉睡客戶喚醒和數(shù)字營(yíng)業(yè)廳場(chǎng)景價(jià)值預(yù)期中,前者利用大模型自動(dòng)生成策略,可實(shí)現(xiàn)端到端的策略改善喚醒效果;后者大模型支持的數(shù)字人幫助客戶辦理業(yè)務(wù)、推薦產(chǎn)品完成交易,可實(shí)現(xiàn)獨(dú)立于APP之外的新渠道。
然而,就目前來(lái)看,這兩個(gè)場(chǎng)景的實(shí)際應(yīng)用價(jià)值都尚未可知。
能源行業(yè)的大模型落地應(yīng)用亦相似之處。
在能源行業(yè),設(shè)備運(yùn)檢知識(shí)助手、智能客服等生成類應(yīng)用,場(chǎng)景價(jià)值與預(yù)期相差無(wú)幾。但在如檢修文檔、設(shè)備故障維修、電力負(fù)荷預(yù)測(cè)等場(chǎng)景,場(chǎng)景實(shí)際價(jià)值仍未可知。
具體來(lái)看,在設(shè)備運(yùn)檢知識(shí)助手場(chǎng)景,過(guò)去是基于NLP技術(shù)構(gòu)建結(jié)構(gòu)化知識(shí)庫(kù),在大模型的加持下,可利用大模型構(gòu)建運(yùn)檢助手,改善效率;在智能客服場(chǎng)景,過(guò)去是基于Bert模型的智能客服,如今利用大模型改善智能客服的用戶體驗(yàn),可實(shí)現(xiàn)意圖理解更準(zhǔn)確、語(yǔ)言更擬人化,用戶體驗(yàn)得到改善。
檢修文檔生成、設(shè)備故障維修、電力負(fù)荷預(yù)測(cè)場(chǎng)景中,大模型落地可帶來(lái)的價(jià)值分別是,快速自動(dòng)生成文檔實(shí)現(xiàn)效率提升;大模型快速定位故障原因,提供檢修建議和方案;納入更多影響因素實(shí)時(shí)預(yù)測(cè)負(fù)荷,提高預(yù)測(cè)準(zhǔn)確率。
然而,就目前來(lái)看,這些場(chǎng)景中大模型帶來(lái)的價(jià)值都尚未可知,仍需時(shí)間不斷探索。可以發(fā)現(xiàn)無(wú)論是金融行業(yè)還是能源行業(yè),生成類場(chǎng)景落地速度快,應(yīng)用較多,決策類場(chǎng)景落地速度較慢且難度較大,應(yīng)用較少。
三、“生成場(chǎng)景>決策場(chǎng)景”:難轉(zhuǎn)化的生產(chǎn)力
就目前而言,大模型的落地仍處于試點(diǎn)應(yīng)用階段,并非全面上線。
正如上文所言,金融行業(yè)的智能問(wèn)答、智能客服、數(shù)字營(yíng)業(yè)廳、貸后報(bào)告生成、沉睡客戶喚醒、金融產(chǎn)品推薦等AI大模型應(yīng)用已經(jīng)逐漸落地;能源行業(yè)的智能客服、設(shè)備運(yùn)檢知識(shí)助手、檢修文檔生成、電力系統(tǒng)仿真平臺(tái)、電力負(fù)荷預(yù)測(cè)等已經(jīng)試點(diǎn)應(yīng)用。
然而,消費(fèi)品零售、證劵、媒體還處于探索階段,此外制造業(yè)、藥企還處于觀望階段。
由此可見,大模型落地雖廣度上較為樂(lè)觀,但深度上卻較為艱難。
大模型落地的深度取決于其能力、規(guī)模、計(jì)算資源、數(shù)據(jù)質(zhì)量、領(lǐng)域知識(shí)等。然而,對(duì)于當(dāng)下的國(guó)內(nèi)大模型而言,處于發(fā)展初期,很多設(shè)施和能力還在逐步完善。
受限于模型能力、應(yīng)用效果等因素,當(dāng)前落地應(yīng)用以生成場(chǎng)景為主。
與決策大模型不同,生成式大模型主要應(yīng)用于文本生成、對(duì)話系統(tǒng)、語(yǔ)言翻譯等領(lǐng)域,通過(guò)分析大量文本數(shù)據(jù),學(xué)習(xí)文本的生成規(guī)律和內(nèi)在語(yǔ)義關(guān)系,從而能夠生成高質(zhì)量的文本輸出。生成式大模型的代表模型包括OpenAI的GPT系列和百度文心一言等。
而決策大模型主要應(yīng)用于推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)等領(lǐng)域,需要處理的數(shù)據(jù)通常包含連續(xù)的數(shù)值變量,而且需要做出決策或預(yù)測(cè)未來(lái)的行為。決策大模型的代表模型包括DeepMind的AlphaZero系列和OpenAI的Dota2 AI等。
相比決策大模型,生成式大模型首先在在文本生成和對(duì)話系統(tǒng)中,數(shù)據(jù)可以通過(guò)大量的文本語(yǔ)料庫(kù)進(jìn)行收集和整理,而在推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)中,數(shù)據(jù)通常需要人工設(shè)計(jì)和構(gòu)造,相對(duì)較為復(fù)雜。
其次文本生成和對(duì)話系統(tǒng)等領(lǐng)域的研究已經(jīng)比較成熟,有許多現(xiàn)成的算法和框架可以使用,而推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)等領(lǐng)域則需要更多的探索和研究。
再有文本生成和對(duì)話系統(tǒng)等領(lǐng)域的應(yīng)用場(chǎng)景非常廣泛,如搜索引擎、聊天機(jī)器人、自動(dòng)寫作等,而推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)等領(lǐng)域則主要應(yīng)用于電商、廣告、游戲等領(lǐng)域。
一個(gè)事實(shí)是,雖然生成類場(chǎng)景應(yīng)用較廣,但預(yù)測(cè)類決策場(chǎng)景是未來(lái)高價(jià)值場(chǎng)景。無(wú)論是大模型供應(yīng)商,還是企業(yè),想要基于大模型能力實(shí)現(xiàn)業(yè)務(wù)價(jià)值的提升,后者才是發(fā)力的方向。
四、行業(yè)場(chǎng)景中,再看AI大模型
大模型落地首先需要選擇合適的領(lǐng)域和場(chǎng)景。該領(lǐng)域場(chǎng)景有著較強(qiáng)的數(shù)字化能力和數(shù)字化基礎(chǔ)。
例如,在智能客服領(lǐng)域,可以考慮將大模型應(yīng)用于FAQ問(wèn)答系統(tǒng)和聊天機(jī)器人等場(chǎng)景;在廣告推薦領(lǐng)域,可以將其應(yīng)用于電商平臺(tái)的個(gè)性化推薦等場(chǎng)景;在輿情監(jiān)測(cè)領(lǐng)域,可以將其應(yīng)用于新聞媒體的內(nèi)容分類和情感分析等場(chǎng)景。
其次要具備較高的模型能力、應(yīng)用效果等。而從當(dāng)前企業(yè)用戶落地大模型的主要路徑來(lái)看,集團(tuán)企業(yè)重點(diǎn)是大模型能力建設(shè),一般企業(yè)/部門重點(diǎn)是應(yīng)用場(chǎng)景探索。大模型能力建設(shè)分成三個(gè)層面:基礎(chǔ)設(shè)施建設(shè)、大模型訓(xùn)練和大模型應(yīng)用,當(dāng)前以基礎(chǔ)設(shè)施建設(shè)和大模型訓(xùn)練為主,大模型應(yīng)用較少。
值得注意的是,目前大模型應(yīng)用方向主要分為兩種,一是小模型為主,大模型提升小模型的開發(fā)效率;二是大模型與小模型級(jí)聯(lián),小模型連接應(yīng)用,大模型增強(qiáng)小模型能力。
而這種落地路徑使得模型能力受限。
想要推動(dòng)大模型落地深度,大模型供應(yīng)商、企業(yè)需要在能力、合作模式上不斷探索。
一些深化大模型落地的路徑逐漸清晰。
未來(lái),隨著大模型技術(shù)的不斷發(fā)展和普及,模型級(jí)聯(lián)的應(yīng)用將會(huì)越來(lái)越廣泛。
例如,可以將多個(gè)大模型進(jìn)行組合和級(jí)聯(lián),實(shí)現(xiàn)更復(fù)雜、更精準(zhǔn)的語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理等應(yīng)用場(chǎng)景。同時(shí),也可以將大模型和小模型進(jìn)行級(jí)聯(lián),充分發(fā)揮各自的優(yōu)勢(shì),提高模型的性能和泛化能力。
基于此,擴(kuò)展大模型落地的應(yīng)用深度,加速各領(lǐng)域決策類場(chǎng)景應(yīng)用落地。
其次,不同行業(yè)有著不同的特定需求,未來(lái)大模型需要朝著更加定制化的方向發(fā)展。通過(guò)對(duì)行業(yè)特定語(yǔ)料庫(kù)的訓(xùn)練,大模型可以更好地適應(yīng)不同行業(yè)的實(shí)際應(yīng)用場(chǎng)景。
其次,為了更好地滿足實(shí)際應(yīng)用中的效率和資源需求,大模型需要朝著更加輕量級(jí)化的方向發(fā)展。通過(guò)模型壓縮和剪枝等技術(shù),可以在保證模型性能的同時(shí),降低模型的大小和計(jì)算資源消耗。
此外,隨著數(shù)據(jù)隱私保護(hù)問(wèn)題的日益突出,大模型需要更加注重?cái)?shù)據(jù)的安全性和隱私保護(hù)。
模型的定制化、輕量化、數(shù)據(jù)安全化成為其落地的重要因素。
中國(guó)AI大模型的落地應(yīng)用在智能客服、廣告推薦、輿情監(jiān)測(cè)等領(lǐng)域取得了一系列的成果。然而,在落地過(guò)程中也面臨著諸多困局。未來(lái),隨著行業(yè)定制化、模型輕量級(jí)化和數(shù)據(jù)安全化等技術(shù)的發(fā)展,AI大模型的落地應(yīng)用將迎來(lái)更加廣闊的發(fā)展空間。
作者:斗斗,編輯:皮爺
來(lái)源公眾號(hào):產(chǎn)業(yè)家(ID:chanyejiawang),專注深度產(chǎn)業(yè)互聯(lián)網(wǎng)內(nèi)容
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @產(chǎn)業(yè)家 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
不錯(cuò)