LLM/AIGC帶來的創(chuàng)新機會

0 評論 8457 瀏覽 17 收藏 12 分鐘

2023年6月10日~11日,人人都是產(chǎn)品經(jīng)理舉辦的【2023數(shù)字化產(chǎn)品經(jīng)理大會·深圳站】完美落幕。遠望資本創(chuàng)始合伙人@程浩老師,為我們帶來《LLM/AIGC帶來的創(chuàng)新機會》為題的分享。

ChatGPT的出現(xiàn)仿佛平地一聲驚雷,無異于第四次工業(yè)革命。大模型對于人類的價值遠超互聯(lián)網(wǎng)的價值,互聯(lián)網(wǎng)是搜索信息,大模型是理解信息。舉個例子,圖書館有成千上萬的書,互聯(lián)網(wǎng)能幫我們做的是找到這本書,而大模型可以幫你理解、看懂、消化這本書。

而未來大模型對人類工作的替代會從初級白領開始,比如幫忙訂酒店機票的助理,發(fā)展到后面可能也會取代高級白領,比如律師、醫(yī)生等。

這就帶來一個問題:未來,知識不是必選項。純知識性的、重復性的工作將會被取代,留下來的崗位,都是在做創(chuàng)新的崗位。這也將會對國內(nèi)的教育體系造成沖擊。

接下來講什么是LLM。這是一種壓縮技術,提示語(Prompt)是解壓縮。涌現(xiàn)是解壓縮中,隨機組合出現(xiàn)新的內(nèi)容。它就相當于基因突變,但大部分基因突變都是錯誤的,涌現(xiàn)是好的基因突變。

泛化是LLM核心能力。什么是泛化?以前我在百度時,做問答的、客服的、新聞的都有自己的大模型和算法,但他們都只在垂直領域達到了59分,還不能商業(yè)化。而ChatGPT這個通用的模型,在每一個垂直領域都達到了80分,具有很好的泛化能力。

訓練大語言模型模型,需要三個步驟。第一步是預訓練,去互聯(lián)網(wǎng)找很多語料,無監(jiān)督學習。接下來第二步就是指令微調(diào),給Q&A,預訓練做得好,指令微調(diào)的成本越低。第三步是reinforcement learning。根據(jù)用戶反饋不斷調(diào)整,你問AI一個問題,AI給你回答,你可以告訴他是對的,給他正向回饋;也可以告訴他是錯的,要他進行修正,讓AI不斷優(yōu)化。還包括對齊,比如對其價值觀,不能有地域歧視、殘疾人歧視等等。

這三個步驟中,預訓練的成本是最高的,沒有上億都不要搞預訓練。很多創(chuàng)業(yè)公司都是先找好一個預訓練模型,再進行后面兩個步驟。

從大模型角度來說,數(shù)據(jù)質量是最重要的,其次是數(shù)據(jù)多樣性,然后是數(shù)據(jù)規(guī)模,再是模型,最后才是模型參數(shù)。這也解釋了為什么英文狀態(tài)下的大模型效果會更好,因為不管是從數(shù)據(jù)質量還是數(shù)量或者多樣性上,英文都是遠超其他語言的。

如今,千億參數(shù)可能是極限,未來的趨勢是小型化,比如把大語言模型集成到手機里。

未來,還有一個趨勢是從GUI(圖形界面)到NLUI(自然語言交互)?,F(xiàn)在打車還需要用滴滴,訂外賣還要用美團,未來可以直接拿手機說打車去機場,訂票去上海。

現(xiàn)在幾乎每個企業(yè)都有自己的數(shù)據(jù)庫,未來大語言模型也會像數(shù)據(jù)庫一樣,成為企業(yè)的重要基礎措施。

未來大語言模型會讓那些行業(yè)受益呢?主要是以文字語言交互為主導的行業(yè),對純數(shù)字化行業(yè)影響不大。

在C端領域,受益的可能是寫作、問答、總結、法律、招聘、售前、客服、營銷等這些以文字交互為主的行業(yè)。

那么,想要做大語言模型,是用開源模型還是閉源模型呢?像ChatGPT、文心一言這些都是閉源模型,但開源模型的趨勢正愈演愈烈。

創(chuàng)業(yè)公司選擇開源還是閉源呢?各有優(yōu)勢。開源你只需要買TOKEN就好了,再加上 Prompt engineering和向量數(shù)據(jù)庫等。閉源的優(yōu)勢在于,保護數(shù)據(jù)隱私,并且可以不斷用數(shù)據(jù)填充完善自己的模型。

C端有做開源的也有閉源的,但是B端幾乎都是開源的。在做demo的時候,通常會用閉源的,效果最好,還不用買云計算資源,等到要形成行業(yè)壁壘了,再改回到開源模型。

那么,大語言模型,也就是通用模型,它的泛化能力足夠好之后,是不是不需要垂直模型了?

不是的。通用模型很難替代垂直模型。

因為80%的有價值的行業(yè)知識和數(shù)據(jù)都在企業(yè)防火墻內(nèi),通用模型沒辦法接觸到這些數(shù)據(jù),自然也就沒辦法推導出答案。并且,通用模型具有一定的模糊性,所以它更適合一些容錯率高的、低價值的行業(yè)。垂直模型更適合容錯率低的、高價值的行業(yè)。

比如炒股票、自動駕駛這類需要精確、可控的事情顯然不能用通用模型,但是聊天、寫作就可以。

大語言模型有四個架構,最底層的是Infrastructure,例如算法、算力,這些和創(chuàng)業(yè)公司都沒關系,都是巨頭在參與。

第二層是large language models,比如ChatGPT、文心一言、通義千問都是屬于第二層的。

第三層是LLMOPs,這層實際上是工具層,像向量數(shù)據(jù)庫就是典型的LLMOPs。

第四層是應用APP。

最下面兩層沒有上億的資金很難做出來,適合大公司去做,上面兩層比較適合創(chuàng)業(yè)公司,尤其是應用層,可應用的行業(yè)太多了。

那么,創(chuàng)業(yè)公司能不能做通用大語言模型呢?很難。

首先,缺乏先發(fā)優(yōu)勢。創(chuàng)業(yè)公司能突破大公司的包圍,核心原因就是你跑得快,有先發(fā)優(yōu)勢。要么是大公司沒看上、沒看懂或者走錯方向了,所以創(chuàng)業(yè)公司能沖出來。但在大語言模型這塊,這些情況都不成立,每個大公司都無比重視。

第二,沒有Dummy Period。現(xiàn)在做大模型已經(jīng)成為了共識,但是創(chuàng)業(yè)公司要想跑出來,那就得留有一定的非共識期來發(fā)育。

第三,缺乏場景。大公司都有很好的落地場景,比如百度可以把問答和搜索引擎結合,騰訊的語言模型可以和微信結合。但是創(chuàng)業(yè)公司有什么可落地的場景呢?

在垂直領域,創(chuàng)業(yè)的機會還是挺多的。我分成B端、C端、國內(nèi)、國外四個方面來講。

在國內(nèi)做TO C的好處是什么呢?高爆發(fā)。在國內(nèi)幾個月做成幾百萬DAU是非常有可能的。但問題是什么呢?第一,壁壘低。你能做的,競爭對手也能做。第二,C端的流量紅利沒了。想想大家手機的首頁APP已經(jīng)有多久沒更新過就知道了,幾年都不會下載一個新應用。第三,巨頭抄襲。你做了一個APP,那字節(jié)跳動、騰訊跟你做一個類似的,你怎么辦?第四,合規(guī)成本高。做C端的大語言模型,用戶問的問題是千奇百怪的,指不定哪個問題就違規(guī)了。第五,只能用國內(nèi)的大模型。

在國內(nèi)做TO B的好處是離錢近,壁壘相對高一些。但問題是,天花板低。在中國做TO B最大的痛苦就是企業(yè)的付費能力不好,這是受限于國內(nèi)B端市場的規(guī)模。中國的IT Spending只有美國的六分之一,國內(nèi)上市SaaS公司的人均產(chǎn)值只有30—60萬人民幣。所以在中國做企業(yè)服務就比較辛苦,核心原因就是民企沒錢。

在國際做C端的好處是增長快,問題同樣是壁壘低,而且市場已經(jīng)是紅海了。并且,即使是海外AIGC獨角獸也面臨巨頭競爭。

在國際做B端的好處是海外企業(yè)付費好,天花板高。有垂直壁壘,巨頭不會進入,而且國外的大模型相對更成熟。但問題是團隊得懂海外的企業(yè)服務市場。

最后,我們在創(chuàng)業(yè)的時候,是AIGC+還是+AIGC呢?這兩者的區(qū)別是你是用AIGC原生還是用AIGC賦能。比如要做一個客服系統(tǒng),一個團隊是之前就做AI的,先做好了問答機器人,再去添加客服系統(tǒng)的其他功能;另一個團隊是本來就是做客服SaaS的,只不過之前的SaaS不是智能的而是人在后面回答,現(xiàn)在要把AI的自動回答功能加到已有的客服系統(tǒng)里去。

如何判斷你更適合哪一種?第一個判斷依據(jù),如果公司70%的價值鏈都是AI,那么很顯然就適合AIGC+的賽道。如果本身是SaaS,而AI只占到10%,那顯然更適合+AIGC。第二個判斷依據(jù),看AI本身的技術壁壘怎么樣。如果你選擇AIGC+的賽道,那就必須補充業(yè)務工作流,完善價值鏈。未來,AIGC+和+AIGC一定會相互滲透的。

大會直播回放

產(chǎn)品經(jīng)理大會舉辦至今,已經(jīng)成為了產(chǎn)品經(jīng)理職業(yè)發(fā)展的風向標。每一年的大會,我們都聚焦行業(yè)發(fā)展的前沿動態(tài)、熱點趨勢,重點圍繞產(chǎn)品經(jīng)理人群的職業(yè)發(fā)展,為大家?guī)硇路较?、新思考?/p>

今年的產(chǎn)品經(jīng)理大會,在各自領域已經(jīng)取得結果的嘉賓們將現(xiàn)身說法,從不同的視角告訴你如何應對當下的需求變化,探尋產(chǎn)品經(jīng)理的進化方向!

目前,北京站https://996.pm/7gX2B,深圳站https://996.pm/zaGbp,大會視頻回放已上架,戳鏈接購買,即可收看!

 

本文為直播專場分享整理內(nèi)容,由人人都是產(chǎn)品經(jīng)理運營 @Darcy 整理發(fā)布。未經(jīng)許可,禁止轉載,謝謝合作。

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。息存儲空間服務。儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!