開源不是活雷鋒,但搭便車的機(jī)會(huì)出現(xiàn)了

0 評(píng)論 938 瀏覽 3 收藏 17 分鐘

在今年,大模型領(lǐng)域的斗爭(zhēng)核心在于開源與閉源。那么在開源與閉源之爭(zhēng)的背后,我們可以看到怎樣的市場(chǎng)發(fā)展趨勢(shì)?隨著大模型時(shí)代的基座斗爭(zhēng)進(jìn)入尾聲,下一階段的核心賽點(diǎn)可能是什么?一起來看看作者的解讀。

“是的。谷歌在人工智能方面并沒有護(hù)城河,OpenAI也沒有。在我們彼此競(jìng)爭(zhēng)的時(shí)候,第三派一直在悄悄地吃我們的午餐?!?/p>

“第三派,我是說那些開源模型,開源能讓它們‘更快、更可定制、更私密,能力更強(qiáng)’?!?/p>

——谷歌研究員報(bào)告?zhèn)渫?/p>

“Llama 2為初創(chuàng)企業(yè)提供了一條生命線,像我這樣的人希望開源模式存在,因?yàn)槲也幌矚g把我所有的錢都給OpenAI?!?/p>

——人工智能助理初創(chuàng)公司Lindy創(chuàng)始人

越是前沿的領(lǐng)域,越是充滿變數(shù)。

對(duì)公眾來說,大模型領(lǐng)域可能只是出了幾個(gè)玩具般的App,很厲害,但沒什么用。真正的商用似乎還有一段距離。

但商業(yè)端,大小公司之間的爭(zhēng)斗已經(jīng)進(jìn)入了貼身白刃戰(zhàn),戰(zhàn)況瞬息萬變,反轉(zhuǎn)頻出,感覺都有點(diǎn)燃起來了。

太多的細(xì)節(jié),對(duì)于小白來說多少有些繁雜,要想吃明白這個(gè)瓜,可以去提綱挈領(lǐng)一個(gè)主線,在我們看來,這也是今年以來大模型領(lǐng)域的斗爭(zhēng)核心:

開源VS閉源。

一、開源:后發(fā)者的驅(qū)虎吞狼

就軟件來說,屬于它的科技史并不算長(zhǎng),但我們依然可以總結(jié)出一些規(guī)律。

比如,每一次全新時(shí)代來臨之際,其核心產(chǎn)品都會(huì)出現(xiàn)兩條路線,先發(fā)者閉源,后來者開源。

PC時(shí)代的操作系統(tǒng),Windows VS Linux;

移動(dòng)互聯(lián)網(wǎng)時(shí)代的操作系統(tǒng),iOS VS Android;

以及當(dāng)下即將來臨的AI時(shí)代,GPT VS ??;

第一次,Linux的出現(xiàn)比Windows整整晚了六年。Linux的江湖地位不必多說,但商業(yè)價(jià)值相比后者的一家獨(dú)大,可以說是忽略不計(jì)。

第二次,Android的出現(xiàn)僅僅比iOS 晚了十個(gè)月。

結(jié)果是,Android拿下了80%以上的市場(chǎng)份額,而蘋果拿走了手機(jī)市場(chǎng)90%以上的利潤(rùn)。

這個(gè)數(shù)據(jù)為長(zhǎng)期以來的平均概數(shù)。最新數(shù)據(jù),Android市場(chǎng)份額跌到了70%,蘋果的利潤(rùn)占比則跌到了85%。這與中國(guó)廠商的崛起有不小關(guān)系。

開源系統(tǒng)的影響力大幅提高,但在商業(yè)價(jià)值上依然被閉源系統(tǒng)吊打。

第三次,也就是這一次,商業(yè)化落地的進(jìn)程還沒正式開啟,開源系統(tǒng)就已經(jīng)來勢(shì)洶洶了。

產(chǎn)生這一路線分歧,有其必然的商業(yè)邏輯。

在前沿科技領(lǐng)域,每一次技術(shù)突破的背后都需要極大的研發(fā)成本。這其中對(duì)于企業(yè)自身的資本、精力、人員投入乃至運(yùn)氣,都有著極高的要求。

比如此次的引領(lǐng)者OpenAI,有報(bào)告顯示,OpenAI每天僅維持其人工智能服務(wù)ChatGPT的運(yùn)行就需要花費(fèi)約70萬美元。

如果不是OpenAI光啟動(dòng)資金就有10億美元,是個(gè)典型的富二代,怕是經(jīng)不住這樣“燒錢”。

其次,在巨額投入的先發(fā)優(yōu)勢(shì)下,這類企業(yè)的產(chǎn)品質(zhì)量也往往是市面上所能看到的最優(yōu)選項(xiàng),盡管這種優(yōu)勢(shì)在中后期會(huì)隨著技術(shù)進(jìn)步的放慢而被抹平,但這也是支撐其做到直接收費(fèi)的市場(chǎng)原因。

這是非常傳統(tǒng)的商業(yè)邏輯,典型例子如制藥領(lǐng)域,早期高投入研制特效藥,前期專利保護(hù)高價(jià)售賣進(jìn)行回本,后期逐步放開惠及市場(chǎng)。

但與藥品市場(chǎng)不同的是,軟件領(lǐng)域有著極大網(wǎng)格效應(yīng),時(shí)間在這一行業(yè)中格外重要,先發(fā)者往往能做到贏家通吃。

藥品市場(chǎng)中,假設(shè)我新藥比你研發(fā)得慢一點(diǎn),但只要我比你便宜一塊錢,或者有其他差異化特性,我依然可以拿到屬于自己的市場(chǎng)份額,那大家自然都愿意慢慢地搞專利保護(hù),也就是閉源模式。

但在軟件領(lǐng)域中,市場(chǎng)的發(fā)展瞬息萬變,新入場(chǎng)的創(chuàng)業(yè)者、開發(fā)人員以及應(yīng)用生態(tài)都在不斷涌現(xiàn),而他們也需要付出學(xué)習(xí)成本以及維護(hù)成本,那么越往后期,其更換成本就越高。

就像你手中的微信,也許你并不喜歡這款軟件,也許市面上有更加優(yōu)秀的通訊產(chǎn)品,但你已經(jīng)將自己的互聯(lián)網(wǎng)社交圈子安置在這個(gè)軟件上了,某種程度上就是別無選擇。這也就是所謂的贏家通吃。

而當(dāng)初一同出現(xiàn)的米聊、易信、飛信等軟件,這些企業(yè)早期投入的成本,也就隨著微信生態(tài)的建立打了水漂。

但Android的成功,意味著這類后發(fā)者還有一線生機(jī):開源。

開源的本質(zhì),是驅(qū)虎吞狼。

拉開架勢(shì)1V1單挑確實(shí)打不過了,那就把我的入場(chǎng)券免費(fèi)送出去,請(qǐng)所有人一起入場(chǎng)。

個(gè)人的失敗固然痛心,但同行的成功更令人無法忍受。

既然贏家最后的核心優(yōu)勢(shì)是生態(tài)建立,那我就不讓你這么順利地壟斷生態(tài),通過免費(fèi)的行為,把這一環(huán)節(jié)的水徹底攪渾。

二、攻防戰(zhàn)的背后,競(jìng)合大于競(jìng)爭(zhēng)

梳理過往經(jīng)驗(yàn),有這樣幾個(gè)規(guī)律和趨勢(shì)是可以清晰看到的:

  1. 商業(yè)價(jià)值上,開源系統(tǒng)的優(yōu)勢(shì)在于影響力的迅速擴(kuò)散,閉源系統(tǒng)的優(yōu)勢(shì)則是利潤(rùn)更有保障;
  2. 與Linux相比,安卓獲得了極大的商業(yè)成功,這與后發(fā)者的反應(yīng)速度有著極大關(guān)系;
  3. 結(jié)合上一點(diǎn),考慮到這一次大模型領(lǐng)域中,后發(fā)者的開源進(jìn)程已經(jīng)進(jìn)入了提前搶跑式的布局。

那么我們有理由相信,在又一個(gè)新的時(shí)代中,開源大模型很有可能取得比Android更加優(yōu)異的成績(jī)。

這對(duì)包括GPT在內(nèi)的所有閉源大模型來說,都不是一個(gè)好消息。文章開頭所引用的谷歌研究員匿名報(bào)告,他所擔(dān)心的便是這一趨勢(shì)。

毫無疑問,當(dāng)下是開源模型的強(qiáng)勢(shì)期。后發(fā)者下定決心拿出“免費(fèi)開源”這一必殺器時(shí),必將強(qiáng)有力地?cái)噭?dòng)行業(yè)現(xiàn)狀。

但另一邊,這也意味著OpenAI的先發(fā)優(yōu)勢(shì)已經(jīng)十分穩(wěn)固,在閉源系統(tǒng)這一端,可以說已經(jīng)拿下了這一城。

不要相信那些開源社區(qū)所說的“透明化、分享精神、更高效的組織形式balabala”。

商業(yè)領(lǐng)域,尤其是要對(duì)股東負(fù)責(zé)的上市公司,是不可能純做活雷鋒的。真有信心硬剛OpenAI,能賺錢為什么不賺?

回顧過去一年,雙方攻防數(shù)輪,精彩非常:

ChatGPT月活剛突破1億,Meta就立馬推出LLaMA(“羊駝”);

羊駝被“非故意開源”之后,基于開源模型產(chǎn)生的GPT平替大爆發(fā), OpenAI立馬反手打一個(gè)GPT-4;

Dolly 2.0首創(chuàng)開源、遵循指令、提供可商業(yè)化數(shù)據(jù)集的大模型,ChatGPT APP就再次掀起風(fēng)暴;

Meta推出新一代開源大模型Llama 2,這是大型科技公司首個(gè)開源的商用大模型,被稱為GPT-4的“最強(qiáng)平替”,后來首席人工智能科學(xué)家楊立昆就被叫到參議院接受眾議員質(zhì)詢。

……

總體來說,雙方的主線依然是競(jìng)速賽。

雖然也出現(xiàn)了“媒體輿論”和“政策監(jiān)管”這些盤外招,但長(zhǎng)期來看,未來的商業(yè)格局,還是取決于三點(diǎn),也就是人工智能三要素:算法、算力、算據(jù)(數(shù)據(jù))。

算法方面,我們不能否認(rèn)當(dāng)下的開源模型在過去的GPT-3中汲取了大量養(yǎng)分。而隨著GPT-4更加封閉,其能否持續(xù)保持競(jìng)爭(zhēng)力,仍然有待進(jìn)一步觀察。

清華大學(xué)電子工程系長(zhǎng)聘教授周伯文說:“我們目前只知道它(GPT-4)是一個(gè)多模態(tài)大語言模型,但它如何理解圖片,如何用 RLHF 微調(diào),以及參數(shù)量規(guī)模、訓(xùn)練數(shù)據(jù)和成本等技術(shù)細(xì)節(jié),OpenAI 全部選擇隱藏?!?/p>

這一點(diǎn)上,對(duì)OpenAI來說,大模型賽道的技術(shù)長(zhǎng)度,或者說依然暫未開發(fā)的未來進(jìn)化空間是其優(yōu)勢(shì)。

也就是說,如果GPT-5乃至GPT-6持續(xù)推出,考慮到AI進(jìn)化的荷塘效應(yīng),這一可能性幾乎是必然的,開源模型能否繼續(xù)保持相對(duì)競(jìng)爭(zhēng)力尚未可知。

算力方面,就是堆錢,雙方均實(shí)力雄厚,不展開。

算據(jù)方面,我們認(rèn)為,存量數(shù)據(jù)的價(jià)值意義遠(yuǎn)不如基于AI產(chǎn)品所產(chǎn)生的原生數(shù)據(jù)。

如果說存量數(shù)據(jù)是“AI小寶寶”看電視被動(dòng)學(xué)說話,那么原生數(shù)據(jù)便是“AI小寶寶”在與人直接交流。更即時(shí)的反饋,更快速地糾錯(cuò),以及更貼合實(shí)際應(yīng)用的數(shù)據(jù)價(jià)值,自然更有利于AI的進(jìn)一步進(jìn)化迭代。

基于此,ChatGPT APP的戰(zhàn)略價(jià)值進(jìn)一步被放大。

而開源生態(tài)方面,則需要觀察垂類原生應(yīng)用的進(jìn)展情況。

正如,羊駝被泄露后,一眾GPT的平替爆發(fā),知識(shí)蒸餾(通過將大型模型的知識(shí)轉(zhuǎn)移到小型模型中,從而快速達(dá)到想要的模型質(zhì)量)的出現(xiàn)大幅降低了計(jì)算成本,某種程度上直接削低了加入開源生態(tài)的門檻。

那么這一進(jìn)展也將間接促進(jìn)開源生態(tài)的進(jìn)一步繁榮。

總體來說,雙方各有優(yōu)勢(shì)。

閉源大模型不斷向上拓寬行業(yè)的天花板,隨著不可避免的技術(shù)外溢,必然將引領(lǐng)著開源大模型的持續(xù)發(fā)展。

另一邊,開源大模型則在迅速橫向拓展著AI生態(tài)的繁榮,這一繁榮所帶來的新增市場(chǎng),也將被閉源大模型所共同分享。

目前仍處于市場(chǎng)越做越大的階段。

“在競(jìng)爭(zhēng)中共同成長(zhǎng)”,極有可能是未來的主題。

三、基座之爭(zhēng)收尾,下一階段爭(zhēng)什么?

隨著開源模型的出現(xiàn),這也意味著大模型時(shí)代的基座斗爭(zhēng)已經(jīng)進(jìn)入了尾聲。

閉源方面,OpenAI坐穩(wěn)了江山,接下來它的對(duì)手只有自己和技術(shù)本身。

短期來看,開源上手成本低,使用靈活,同時(shí)給予了中小型企業(yè)極大的自主性和安全感,短期內(nèi)必將形成強(qiáng)烈的沖擊。

但中長(zhǎng)期來看,隨著開源項(xiàng)目組建的系統(tǒng)進(jìn)展,依然會(huì)需要大量人力和資源來維護(hù),其綜合成本同樣會(huì)持續(xù)上升,屆時(shí)OpenAI的市場(chǎng)可能又會(huì)迎來回升。

基于此,未來的形勢(shì)或許會(huì)反復(fù),但巨大的反轉(zhuǎn)不太可能會(huì)出現(xiàn)。

開源生態(tài)方面,Meta的Llama目前具有著明顯的優(yōu)勢(shì)。

開源之后,Meta將擁有更多的可訓(xùn)練數(shù)據(jù),開發(fā)人員能夠幫助Llama 2去發(fā)現(xiàn)和解決漏洞,并且能夠很快打開市場(chǎng),為未來的商業(yè)化鋪路。

扎克伯格在四月份與股票分析師的電話會(huì)議上表示,隨著開發(fā)者采用和改進(jìn)這些模型或修補(bǔ)他們的安全漏洞,Meta將能夠?qū)⑦@些改進(jìn)納入其自己的消費(fèi)者和廣告產(chǎn)品的AI模型中。

當(dāng)然,考慮到當(dāng)前仍處于AI時(shí)代的極早期階段,應(yīng)用級(jí)生態(tài)的建立仍需要時(shí)間去觀察。同時(shí)考慮到中國(guó)市場(chǎng)的這一變量,開源大模型或許在未來仍需要參加半決賽乃至附加賽。

隨著開源這一最終殺器的祭出,這也意味著通用大模型基座維度的競(jìng)爭(zhēng)中,最大的變數(shù)已經(jīng)落地。

此外,隨著開源模式的出現(xiàn),一個(gè)新的階段也將被徹底開啟。即,應(yīng)用層產(chǎn)品的涌現(xiàn)。

在此之前,人們往往會(huì)質(zhì)疑其商業(yè)壁壘的問題,比較知名的如投資人朱嘯虎所說:“如果90%的能力是ChatGPT提供,那么AIGC應(yīng)用就沒有什么投資價(jià)值。”

其潛臺(tái)詞是,無論你成長(zhǎng)得多么大,你的利潤(rùn)都可以輕易被OpenAI拿走。

但開源模型的出現(xiàn)徹底打消了這一顧慮。

隨著開源社區(qū)的爆發(fā)式增長(zhǎng),具備基礎(chǔ)能力的大模型正在迅速普及。

供給側(cè)的繁榮使得大模型趨于白菜價(jià)。

此外,應(yīng)用級(jí)企業(yè)自主研發(fā)的門檻也被降到了最低,企業(yè)的自主性將得到極大保障。

應(yīng)用級(jí)企業(yè)被巨頭釜底抽薪的可能性消失了,寒武紀(jì)式的物種爆發(fā)近在眼前。

可以預(yù)見的是,接下來應(yīng)用級(jí)層面的Killer App(殺手級(jí)應(yīng)用)將成為行業(yè)中的下一個(gè)核心賽點(diǎn)。

而整個(gè)市場(chǎng)的競(jìng)爭(zhēng)重心,也將從100%的技術(shù)驅(qū)動(dòng),向著代表著用戶體驗(yàn)的產(chǎn)品驅(qū)動(dòng)傾斜。

參考文獻(xiàn):

[1]《為什么開源大模型終將勝出?》OneFlow- Varun Shenoy

[2]《谷歌沒有護(hù)城河,OpenAI也沒有》SemiAnalysis

[3]《小羊駝:訓(xùn)練成本僅300 美元的斯坦福開源模型,適合創(chuàng)業(yè)公司打造自己的AI模型》阿爾法工場(chǎng)

[4]《OpenAI即將開源新模型,但不是最先進(jìn)的那個(gè)》新智元

[5]《ChatGPT時(shí)代如何創(chuàng)業(yè)》傅盛演講

[6]《大模型創(chuàng)業(yè)300天:成者100億估值,80%敗者出局》AI鯨選社

作者:劉奇;編輯:何鑰陽

來源公眾號(hào):市值榜(ID:shizhibang2021),資本與商業(yè)研究。

本文由人人都是產(chǎn)品經(jīng)理合作媒體@市值榜 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!