國(guó)產(chǎn)AI大模型猛打價(jià)格戰(zhàn),但從業(yè)者表示沒(méi)什么用,純噱頭
進(jìn)入5月,國(guó)內(nèi)大廠的大模型紛紛降價(jià)吸引用戶;但 AI 世界瞬息萬(wàn)變,或許再過(guò)一段時(shí)間,這場(chǎng)價(jià)格風(fēng)波會(huì)迭代成新的戰(zhàn)斗方式。這篇文章,我們和作者一起,看看這場(chǎng)大模型降價(jià)背后的原因,以及可能的后續(xù)。
這個(gè) 5 月,國(guó)內(nèi)大廠的大模型也開始爭(zhēng) “ 地板價(jià) ” 了。
5 月 15 日,字節(jié)跳動(dòng)的豆包大模型發(fā)布,定價(jià) 0.0008 元/千Tokens。
21 日,阿里通義千問(wèn) GPT-4 級(jí)主力模型 Qween-Long 降價(jià) 97%,API 輸入價(jià)格從 0.02 元/千Tokens 降至 0.0005 元/千Tokens,每千 Tokens 比豆包便宜 0.3 厘。
同天,百度的文心大模型中的兩大主力模型 ERNIE Speed 和 ERNIE Lite 直接宣布免費(fèi)。
22 日,騰訊也跟進(jìn)了降價(jià)風(fēng)潮,旗下數(shù)款大模型降價(jià) 50%-87.5% 不等,有三款大模型直接免費(fèi)。
似乎,中文互聯(lián)網(wǎng)世界的任何事物都要經(jīng)歷一波價(jià)格主導(dǎo)的 “ 百團(tuán)大戰(zhàn) ”。
國(guó)產(chǎn)大模型價(jià)格普降,理論上并不意外,畢竟要全面鋪開市場(chǎng),利用冗余產(chǎn)能,低價(jià)和免費(fèi)是最直接有效的方式。
但同時(shí),在行業(yè)人士看來(lái),降價(jià)這件事經(jīng)不起細(xì)琢磨,無(wú)論是長(zhǎng)遠(yuǎn)效益,還是眼下國(guó)產(chǎn)大模型的技術(shù)水平,這場(chǎng)價(jià)格戰(zhàn)來(lái)得都比較急,而且有點(diǎn)不痛不癢。
AI 世界瞬息萬(wàn)變,或許再過(guò)一段時(shí)間,這場(chǎng)價(jià)格風(fēng)波會(huì)迭代成新的戰(zhàn)斗方式,幾分幾厘的爭(zhēng)執(zhí)并不重要。不過(guò),在這個(gè)也許會(huì)轉(zhuǎn)瞬而逝的風(fēng)波面前,我們?cè)噲D稍作停頓,找尋國(guó)產(chǎn)大模型降價(jià)背后的原因,以及這場(chǎng)風(fēng)波有可能的后續(xù)。
01 國(guó)產(chǎn)AI大促銷,一家更比一家低
截至目前,參與到 “ 價(jià)格戰(zhàn) ” 中的大廠有字節(jié)跳動(dòng)、阿里、百度、騰訊。
5 月 15 日,字節(jié)跳動(dòng)正式發(fā)布旗下豆包大模型,在發(fā)布會(huì)上重點(diǎn)強(qiáng)調(diào)了豆包的價(jià)格優(yōu)勢(shì)。那天,豆包在這幾家大廠里還是最便宜的,在國(guó)內(nèi)整體大模型廠商中也幾乎是最低價(jià),豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有 0.0008元/千Tokens,比行業(yè)便宜 99.3% 。
一周后,阿里和百度在同天跟進(jìn)降價(jià)。通義千問(wèn) GPT-4 級(jí)主力模型降價(jià) 97%,差不多打了一折,API 輸入價(jià)格從 0.02 元/千Tokens 降至 0.0005元/千Tokens,比豆包還便宜 0.3 厘。另一邊,百度文心大模型的兩大主力模型 ERNIE Speed 和 ERNIE Lite 干脆直接宣布免費(fèi)。
次日,騰訊混元大模型也來(lái)了一波價(jià)格普降,除混元-pro 的輸出價(jià)格仍保持在 0.1 元/千Tokens 之外,其他大模型的價(jià)格都降了 50%-87.5% 不等。調(diào)價(jià)前,最貴的是 0.12 元/千Tokens 的混元-standard-256k 大模型,而這次降價(jià)最多的也是它,輸入價(jià)格調(diào)至 0.015元/千Ttokens,輸出價(jià)格 0.06 元/千Tokens,降幅分別為 87.5% 和 50% 。在騰訊云降價(jià)的同一天,科大訊飛旗下大模型訊飛星火 API 能力也正式免費(fèi)開放。
如今,國(guó)產(chǎn)大模型已經(jīng)進(jìn)入了以毫厘論價(jià)甚至免費(fèi)的時(shí)代。
客觀來(lái)說(shuō),大模型降價(jià)是一直以來(lái)的趨勢(shì)。
去年以來(lái),OpenAI 就進(jìn)行了多次降價(jià),5 月 13 日新發(fā)布的 GPT-4o,面向 ChatGPT 的所有付費(fèi)和免費(fèi)用戶發(fā)布,取消其他所有限制,API 價(jià)格從 0.1 元/千Tokens 降至 0.035 元/千Tokens( 價(jià)格單位經(jīng)過(guò)換算以便與國(guó)產(chǎn)廠商對(duì)齊?)。
幾位行業(yè)人士對(duì)知危表示,降價(jià)這件事不算大,也不算稀奇。“ 現(xiàn)在價(jià)格被打下來(lái)的主要是文字生成這塊的大模型,行業(yè)其實(shí)還沒(méi)有做到把別的模態(tài)也打下來(lái)。而經(jīng)歷過(guò)去一年多的技術(shù)迭代,文字生成效果比較好的模型現(xiàn)階段已經(jīng)可以跑到端側(cè)了,端測(cè)運(yùn)行客觀來(lái)講就是免費(fèi)的。” 心光 App 聯(lián)合開發(fā)者王禹效對(duì)知危說(shuō)。
他補(bǔ)充,降價(jià)這件事本身可能也有很多沒(méi)直接說(shuō)的東西。“ 比如 OpenAI 有兩種報(bào)價(jià),一種報(bào)價(jià)對(duì)應(yīng)的服務(wù)響應(yīng)比較快,另一種報(bào)價(jià)響應(yīng)慢一些,也就是他們把服務(wù)器的剩余資源拿來(lái)給你用。一般來(lái)說(shuō),大模型廠商不太可能把最好的模型拿來(lái)做免費(fèi),你會(huì)發(fā)現(xiàn)真正的好東西還是很貴,因?yàn)楹玫哪P偷乃懔Τ杀疽泊_實(shí)高。”
國(guó)產(chǎn)大模型在這個(gè) 5 月紛紛拿出價(jià)格誠(chéng)意,一方面是大勢(shì)所趨,連技術(shù)水平更高的大模型都沒(méi)那么貴,上述企業(yè)自然也希望通過(guò)降價(jià)獲得更多市場(chǎng)。
另一方面,來(lái)自于大模型自身的迭代。王禹效說(shuō),從技術(shù)角度來(lái)看,最開始大模型需要瘋狂堆料,但后來(lái)再做優(yōu)化的時(shí)候會(huì)發(fā)現(xiàn),其實(shí)不用堆太大的參數(shù),可以通過(guò)知識(shí)蒸餾降低計(jì)算資源和模型大小,那之前的模型成本就能降到之前的十分之一,還能保證差不多的效果,降價(jià)也就順理成章了。
02 噱頭大于實(shí)際的一次價(jià)格戰(zhàn)
在豆包大模型發(fā)布會(huì)上,火山引擎負(fù)責(zé)人譚待表示,大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。而且,如今基座大模型已經(jīng)進(jìn)入了穩(wěn)定迭代的階段,在模型訓(xùn)練和推理使用上,都還有長(zhǎng)足的優(yōu)化空間,成本下降得很快。
字節(jié)的解釋,透露出兩個(gè)信息。一是模型結(jié)構(gòu)完成了優(yōu)化調(diào)整,算力效率提升了,這是降價(jià)的底氣。二是通過(guò)降價(jià)拉高市場(chǎng)使用量,反過(guò)來(lái)對(duì)大模型的繼續(xù)迭代也是好事。
理論上講,這是一個(gè)完美的答案。不過(guò),如果再仔細(xì)推敲起這個(gè)邏輯,很多現(xiàn)實(shí)結(jié)果還有待驗(yàn)證。
首先,從商業(yè)模式上說(shuō)根基不穩(wěn)。AI 應(yīng)用創(chuàng)業(yè)者谷林( 化名 )對(duì)知危表示,以價(jià)換量占領(lǐng)市場(chǎng),這個(gè)邏輯看起來(lái)是對(duì)的也是常見(jiàn)做法,但這一策略需依賴于能夠?qū)崿F(xiàn)規(guī)模效應(yīng)的商業(yè)模式,大模型 API 卻并不是:
“ 大模型面向 B 端用戶,也就是開發(fā)者,要切換 API 的話,不存在切換門檻和壁壘?!?/p>
大模型的成本分有模型訓(xùn)練、商業(yè)服務(wù)、API 服務(wù)這三類。
單說(shuō)訓(xùn)練成本,就需要昂貴的投入,包括優(yōu)質(zhì)工程師、標(biāo)注過(guò)的高質(zhì)量數(shù)據(jù)以及各領(lǐng)域科學(xué)家對(duì)模型進(jìn)行調(diào)優(yōu),這些成本都十分高昂。此外,API 使用模型進(jìn)行推理的運(yùn)算成本,涉及顯著的電力和硬件消耗。
谷林表示,“ 正常的商業(yè)模式,就算沒(méi)有利潤(rùn),也要考慮到卡的成本和電力成本的,如果 toB 要持續(xù)提供好的服務(wù),一定是要有利潤(rùn)的?,F(xiàn)在廠商給出每百萬(wàn) Tokens 幾塊錢幾毛錢的價(jià)格,電價(jià)可能都不夠,更別提卡了,那肯定要靠企業(yè)從其他業(yè)務(wù)的利潤(rùn)上拿來(lái)做補(bǔ)貼?!?/p>
就像消費(fèi)互聯(lián)網(wǎng)常見(jiàn)的 “ 百團(tuán)大戰(zhàn) ” 一樣,在 AI 大模型領(lǐng)域,先挑起價(jià)格敏感的,也是大廠。無(wú)論算力效率如何提升,成本如何比以前降低,AI 大模型畢竟沒(méi)有到一個(gè)全行業(yè)形成價(jià)格標(biāo)準(zhǔn)的時(shí)代,現(xiàn)在去無(wú)限壓低價(jià)格,還是比較具有煽動(dòng)性的事情。
不過(guò),如此降價(jià)能不能長(zhǎng)期持續(xù)也不好定論。
如果是傳統(tǒng)的 “ 價(jià)格戰(zhàn) ”,賣的是一次性或標(biāo)準(zhǔn)化的服務(wù),那確實(shí)誰(shuí)便宜誰(shuí)占領(lǐng)市場(chǎng)。但 AI 大模型不一樣,畢竟 toB 的技術(shù)企業(yè)還是要不斷做研發(fā)創(chuàng)新的,現(xiàn)在的低價(jià)買到現(xiàn)在的技術(shù),日后開發(fā)者必然也需要更好更與時(shí)俱進(jìn)的技術(shù)支持,到那時(shí)還可以用現(xiàn)在的價(jià)格去買嗎?
還有一個(gè)值得注意的點(diǎn),大廠尚有充裕的算力資源可以拿出來(lái)做低價(jià),“ 反而是現(xiàn)在正在燒錢跑的模型側(cè)的一些公司,包括跑開源的公司,他們壓力比較大,因?yàn)槟P脱邪l(fā)還是挺貴的,是一個(gè)比較重資產(chǎn)的游戲?!?王禹效表示。
在行業(yè)人士看來(lái),國(guó)內(nèi)這批大模型理論上是要比 OpenAI 等海外廠商的大模型差上 2-3 代,要補(bǔ)齊差距可能也要半年到一年的時(shí)間。
也就是說(shuō),現(xiàn)在這撥低價(jià),是用舊的模型去促銷,搶存量市場(chǎng),壓力還在后頭。
所以,這可能不是一場(chǎng) “ 價(jià)格戰(zhàn) ”,而是賠本賺吆喝。
03 價(jià)格不是當(dāng)下最需要卷的
價(jià)格降了,無(wú)疑會(huì)帶來(lái)不少正向的影響。
能幫助到現(xiàn)有應(yīng)用的開發(fā)團(tuán)隊(duì),為其提供很多選擇,可以把免費(fèi)或超低價(jià)的模型都拿來(lái)試試。同時(shí)也能帶來(lái)新的創(chuàng)業(yè)機(jī)會(huì),在幾乎不需要考慮這方面成本的情況下,一些好的想法更容易落地。無(wú)論如何,大模型通過(guò)低價(jià)一定會(huì)收獲使用量上的暴增。
因?yàn)榇竽P捅阋肆?,所以選擇用用看,這個(gè)邏輯是成立的。但是,要不要繼續(xù)用下去,或者長(zhǎng)期選擇哪個(gè)大模型,卻不是以價(jià)格為導(dǎo)向的。
王禹效解釋,在國(guó)內(nèi)這批大模型宣布降價(jià)之前,一個(gè)創(chuàng)業(yè)者如果真想做點(diǎn)什么,那幾乎每家大模型廠商都會(huì)給出很高的免費(fèi)額度?!?比如 GPT 一開始給的是將近 2 萬(wàn)人民幣的免費(fèi)額度,大家都可以申請(qǐng)。”
對(duì)于真的有想法想做 AI 創(chuàng)業(yè)的人來(lái)說(shuō),價(jià)格不是最核心的痛點(diǎn),只能說(shuō)低價(jià)或 0 元購(gòu)吸引他們過(guò)來(lái)創(chuàng)業(yè)了,但繼續(xù)做下去的話,不會(huì)有人因?yàn)檫@款模型便宜就一直用,還是要篩選技術(shù)更好,更符合自己應(yīng)用開發(fā)需求的模型。
“ 對(duì)開發(fā)者而言,免費(fèi)可以毫無(wú)顧忌地使用到更多場(chǎng)景下進(jìn)行推理,使用更長(zhǎng)的 Context 提升推理的精確度和內(nèi)容的多樣性。但在認(rèn)真做產(chǎn)品的團(tuán)隊(duì),在技術(shù)選型上,還是首先考慮多模態(tài)的支持和內(nèi)容質(zhì)量,而不僅僅是基于成本考慮。最終一定是回歸到大模型廠商的技術(shù)和服務(wù)上來(lái),這才是壁壘,價(jià)格不是壁壘?!?谷林坦言。
不僅是開發(fā),在應(yīng)用運(yùn)營(yíng)的實(shí)際情況中,價(jià)格也不敏感。
王禹效舉例,“ 前兩天我們 App 的技術(shù)同事還問(wèn)我,要不要搭一套新架構(gòu),這樣隨時(shí)可以在后臺(tái)切換任何模型,都可以試試,還不會(huì)影響到業(yè)務(wù)。我覺(jué)得這個(gè)事情不著急,因?yàn)?strong>在應(yīng)用側(cè)的實(shí)際情況中,用戶是不在乎你用了什么模型的,用戶只在乎你的場(chǎng)景。所以,對(duì)于開發(fā)者來(lái)說(shuō),今天這個(gè)模型好,明天那個(gè)模型差,誰(shuí)便宜了幾毫厘,誰(shuí)免費(fèi)了,都沒(méi)太大意義,你只要把用戶最關(guān)心的某個(gè)場(chǎng)景的問(wèn)題解決了就好?!?/p>
更何況,一款 AI 產(chǎn)品會(huì)用到不止一個(gè)模型,價(jià)格高的模型、價(jià)格低的模型、免費(fèi)的模型,開發(fā)者都可以用,免費(fèi)的模型可以用在邊角料上,做點(diǎn)簡(jiǎn)單的處理。當(dāng)一個(gè)開發(fā)者同時(shí)是所有價(jià)位的模型的客戶,似乎也不存在用價(jià)格搶客戶的事情了,只能說(shuō)大家都有飯吃。
說(shuō)白了,眼下國(guó)產(chǎn)大模型的 “ 價(jià)格戰(zhàn) ” 更像是營(yíng)銷手段,為廠商帶來(lái)短期的獲客,而真正決定留客率的還是模型本身的技術(shù)水平。這也是從業(yè)者們對(duì)大模型 “ 價(jià)格戰(zhàn) ” 并不興奮的原因。不會(huì)因?yàn)楸阋硕恢边x擇,更不會(huì)因?yàn)橘F就放棄好的模型。
他們只覺(jué)得,在 AI 大模型還處于沒(méi)有確立標(biāo)準(zhǔn)的野蠻時(shí)代,廠商用價(jià)格作為營(yíng)銷策略也是能理解的,就像字節(jié)在著重強(qiáng)調(diào)豆包的價(jià)格優(yōu)勢(shì)一樣?!?字節(jié)銷售也是總來(lái)找我們,和其他廠商比,感覺(jué)字節(jié)大模型在營(yíng)銷上確實(shí)算最賣力的。”?王禹效說(shuō)。
歸根結(jié)底,開發(fā)者和大模型是雙向選擇的過(guò)程。篩選客戶的核心不是誰(shuí)家便宜,這跟消費(fèi)互聯(lián)網(wǎng)的價(jià)格戰(zhàn)不一樣。
谷林解釋,“ ToC 的產(chǎn)品用戶切換的壁壘,有用戶心智,有市場(chǎng)占有。假如說(shuō)廠商是 toC 之后積累了規(guī)模效應(yīng)后,競(jìng)爭(zhēng)優(yōu)勢(shì)很難打破,但現(xiàn)在大模型廠商提供的就是 API,不存在規(guī)模效應(yīng),B 端用戶的切換成本也不高。實(shí)施免費(fèi)和補(bǔ)貼市場(chǎng)策略是否真的有助于商業(yè)增長(zhǎng),能形成商業(yè)壁壘嗎?這個(gè)策略是幫助行業(yè)發(fā)展,還是進(jìn)入劣幣驅(qū)逐良幣的內(nèi)卷?”
搞促銷,是互聯(lián)網(wǎng)博弈局的常見(jiàn)套路。只是,對(duì)于正在探索的應(yīng)用層開發(fā)者和躍躍欲試的新創(chuàng)業(yè)者來(lái)說(shuō),這次不一樣,價(jià)格沒(méi)那么重要。
王禹效坦言,“ 機(jī)會(huì)真是滿天飛,你快點(diǎn)開始做就行了。現(xiàn)在立刻開始做,遠(yuǎn)比你去選哪個(gè)模型,哪個(gè)廠商,哪個(gè)更便宜,來(lái)得更實(shí)際一些?!?/p>
撰文:粥粥,編輯:大餅
本文由人人都是產(chǎn)品經(jīng)理作者【知?!?,微信公眾號(hào):【知?!?,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!