OpenAI坐不住,說明中國(guó)大模型路走通了

字母榜
0 評(píng)論 1621 瀏覽 0 收藏 14 分鐘
🔗 B端产品经理需要进行售前演示、方案定制、合同签订等,而C端产品经理需要进行活动策划、内容运营、用户激励等

春節(jié)期間,國(guó)產(chǎn)大模型DeepSeek和月之暗面的Kimi k1.5相繼發(fā)布,憑借強(qiáng)大的性能和免費(fèi)調(diào)用的優(yōu)勢(shì),迅速引發(fā)了全球關(guān)注。本文將探討國(guó)產(chǎn)大模型的崛起對(duì)OpenAI產(chǎn)生的競(jìng)爭(zhēng)壓力,以及其背后的技術(shù)創(chuàng)新和人才策略,分析國(guó)產(chǎn)大模型在全球AI領(lǐng)域的崛起之路。

國(guó)產(chǎn)大模型在春節(jié)期間的一輪輪產(chǎn)品更新,終于讓OpenAI坐不住了。

北京時(shí)間2月1日,OpenAI加急上線了o3-mini新推理模型,且首次向ChatGPT免費(fèi)用戶開放。

來(lái)自國(guó)產(chǎn)大模型的這波競(jìng)爭(zhēng)壓力,甚至重新讓部分海外同行擔(dān)憂起美國(guó)AI的競(jìng)爭(zhēng)力問題。

近期,前OpenAI高管、AI初創(chuàng)巨頭Anthropic創(chuàng)始人達(dá)里奧·阿莫迪 (Dario Amodei),罕見發(fā)布了一篇萬(wàn)字長(zhǎng)文。在肯定DeepSeek-R1模型在特定基準(zhǔn)測(cè)試中已逼近美國(guó)頂尖水平之外,阿莫迪認(rèn)為DeepSeek的突破,更加印證了美國(guó)對(duì)華芯片出口管制政策的必要性和緊迫性。

而這輪國(guó)產(chǎn)AI力量中,在DeepSeek發(fā)布DeepSeek-R1模型的幾乎同一時(shí)間,月之暗面也推出了Kimi k1.5新模型。

上述兩款推理模型,均全面對(duì)標(biāo)OpenAI o1完整版。其中,Kimi k1.5憑借同時(shí)支持文本和視覺推理的特性,成為首個(gè)可以比肩o1完整版水平的多模態(tài)模型。

盡管OpenAI展現(xiàn)了下一階段大模型的技術(shù)演進(jìn)路線,但直到DeepSeek-R1和Kimi k1.5發(fā)布之前,國(guó)內(nèi)一眾大模型廠商均尚未推出能夠?qū)?biāo)OpenAI o1完整版的模型。它們的出現(xiàn),成了國(guó)產(chǎn)大模型攻破OpenAI技術(shù)黑匣子的又一次實(shí)力展示。

更重要的是,相比OpenAI o1模型付費(fèi)使用的限制,無(wú)論DeepSeek-R1,還是Kimi k1.5,都支持用戶免費(fèi)無(wú)限調(diào)用。

堪比OpenAI o1完整版的模型性能,加上免費(fèi)調(diào)用的差異化競(jìng)爭(zhēng)優(yōu)勢(shì),DeepSeek-R1和Kimi k1.5新模型,成了春節(jié)期間國(guó)內(nèi)大模型對(duì)OpenAI發(fā)起突然襲擊的兩把尖刀。

借助春節(jié)舞臺(tái),完成某種后來(lái)居上式的戰(zhàn)略調(diào)整,已演變?yōu)橹袊?guó)科技公司的保留節(jié)目。

2014年春節(jié)前夕,微信首度推出紅包功能,未能掀起太多水花。轉(zhuǎn)折發(fā)生在2015年,借助與春晚合作,斥資5億元推出“搖一搖”紅包的微信,在除夕當(dāng)天使得微信紅包收發(fā)總量超10億次,并在2天內(nèi)完成了支付寶此前花費(fèi)10年完成的工作——2億張銀行卡綁定。

微信紅包的此番逆襲,后來(lái)被馬云在阿里內(nèi)部稱為是對(duì)支付寶的一場(chǎng)“偷襲珍珠港”,并促使阿里在2016也開始重金贊助春晚,通過“集五福”的形式大撒紅包。

現(xiàn)在,被DeepSeek-R1和Kimi k1.5新模型突襲過后的OpenAI,也不得不調(diào)整了自己的新品發(fā)布節(jié)奏。

在國(guó)產(chǎn)大模型的快速技術(shù)迭代和模型性能追趕壓力之下,即便是OpenAI,恐怕也受不了幾次這樣的突襲了?!拔覀儠?huì)開發(fā)出更好的模型,但我們不會(huì)像往年那樣保持那么大的領(lǐng)先優(yōu)勢(shì)了?!監(jiān)penAI CEO奧特曼在o3-mini發(fā)布后的問答環(huán)節(jié)中說道。

01

DeepSeek-R1和Kimi k1.5新模型一經(jīng)發(fā)布,便在海外用戶群中引發(fā)熱議。

英偉達(dá)AI科學(xué)家Jim Fan第一時(shí)間發(fā)帖總結(jié)兩大模型的相似之處,認(rèn)為兩者都簡(jiǎn)化了強(qiáng)化學(xué)習(xí)框架,同時(shí)提升了推理性能和效率,并評(píng)價(jià)兩家公司所發(fā)表的技術(shù)論文,都堪稱“重磅”級(jí)別。

伯克利人工智能博士,Huggingface機(jī)器學(xué)習(xí)科學(xué)家Nathan Lambert、科技大V AK等也紛紛試用kimi,還有不少業(yè)內(nèi)人士對(duì)這兩款來(lái)自中國(guó)的產(chǎn)品進(jìn)行了測(cè)評(píng)。

與DeepSeek-R1一樣,Kimi k1.5新模型同樣展現(xiàn)出了詳細(xì)的思考過程。

北京時(shí)間1月31日,蘋果發(fā)布了新一季度財(cái)報(bào),以此為契機(jī),選中Kimi k1.5推理模型,輸入提示詞“寫一篇蘋果財(cái)報(bào)分析稿,其中尤其要關(guān)注中國(guó)市場(chǎng)的變化,以及蘋果AI何時(shí)在國(guó)產(chǎn)iPhone中上線的情況”。

經(jīng)過一段時(shí)間思考,Kimi給出了蘋果2025財(cái)年第一財(cái)季的業(yè)績(jī)報(bào)告數(shù)據(jù),并特意指出其中大中華區(qū)營(yíng)收為185.13億美元,同比下降11%。

除了給出聯(lián)網(wǎng)參考的94個(gè)網(wǎng)頁(yè)信息之外,Kimi還列出了自己的詳細(xì)思考過程。

如果將大模型看作一個(gè)數(shù)學(xué)家,沒有加入推理功能之前,大模型在證明了一個(gè)新的定理,或者解了一道新的數(shù)學(xué)題時(shí),只會(huì)把答案寫出來(lái),不會(huì)把思考的過程寫出來(lái)。但是,有了推理功能的加入,現(xiàn)在大模型就可以把原本只存在于數(shù)學(xué)家個(gè)人頭腦中的思考過程,給盡可能完整呈現(xiàn)出來(lái)。

Kimi k1.5推理模型的思考過程,頗有點(diǎn)“授人以魚不如授人以漁”的作用,將其用來(lái)指導(dǎo)學(xué)生學(xué)習(xí),或者輔助程序員編寫代碼等,都有了更強(qiáng)的實(shí)際用途,大模型從有用,逐漸變得真正好用起來(lái)。

更重要的是,相比DeepSeek-R1,Kimi k1.5還是OpenAI之外首個(gè)實(shí)現(xiàn)o1完整版水平的多模態(tài)模型。

在Kimi k1.5推理模式下,上傳一張?zhí)O果最新一季財(cái)報(bào)的數(shù)據(jù)圖表,并給出提示詞“給出圖中大中華區(qū)的營(yíng)收情況,以及同比變化,并分析大中華區(qū)營(yíng)收占比”。

Kimi不僅讀懂了圖片中的營(yíng)收數(shù)字,還通過列出數(shù)學(xué)公式的方式,準(zhǔn)確算出了大中華的營(yíng)收同比下降了11%,且營(yíng)收占比也從去年同期的17%,下降至今年的15%。

楊植麟曾在一次采訪中解釋道,長(zhǎng)文本就是某種意義上的長(zhǎng)推理,“如果我們想讓AI從完成一兩分鐘的任務(wù)變成完成長(zhǎng)周期的任務(wù),那必然要在一個(gè)很長(zhǎng)的context(上下文)里,才有可能真正把AI進(jìn)一步往下推進(jìn)。”

加入圖片識(shí)別等多模態(tài)功能,在某種程度上也可以看作是對(duì)長(zhǎng)文本準(zhǔn)確率的一種提升,這種提升,未來(lái)還可能隨著無(wú)損壓縮視頻多模態(tài)的融入,變得更加強(qiáng)大。

02

對(duì)人才的重視和培養(yǎng),成為DeepSeek和月之暗面能夠率先做出對(duì)標(biāo)OpenAI最新模型o1的共性之一。

在DeepSeek目前約150人左右的團(tuán)隊(duì)中,大多是一幫Top高校的應(yīng)屆畢業(yè)生、沒畢業(yè)的博四、博五實(shí)習(xí)生,以及一些畢業(yè)才幾年的年輕人。

從2023年初成立至今,月之暗面更是長(zhǎng)期被視為中國(guó)大模型創(chuàng)業(yè)公司中,技術(shù)人才密度最高的玩家之一。

在Kimi k1.5中,月之暗面團(tuán)隊(duì)找到了一種提升推理效率的原創(chuàng)技術(shù),即Long2Short高效思維鏈。

在o1模型中,OpenAI一般依賴于邏輯鏈條(Chain-of-Thought,CoT)來(lái)逐步推導(dǎo)出解決方案,這是一種用時(shí)間換取精準(zhǔn)答案的方法。

月之暗面團(tuán)隊(duì)開發(fā)的long2short技術(shù)途徑,把長(zhǎng)思維鏈(復(fù)雜的推理過程)的推理結(jié)果“教給”短思維鏈(簡(jiǎn)單高效的推理過程),兩者進(jìn)行合并,最后針對(duì)“短模型”進(jìn)行強(qiáng)化學(xué)習(xí)微調(diào),從而達(dá)到提升token利用率以及訓(xùn)練效率的目的。

在Short CoT(短文本)模式下,Kimi k1.5的能力同樣大幅領(lǐng)先GPT-4o和Claude 3.5,領(lǐng)先幅度高達(dá)550%。

良好的產(chǎn)品使用體驗(yàn)正在給Kimi帶來(lái)用戶量的增長(zhǎng)。根據(jù)SimilarWeb 2024年12月的數(shù)據(jù),Kimi在web端排名全球前五,僅次于ChatGPT、Google Gemini、Claude和Microsoft Copilot。

03

在DeepSeek和Kimi們的突襲之下,來(lái)自O(shè)penAI等對(duì)手的一輪新競(jìng)爭(zhēng),已經(jīng)在趕來(lái)的路上。

奧特曼預(yù)告中的OpenAI 新模型o3-mini緊急上線,甚至新一代高級(jí)語(yǔ)音模型也發(fā)布在即,為了在追求AGI道路上走得更快,奧特曼更是聯(lián)手軟銀孫正義,搞起了5000億美元的算力開發(fā)大計(jì)劃。

可以預(yù)見,追趕的壓力,或許很快便會(huì)再次來(lái)到國(guó)產(chǎn)AI們的頭上。

但通過DeepSeek-R1和Kimi k1.5新模型的這番突襲,一個(gè)值得關(guān)注的新變動(dòng)是,國(guó)產(chǎn)大模型正在向外界越來(lái)越多地證明其自主創(chuàng)新能力,甚至不排除有一天完成對(duì)OpenAI的真正超越。

近期,Meta首席AI科學(xué)家楊立昆(Yann LeCun)在達(dá)沃斯“技術(shù)辯論”會(huì)議上再次提醒道,“我認(rèn)為當(dāng)前LLM(大語(yǔ)言模型)范式的生命周期相當(dāng)短,可能只有三到五年。五年內(nèi),任何清醒的人都不會(huì)再使用它們了,至少不會(huì)作為AI系統(tǒng)的核心組成部分……我們將看到一種新的AI架構(gòu)范式的出現(xiàn),它可能不會(huì)有當(dāng)前AI系統(tǒng)的那些局限性?!?/p>

對(duì)于任何立志于實(shí)現(xiàn)AGI的大模型玩家而言,追趕OpenAI都絕不是公司成立的初衷和目標(biāo),OpenAI與國(guó)產(chǎn)大模型之間的差距,正在逐漸縮小已是不爭(zhēng)的客觀現(xiàn)實(shí)。

斯坦福大學(xué)計(jì)算機(jī)科學(xué)系客座教授、谷歌大腦聯(lián)合創(chuàng)始人吳恩達(dá)(Andrew Ng)近期發(fā)文指出,DeepSeek的討論讓許多人認(rèn)識(shí)到一些顯而易見的重要趨勢(shì),其中之一便是中國(guó)在生成式AI領(lǐng)域正趕超美國(guó)。

2022年11月ChatGPT剛剛推出之際,美國(guó)在生成式AI領(lǐng)域遠(yuǎn)遠(yuǎn)領(lǐng)先中國(guó),這一領(lǐng)先差距被業(yè)內(nèi)認(rèn)為在2-3年之間。但經(jīng)過兩年發(fā)展,OpenAI對(duì)國(guó)產(chǎn)大模型的領(lǐng)先優(yōu)勢(shì)已經(jīng)被收縮到6個(gè)月。

通過Kimi、DeepSeek等模型的持續(xù)突破,“中國(guó)企業(yè)展現(xiàn)出強(qiáng)大的創(chuàng)新能力,在視頻生成等特定領(lǐng)域甚至已經(jīng)實(shí)現(xiàn)了局部領(lǐng)先?!眳嵌鬟_(dá)點(diǎn)評(píng)道。

國(guó)產(chǎn)大模型在技術(shù)上的快速迭代能力,甚至引得奧特曼在o3-mini的問答環(huán)節(jié)中,也不得不正視道,OpenAI的領(lǐng)先優(yōu)勢(shì)不會(huì)再像往年那么大了。

歸根結(jié)底,大模型所蘊(yùn)藏的無(wú)限技術(shù)創(chuàng)新空間,為國(guó)產(chǎn)大模型玩家們,在打造產(chǎn)品差異化方面提供著無(wú)限機(jī)遇。

更廣闊的AI創(chuàng)新前景,也將孕育出更多國(guó)產(chǎn)大模型的奇襲時(shí)刻。

撰文:趙晉杰 編輯:王靖

本文由人人都是產(chǎn)品經(jīng)理作者【字母榜】,微信公眾號(hào):【字母榜】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!
专题
16886人已学习12篇文章
如何搞懂财务和业务之间的关系,并推进业务系统财务模块的建设呢?本专题的文章分享了财务系统的设计指南。
专题
103980人已学习5篇文章
PRD、MRD、DRD、BRD各种文档撰写方法在这里。
专题
35276人已学习18篇文章
借用别人家的经典案例,来扒一扒社交电商。
专题
15634人已学习12篇文章
运费是电商的基础功能模块之一,承担着商品运费计算的作用。本专题的文章分享了如何设计运费规则。
专题
14640人已学习13篇文章
本专题的文章分享了小红书营销指南。
专题
17015人已学习16篇文章
ERP是一种以系统化的方式,将企业内部所有的业务流程和数据进行整合和管理的软件系统。本专题的文章分享了ERP系统设计指南。