《超越追趕》視角看DeepSeeK的成就

0 評(píng)論 3963 瀏覽 4 收藏 18 分鐘

DeepSeek作為國(guó)內(nèi)AI領(lǐng)域的一匹黑馬,憑借其在AI大模型技術(shù)上的創(chuàng)新和成本優(yōu)勢(shì),引發(fā)了全球范圍內(nèi)的廣泛關(guān)注。本文將從浙大吳曉波教授的“超越追趕”理論出發(fā),深入分析DeepSeek在機(jī)會(huì)窗口和技術(shù)二次創(chuàng)新方面的成就,供大家參考。

最近令全球嘩然的DeepSeek幾乎擠占了國(guó)內(nèi)外各大社交媒體平臺(tái),引起了AI圈、各行業(yè)企業(yè)圈、資本圈、政治圈以及社會(huì)各階層的關(guān)注和討論。作為國(guó)內(nèi)AI領(lǐng)域的一匹現(xiàn)象級(jí)的黑馬,DeepSeeK憑借其在AI大模型技術(shù)路線(xiàn)上的創(chuàng)新和成本優(yōu)勢(shì)的建立,其立下的“豐功偉績(jī)”顯而易見(jiàn)有歷史性的積極面,但也充斥著不同視角的消極面。

積極的一面是國(guó)內(nèi)外專(zhuān)家紛紛公開(kāi)表達(dá),中美AI差距在縮?。◤闹暗?-3年縮短到了1年之內(nèi)甚至半年內(nèi)),優(yōu)化后的架構(gòu)和訓(xùn)練方式大大降低了對(duì)算力的依賴(lài)、中國(guó)大概率可以擺脫美國(guó)的芯片卡脖子問(wèn)題,進(jìn)而促進(jìn)國(guó)內(nèi)芯片的發(fā)展。

消極的一面是有些博主從資本視角看這場(chǎng)舉國(guó)同慶的盛宴,只不過(guò)是資本圈的營(yíng)銷(xiāo)劇本,只不過(guò)是與普通老百姓關(guān)系甚遠(yuǎn)甚至危機(jī)隱私就業(yè)問(wèn)題的糟心事兒,只不過(guò)是依附于頂尖大模型技術(shù)的更新迭代、絕非獨(dú)立創(chuàng)新那般優(yōu)越…

但無(wú)論全球AI競(jìng)爭(zhēng)與合作會(huì)走向怎么樣的結(jié)局,當(dāng)下DeepSeek作為一家國(guó)內(nèi)大廠(chǎng)、AI六小龍之外的后起之秀,面對(duì)行業(yè)領(lǐng)先者、在位者的時(shí)候,可以利用好自身稟賦、把握機(jī)會(huì)窗口,形成后發(fā)優(yōu)勢(shì),最終實(shí)現(xiàn)持續(xù)追趕、甚至有望全面超越的成果,就是一個(gè)值得被拆解的典范。我們嘗試用浙大吳曉波教授的超越追趕理論,從機(jī)會(huì)窗口、二次創(chuàng)新2個(gè)層面逐一分析,從而看清楚DeepSeek從追趕到超越的外在機(jī)會(huì)和內(nèi)在邏輯。

注:關(guān)于DeepSeeK最近在技術(shù)上的成果、對(duì)比及相關(guān)的評(píng)論,詳見(jiàn)文末的參考文獻(xiàn)

一、DeepSeek是誰(shuí)?

DeepSeek是一家專(zhuān)注于人工智能開(kāi)源大模型研發(fā)與應(yīng)用的科技公司,以“技術(shù)驅(qū)動(dòng) + 場(chǎng)景落地”為核心理念,專(zhuān)注于金融、醫(yī)療、政務(wù)等高價(jià)值領(lǐng)域,提供行業(yè)專(zhuān)用的大模型解決方案。

DeepSeek是在2023年由母公司幻方量化創(chuàng)立的,在此之前它是幻方量化公司內(nèi)部專(zhuān)注于AI研究和應(yīng)用的團(tuán)隊(duì),而其母公司幻方量化是一家成立于2016年的量化投資公司,不僅可以為DeepSeek提供了強(qiáng)大的技術(shù)支持和資源,還通過(guò)與多家公司的合作,為DeepSeek的模型訓(xùn)練和應(yīng)用提供了豐富的數(shù)據(jù)和算力支持。

二、超越追趕理論是什么?

超越追趕理論是由浙江大學(xué)吳曉波教授提出的,宏觀(guān)上解決國(guó)家級(jí)的超越追趕問(wèn)題,微觀(guān)上解決企業(yè)通過(guò)技術(shù)創(chuàng)新和商業(yè)模式創(chuàng)新實(shí)現(xiàn)追趕超越問(wèn)題的方法論。具體通過(guò)把握范式轉(zhuǎn)變的機(jī)會(huì)窗口,借助技術(shù)和商業(yè)模式上的二次創(chuàng)新、價(jià)值網(wǎng)絡(luò)的作用來(lái)實(shí)現(xiàn)趕超。

本篇文章重點(diǎn)先從機(jī)會(huì)窗口和技術(shù)創(chuàng)新2個(gè)層面拆解DeepSeek這類(lèi)企業(yè)能夠“橫空出世”的外在機(jī)會(huì)和內(nèi)在邏輯,隨著AI領(lǐng)域和DeepSeek的持續(xù)發(fā)展,我們后續(xù)補(bǔ)充超越追趕理論的其他模塊,從而更系統(tǒng)地進(jìn)行分析。

為什么這次先從機(jī)會(huì)窗口和技術(shù)創(chuàng)新2個(gè)層面展開(kāi),原因在于VUCA時(shí)代之下順勢(shì)而為是每一個(gè)在位者企業(yè)和后發(fā)者企業(yè)的必然選擇,技術(shù)壁壘是每一個(gè)在位者企業(yè)和后發(fā)者企業(yè)的立身之本,而機(jī)會(huì)窗口體現(xiàn)的就是順勢(shì)而為,技術(shù)創(chuàng)新強(qiáng)調(diào)的就是技術(shù)壁壘。

三、DeepSeek的機(jī)會(huì)窗口長(zhǎng)什么樣?

機(jī)會(huì)窗口是市場(chǎng)上絕大多數(shù)企業(yè)都接受某一產(chǎn)品的概念模式,但具有主導(dǎo)地位的產(chǎn)品架構(gòu)還沒(méi)有形成的這一特殊時(shí)期(引自《超越追趕》),在機(jī)會(huì)窗口時(shí)期,后發(fā)者企業(yè)追趕以及超越的阻力相對(duì)更小,或者說(shuō)領(lǐng)先者與后發(fā)者之間的優(yōu)劣勢(shì)差距相對(duì)更小,為后發(fā)者追趕及超越創(chuàng)造了機(jī)會(huì)。

而面對(duì)不同有利條件類(lèi)型的機(jī)會(huì)窗口時(shí),企業(yè)得選擇適配的追趕模式,并防范掉入追趕陷阱(即落后-引進(jìn)-再落后-再引進(jìn)的惡性循環(huán))。

具體來(lái)說(shuō),不同的有利條件指的是企業(yè)外部的市場(chǎng)環(huán)境、技術(shù)環(huán)境以及企業(yè)內(nèi)部的資源能力情況等三個(gè)影響因素的不同組合情況,市場(chǎng)環(huán)境的有利性可以體現(xiàn)為市場(chǎng)需求大或者潛在需求增長(zhǎng)快,生產(chǎn)經(jīng)營(yíng)容易獲得規(guī)模經(jīng)濟(jì)和學(xué)習(xí)效應(yīng)(主動(dòng)獲取多樣化信息和知識(shí),并通過(guò)相互交流提高吸收程度和運(yùn)用深度);技術(shù)條件的有利性可以體現(xiàn)為技術(shù)演進(jìn)具有可預(yù)測(cè)性且變動(dòng)慢,或者技術(shù)演化處于混沌期;而資源能力的有利性可以體現(xiàn)為內(nèi)部資源豐富、調(diào)度外部資源能力強(qiáng)等。

我們從《超越追趕》理論總結(jié)的不同有利性組合情況可以看出,市場(chǎng)、技術(shù)、資源能力三個(gè)因素中至少有2個(gè)處于有利條件時(shí),整體環(huán)境有利性才是相對(duì)可觀(guān)的、也是相對(duì)靠譜的,在追趕超越模式上,企業(yè)可以根據(jù)實(shí)際情況相應(yīng)采取或自主研發(fā)或合作共贏或引進(jìn)學(xué)習(xí)或兼并收購(gòu)等超越方式。

有了以上關(guān)于機(jī)會(huì)窗口相關(guān)知識(shí)邏輯的補(bǔ)充,我們把目光轉(zhuǎn)向DeepSeek來(lái)看其所處的市場(chǎng)環(huán)境、技術(shù)環(huán)境和自身資源能力方面的處境究竟如何?以及它選擇了哪條超越模式的道路?

  • 市場(chǎng)環(huán)境方面,隨著B(niǎo)端和C端對(duì)AI的認(rèn)知、習(xí)慣和需要的進(jìn)一步加深,同時(shí)各行各業(yè)急需通過(guò)AI技術(shù)革命實(shí)現(xiàn)新的商業(yè)升級(jí)來(lái)解決增長(zhǎng)乏力的問(wèn)題,低成本、優(yōu)性能的AI大模型和場(chǎng)景應(yīng)用的市場(chǎng)需求是日益增長(zhǎng)、越發(fā)緊迫;而且,美國(guó)對(duì)中國(guó)設(shè)置芯片禁令等科技封鎖的手段,導(dǎo)致中國(guó)面臨AI、新能源等多行業(yè)卡脖子的問(wèn)題,這個(gè)時(shí)候高效率、低成本的大模型技術(shù)突破成了中國(guó)擺脫卡脖子問(wèn)題、推動(dòng)國(guó)內(nèi)AI發(fā)展和國(guó)產(chǎn)芯片發(fā)展的關(guān)鍵需求所在;此外,中國(guó)國(guó)內(nèi)信創(chuàng)替代(即國(guó)產(chǎn)替代)、數(shù)據(jù)本地化等政策的推動(dòng),更有利于國(guó)內(nèi)AI大模型公司的發(fā)展;總體上看,視窗環(huán)境是有利的。
  • 技術(shù)環(huán)境方面,目前AI大模型技術(shù)的發(fā)展路徑仍屬于百花齊放階段,在模型架構(gòu)、訓(xùn)練方式、算法創(chuàng)新上有不同選擇來(lái)解決不同的需求,模型架構(gòu)創(chuàng)新方面包括Transformer架構(gòu)及其變體、多模態(tài)融合架構(gòu)等并行路徑,訓(xùn)練方式創(chuàng)新方面有預(yù)訓(xùn)練+微調(diào)、強(qiáng)化學(xué)習(xí)等并行路徑,算法創(chuàng)新方面有深度學(xué)習(xí)算法、擴(kuò)散模型等并行路徑,主導(dǎo)范式仍未形成,AI大模型處于技術(shù)演進(jìn)的混沌期(即技術(shù)范式轉(zhuǎn)變、技術(shù)演進(jìn)非線(xiàn)性、方向尚不明確的階段);總體上看,技術(shù)環(huán)境是相對(duì)有利的。
  • 資源能力方面,DeepSeek脫胎于母公司幻方量化,作為量化投資的資深玩家,幻方量化在AI領(lǐng)域及金融領(lǐng)域擁有強(qiáng)大的技術(shù)積累、硬件資源和數(shù)據(jù)資產(chǎn),可以為DeepSeek的大模型研發(fā)給到全面的保障和支持;同時(shí),DeepSeek利于技術(shù)開(kāi)源策略,憑借其資深的行業(yè)積累和技術(shù)創(chuàng)新,吸引了全球開(kāi)發(fā)者和企業(yè)的參與到整體的開(kāi)發(fā)中,生態(tài)資源可以不斷豐富;總體上看,內(nèi)外部的資源能力是有利的。

當(dāng)三個(gè)環(huán)境因素均相對(duì)有利的情況下,機(jī)會(huì)窗口是相對(duì)明朗的、相對(duì)容易打開(kāi)的,DeepSeek或者類(lèi)似DeepSeep處境的后發(fā)者可以通過(guò)借機(jī)會(huì)窗口的力、走自主研發(fā)的路,進(jìn)而獲得超越領(lǐng)先者的機(jī)會(huì)。事實(shí)上,DeepSeek走的也正是“自主研發(fā)”的路線(xiàn),只不過(guò)是建立在引入Google的Transformer大模型的基礎(chǔ)上,進(jìn)行二次創(chuàng)新后的自主研發(fā),嚴(yán)格來(lái)說(shuō)應(yīng)該屬于引進(jìn)后的二次創(chuàng)新。

四、DeepSeek的技術(shù)二次創(chuàng)新是什么?

《超越追趕》總結(jié)了關(guān)于后發(fā)者技術(shù)追趕實(shí)現(xiàn)后發(fā)優(yōu)勢(shì)的兩種策略,一種是以較低代價(jià)獲取領(lǐng)先者所費(fèi)不菲積累起來(lái)的先進(jìn)設(shè)備和技術(shù),并結(jié)合自身的條件和環(huán)境,對(duì)先進(jìn)技術(shù)進(jìn)行消化吸收,且在此基礎(chǔ)上展開(kāi)技術(shù)創(chuàng)新,最終實(shí)現(xiàn)趕超;一種是后發(fā)者跳過(guò)舊范式直接緊隨新范式。第一種策略適用于技術(shù)生命周期較長(zhǎng)、領(lǐng)先者創(chuàng)新迭代速度緩慢的行業(yè)場(chǎng)景,后發(fā)者具備較長(zhǎng)的時(shí)間窗口來(lái)消化吸收和在創(chuàng)新;而第二種策略適用于技術(shù)進(jìn)步周期短的高新技術(shù)領(lǐng)域,如電子通信、人工智能等。

DeepSeek采取的正是第二種策略,在成熟的Transformer大模型基礎(chǔ)上,通過(guò)自主研發(fā),從模型架構(gòu)、訓(xùn)練方式兩方面進(jìn)行創(chuàng)新迭代,形成了“架構(gòu)優(yōu)化+訓(xùn)練方式優(yōu)化”的創(chuàng)新策略,減少了對(duì)高性能硬件(GPU)的依賴(lài)。

  • 架構(gòu)優(yōu)化,主要表現(xiàn)為多頭潛在注意力機(jī)制(MLA)+混合專(zhuān)家機(jī)制(MoE)的配合,降低了對(duì)內(nèi)存和計(jì)算資源的需求。DeepSeek將傳統(tǒng)的多頭注意力機(jī)制升級(jí)為多頭潛在注意力機(jī)制(MLA),如同將一個(gè)廠(chǎng)房濃縮成了一個(gè)小車(chē)間,從而大幅降低對(duì)內(nèi)存和計(jì)算資源的需求。同時(shí),DeepSeek在傳統(tǒng)的Transformer架構(gòu)基礎(chǔ)上、通過(guò)自主研發(fā)引入了混合專(zhuān)家(MoE)機(jī)制,將模型中的“計(jì)算任務(wù)”分配給多個(gè)專(zhuān)家模塊,每次只激活任務(wù)相關(guān)性較高的少數(shù)專(zhuān)家,進(jìn)一步減少了計(jì)算資源的需求。
  • 訓(xùn)練方式優(yōu)化,主要表現(xiàn)為規(guī)則化獎(jiǎng)勵(lì)+GPRO模式配合的強(qiáng)化學(xué)習(xí)模式。DeepSeek拋棄了傳統(tǒng)大模型通過(guò)加強(qiáng)預(yù)訓(xùn)練來(lái)實(shí)現(xiàn)性能提升的方式,選用通過(guò)提升推理時(shí)的思考能力來(lái)實(shí)現(xiàn)性能提升的方式(如同不讓小孩花大量精力去刷題背題,而是讓他去做更多的邏輯思考,該比喻引自視頻號(hào)AI享科技)。具體的實(shí)現(xiàn)邏輯是在僅依靠準(zhǔn)確性獎(jiǎng)勵(lì)和格式獎(jiǎng)勵(lì)兩條獎(jiǎng)勵(lì)規(guī)則的引導(dǎo)下,讓大模型自己找到最優(yōu)答案,并通過(guò)GRPO(Group Relative Policy Optimization)的優(yōu)化機(jī)制形成“輸入問(wèn)題 → 模型生成多個(gè)答案 → 規(guī)則系統(tǒng)評(píng)分 → GRPO計(jì)算相對(duì)優(yōu)勢(shì) → 更新模型”的模型迭代流程,提升模型的學(xué)習(xí)效率、甚至形成頓悟的效果(如同老師出題后,讓多個(gè)小朋友一起做卷子,大模型選出分?jǐn)?shù)最高的卷子和小朋友,其他小朋友抄就可以了,該比喻引自視頻號(hào)AI享科技)。

架構(gòu)優(yōu)化和訓(xùn)練方式優(yōu)化結(jié)合的技術(shù)創(chuàng)新策略,不僅帶來(lái)了大模型效率效能的提升,還帶來(lái)了成本優(yōu)勢(shì)的大幅領(lǐng)先。從DeepSeek-R1論文的性能數(shù)據(jù)上可以看出,在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)類(lèi)型的性能上已堪比頂級(jí)大模型水平,同時(shí)其成本卻不到頂級(jí)大模型的三十分之一,這足以體現(xiàn)DeepSeek大模型在技術(shù)創(chuàng)新實(shí)現(xiàn)了跨越范式的創(chuàng)新,即在AI大模型領(lǐng)域的市場(chǎng)競(jìng)爭(zhēng)上,形成了以算法(高效率、低成本)為主線(xiàn)的新的競(jìng)爭(zhēng)范式,而不是之前算力為主線(xiàn)的競(jìng)爭(zhēng)范式。

DeepSeek的R1、V3和OPEN AI的O1性能比對(duì)

API費(fèi)用對(duì)比

相關(guān)的技術(shù)對(duì)比和成本對(duì)比不在本文中贅述,詳細(xì)內(nèi)容可見(jiàn)文章開(kāi)頭的內(nèi)容推薦

DeepSeek的機(jī)會(huì)把握和技術(shù)創(chuàng)新,打破了當(dāng)前AI大模型的競(jìng)爭(zhēng)格局,建立了中國(guó)AI走向前沿的信心。DeepSeek創(chuàng)始人梁文鋒在接受“暗涌”采訪(fǎng)時(shí)說(shuō):“我們看到的是,中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置。中國(guó)AI和美國(guó)有一兩年的差距,但真實(shí)的GAP是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的。英偉達(dá)的領(lǐng)先,不只是一個(gè)公司的努力,而是整個(gè)西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果。他們能看到下一代的技術(shù)趨勢(shì),手里有路線(xiàn)圖。中國(guó)AI的發(fā)展,同樣需要這樣的生態(tài)。”

超越追趕是每一個(gè)后發(fā)企業(yè)可以有也應(yīng)該有的目標(biāo)和夢(mèng)想,不局限于當(dāng)前備受?chē)?guó)家關(guān)注的AI、芯片、新能源等行業(yè),也應(yīng)該是當(dāng)前備受煎熬的軟件行業(yè)的重要課題。追趕超越可以是一個(gè)企業(yè)通過(guò)機(jī)會(huì)窗口的把握、技術(shù)創(chuàng)新和商業(yè)模式創(chuàng)新雙輪驅(qū)動(dòng)之下實(shí)現(xiàn)的,但要實(shí)現(xiàn)更大范圍、更高戰(zhàn)略規(guī)劃時(shí)的追趕超越,我們更加需要有更加完整的價(jià)值網(wǎng)絡(luò)和產(chǎn)業(yè)聯(lián)盟,目的只有一個(gè):看清路線(xiàn)圖,順勢(shì)而為。

文獻(xiàn)參考

  • 【2025年1月發(fā)布的R1大模型的論文】DeepSeek-R1論文.pdf
  • Nature新聞:China’s cheap, open AI model DeepSeek thrills (scientists(https://www.nature.com/articles/d41586-025-00229-6)
  • 一文讀懂:DeepSeek新模型大揭秘,為何它能震動(dòng)全球AI圈(https://www.36kr.com/p/3135022841879040
  • 為什么老外在deepseek上面慢半拍?(https://finance.sina.com.cn/roll/2025-01-26/doc-inehhqya0549350.shtml)
  • DeepSeek 發(fā)展歷程(截止到25年1月)(https://zhuanlan.zhihu.com/p/17511493759)

本文由 @運(yùn)營(yíng)在洞察 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀(guān)點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!