在開源面前,OpenAI沒有護(hù)城河:大模型的安卓時(shí)刻來了
就在近日,Meta 發(fā)布了最新一代的開源大模型 Llama 2,此外,Meta 還允許了該模型的免費(fèi)商用。而這一動(dòng)作無疑引發(fā)了大量網(wǎng)友的關(guān)注。本篇文章里,作者便發(fā)表了他的看法和解讀,一起來看一下。
過去半年里,OpenAI 正通過 GPT 驚艷所有人。
人們普遍認(rèn)為 GPT 的誕生是新時(shí)代的 “ iPhone ” 時(shí)刻,它將像 iPhone 把人們帶往移動(dòng)互聯(lián)網(wǎng)時(shí)代一樣,成為新的 AI 大模型時(shí)代的門鑰匙。
不過,移動(dòng)互聯(lián)網(wǎng)的繁榮進(jìn)程中,不只有 iPhone 的功績(jī),還有安卓及其背后各大安卓陣營(yíng)手機(jī)廠商的功績(jī)。
甚至,單從出貨量角度來看,安卓陣營(yíng)對(duì)移動(dòng)互聯(lián)網(wǎng)時(shí)代的貢獻(xiàn)似乎更大。
而現(xiàn)在,屬于 AI 大語言模型的 “ 安卓時(shí)刻 ”,要來了。
當(dāng)?shù)貢r(shí)間 7 月 18 日,Meta 發(fā)布了最新一代的開源大模型 Llama 2。
根據(jù) Meta 官網(wǎng)的公開數(shù)據(jù),本次發(fā)布的 Llama 2 模型系列共包括 70 億、130 億 和 700 億三個(gè)參數(shù)的變體模型。
Llama 2 經(jīng)過兩萬億個(gè) tokens 的訓(xùn)練,人工注釋數(shù)據(jù)超過 100 萬條。而相比于 Llama 1,Llama 2 的訓(xùn)練數(shù)據(jù)增加了 40%,上下文長(zhǎng)度也是前者的兩倍。
經(jīng)過此次升級(jí),根據(jù) Meta 公開的論文顯示,雖然目前 Llama 2 在各項(xiàng)大模型測(cè)試中仍遜色于 GPT-3.5,但在與目前開源大模型的跑分對(duì)比中,已經(jīng)有了屠榜一般的表現(xiàn)。
Llama 2 與 GPT、PaLM 的跑分對(duì)比
Llama 2 與其他開源大模型跑分對(duì)比
或許你一看到Llama 2 遜色于 GPT-3.5 就會(huì)覺得嗤之以鼻,畢竟后者已經(jīng)進(jìn)化到 4.0 的版本了。
但,你要明白,安卓在剛推出的時(shí)候,也是非常拉胯的,而開源讓安卓陣營(yíng)現(xiàn)在能與 iPhone 分庭抗禮。
所以,此次 Llama 2 發(fā)布最大的亮點(diǎn)其實(shí)在于:
Meta 在開源基礎(chǔ)上更進(jìn)一步,允許了該模型的免費(fèi)商用。(月活大于 7 億的產(chǎn)品需要單獨(dú)申請(qǐng)商用權(quán)限,但很少有企業(yè)能達(dá)到這個(gè)標(biāo)準(zhǔn))
圖靈獎(jiǎng)得主,Meta 首席科學(xué)家楊立昆也在推特直言,這將改變大語言模型市場(chǎng)的格局:
知危編輯部也聯(lián)系到了在學(xué)術(shù)圈和開源社區(qū)都頗具影響力的智源 AI 研究院,他們的評(píng)價(jià)是:
開源是必由之路, 說 Llama 2 的發(fā)布是“ 安卓時(shí)刻 ”也不無道理,用開源來占領(lǐng)市場(chǎng),就是一個(gè)競(jìng)爭(zhēng)策略。
與Llama 2 商用開源相對(duì)應(yīng)的是,OpenAI 在開源面前的態(tài)度一直含糊不清。
開源,或者說是開放源碼運(yùn)動(dòng),正式開始于上世紀(jì)的九十年代末,參與者們信仰軟件的開放源代碼、信息共享和自由使用。
Android 的興起、GitHub 的流行,都和開源脫不了關(guān)系。Linux 系統(tǒng)也誕生于這波運(yùn)動(dòng)中, 如今的路由器、交換機(jī)、智能洗衣機(jī)、智能電飯煲、交換機(jī)、服務(wù)器等等設(shè)備上,幾乎搭載了各類 Linux 系統(tǒng)。
包括幾年前的美國(guó)火星車登陸成功,也象征著火星成為第二個(gè) Linux 計(jì)算機(jī)數(shù)量超過 Windows 的星球。
毫不夸張地說,如今開源改變了軟件的協(xié)作和創(chuàng)新模式,改變了技術(shù)格局。
但在大語言模型領(lǐng)域,領(lǐng)頭羊 OpenAI 卻似乎和名字里的 Open 背道而馳。
即便 OpenAI 創(chuàng)始人山姆·奧特曼多次在公開場(chǎng)合提到,將在未來開放 GPT-3、GPT-4 的源碼,但這至今依舊是空頭支票。
包括馬斯克在退出 OpenAI 之后,也多次公開炮轟 OpenAI,不滿 OpenAI 大肆賺取利潤(rùn), 并逐漸閉源。
OpenAI 首席科學(xué)家 Sutskever 對(duì)此的回應(yīng)則是,過早開源會(huì)讓 OpenAI 失去技術(shù)領(lǐng)先的地位,并且大語言模型的威力巨大,開源恐有安全隱患。
馬斯克質(zhì)疑 OpenAI 不 Open
不同于 OpenAI 在開源面前的畏畏縮縮,Meta 則是堅(jiān)定的開源支持者,并且在一定程度上推動(dòng)了 AI 的歷史進(jìn)程。
而 Meta 今天的這一決策,和 Meta 的首席科學(xué)家楊立昆,勢(shì)必有著一定的關(guān)系。
早在 2014 年,扎克伯格就意識(shí)到了 AI 的前景,在 DeepMind 最終被谷歌收購(gòu)之后, 扎克伯格轉(zhuǎn)頭找到了 AI 學(xué)術(shù)領(lǐng)域的大佬楊立昆。
曾在大名鼎鼎的貝爾實(shí)驗(yàn)室工作過的楊立昆,是 “ 卷積神經(jīng)網(wǎng)絡(luò) ” 的開發(fā)者之一,彼時(shí)的他正在紐約教書。
根據(jù) VOX 的報(bào)道,為了得到楊立昆這匹千里馬,扎克伯格答應(yīng)了科研成果必須開源、實(shí)驗(yàn)室必須建在紐約、實(shí)驗(yàn)團(tuán)隊(duì)不需要考慮盈利等等要求。
楊立昆任職期間成果頗豐,諸如開發(fā)了風(fēng)靡全球的 AI 框架 Pytorch,改進(jìn)了 GAN( 生成式對(duì)抗網(wǎng)絡(luò) ),推出大語言模型 Llama 和 AI 圖像模型 SAM 等等。
正如當(dāng)年所約定的那樣,這些項(xiàng)目已全部開源。
在大語言模型的浪潮之下,Llama 大語言模型也備受開源社區(qū)的歡迎。
諸如 Hugging Face 等開源社區(qū)中,充斥著各種被魔改后的羊駝( Llama 的中文譯為羊駝 )。
包括斯坦福的 Alpaca、UCB 的 Vicuna……各種基于 LlamA 的修改的模型紛紛涌現(xiàn)。
在不少的大模型跑分榜單上,GPT-3.5 和 GPT-4 之下,幾乎都是羊駝家族屠榜。
另外,對(duì)于 OpenAI 口中出于安全考慮的閉源理由,楊立昆也是不太認(rèn)同的。
在他看來,使人工智能平臺(tái)安全、良善、實(shí)用的唯一方法就是開源。
換句話說,技術(shù)掌握在少數(shù)人的手里是危險(xiǎn)的,只有讓監(jiān)管 AI 的力量也同時(shí)進(jìn)化,才能盡可能地管住 AI。
在目前看來,暫時(shí)只有開源能辦到。
總的來講,在 OpenAI 領(lǐng)銜的大語言模型浪潮中,Meta 所帶領(lǐng)的開源大軍,正在開源社區(qū)中瘋狂攻城掠地。
另一方面,開源和閉源之間的沖突也在逐漸白熱化。
在今年的五月份,一位谷歌研究人員 “ 不小心 ” 泄露的備忘錄,就把這場(chǎng)大戰(zhàn)擺在了臺(tái)面上。
知危編輯部簡(jiǎn)單總結(jié)了一下這份備忘錄中,谷歌研究員的提到幾個(gè)要點(diǎn):
- 開源 AI 正在蠶食谷歌和 Open AI 的領(lǐng)地;
- 小模型比大模型更具有競(jìng)爭(zhēng)力;
- 數(shù)據(jù)質(zhì)量遠(yuǎn)比數(shù)據(jù)數(shù)量更重要;
- 谷歌打不過開源;
- 相比于開源需要谷歌,谷歌更需要一個(gè)開源生態(tài)。
再簡(jiǎn)短點(diǎn)講,這份洋洋灑灑上千字的文章就透露著一個(gè)最核心的信息:
在開源面前,谷歌和 OpenAI 都沒有護(hù)城河。
所以,再回看這次發(fā)布的 Llama 2 ,Meta直接把商業(yè)用途的限制給去掉了,實(shí)屬是又給閉源陣營(yíng)將了一軍。
開源的 Llama2 不僅免費(fèi),還更能供開發(fā)者自行調(diào)整,從而滿足大部分商業(yè)公司的低成本和個(gè)性化需要。
但,最終開源和閉源誰才是勝者,知危編輯部覺得并不好下定論。
畢竟開源也并不是萬能解藥,開發(fā)人員良莠不齊、公開的一些安全隱患等等,都是開源經(jīng)常遇到一些問題。
開源和閉源之爭(zhēng),歸根結(jié)底是競(jìng)爭(zhēng)策略不同,一個(gè)更注重?cái)U(kuò)大市場(chǎng)和制定標(biāo)準(zhǔn),一個(gè)更看重盈利和本身技術(shù)的領(lǐng)先。
諸如安卓與 iOS、Linux 與 Windows,最后或許并無真正的輸贏之分,而是在不同的需求下,找到自己的合理定位。
但,毫無疑問,Llama 2 攪動(dòng)了整個(gè)市場(chǎng),已經(jīng)讓生態(tài)開始有微妙的變化:
- OpenAI 股東之一的微軟,這次成了 Llama 2 的首選合作伙伴,微軟似乎正在兩頭押注。
- Meta 宣布 Llama 2 將能在高通芯片上運(yùn)行,這對(duì)AI 芯片霸主英偉達(dá)而言勢(shì)必是種挑戰(zhàn)。
總之,這大語言模型圈兒的戲,是越來越復(fù)雜,越來越有趣了。
如果因?yàn)長(zhǎng)lama 2 攪的這場(chǎng)渾水,讓 AI 時(shí)代能更快來臨的話,請(qǐng)大家記得,這不僅是 Meta 的功勞,也是開源社區(qū)的功勞:
開源推動(dòng)進(jìn)步,開源萬歲~
聲明:本文僅供交流,不構(gòu)成任何投資建議。
作者:江江,西西;編輯:大餅
原文標(biāo)題:在開源面前,OpenAI沒有護(hù)城河:今天,大模型的安卓時(shí)刻來了
來源公眾號(hào):知危(ID:BusinessAlert),提供敏銳、獨(dú)到的商業(yè)信息與參考,重點(diǎn)關(guān)注TMT、出海、新消費(fèi)、新能源。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @知危 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!