互聯(lián)網(wǎng)大佬們持續(xù)加碼,眾人都想復(fù)制ChatGPT
ChatGPT 出現(xiàn)之后,大廠們就掀起了一場(chǎng)追逐賽,國(guó)內(nèi)外科技巨頭都在這一領(lǐng)域加大了投入,大眾關(guān)于通用模型也有了更深刻的認(rèn)知。那么對(duì)于大廠們和創(chuàng)業(yè)者們而言,投注?ChatGPT 可以為其帶來什么?一起來看看作者的分析。
如果非要用一個(gè)詞來形容ChatGPT最近的熱度,那我只能稱之為“絕殺”。
已經(jīng)很久沒有一個(gè)科技圈的熱點(diǎn)能夠承包全網(wǎng)小編2周的KPI。從北京中關(guān)村到加州硅谷,從創(chuàng)投大佬到普通學(xué)生,都在使用、討論和分享,真正屬于是“環(huán)球同此涼熱”。
這么些年來,和AI相關(guān)的熱點(diǎn)不是沒有,比如之前阿爾法狗和自動(dòng)駕駛。熱度來的快去的也快,阿爾法狗幾乎已經(jīng)無人提及,自動(dòng)駕駛遭遇寒冬,企業(yè)集體降維求生。
但這次是真不一樣。ChatGPT顛覆了大眾對(duì)于AI的認(rèn)知,真正把通用模型擺到了普通用戶的面前,不僅能幫你寫材料,敲代碼,還能通過選拔性考試的測(cè)驗(yàn),美國(guó)賓夕法尼亞大學(xué)稱,ChatGPT能夠通過該校工商管理碩士MBA課程的期末考試。
ChatGPT的強(qiáng)大甚至還讓國(guó)際頂刊《自然》雜志宣布,將人工智能工具列為作者的論文,不能在雜志上發(fā)表。
業(yè)界大佬們也紛紛出來為它站臺(tái)。馬斯克和比爾蓋茨曾經(jīng)堅(jiān)定的相信“AI威脅論”,為了預(yù)防人工智能帶來的災(zāi)難性影響,推動(dòng)人工智能發(fā)揮積極作用,馬斯克還參與建立了一家非營(yíng)利機(jī)構(gòu),OpenAI(是的,就是ChatGPT的研發(fā)公司)。
現(xiàn)在這兩人,一個(gè)稱贊“ChatGPT好嚇人,我們離強(qiáng)大到危險(xiǎn)的人工智慧不遠(yuǎn)了”,一個(gè)甚至表示“ChatGPT的意義不亞于PC和互聯(lián)網(wǎng)的誕生”。
更為不同尋常的是大廠們的動(dòng)作。面對(duì)ChatGPT,大廠們的反應(yīng)強(qiáng)烈,谷歌冒著翻車的危險(xiǎn)也要強(qiáng)行上線內(nèi)測(cè)產(chǎn)品,國(guó)內(nèi)包括百度、阿里、騰訊、科大訊飛、京東等都宣布了相關(guān)的研發(fā)上線時(shí)間表。
小公司為提振股價(jià)強(qiáng)行蹭熱度還可以理解,業(yè)務(wù)穩(wěn)定的大公司為何非要冒這個(gè)風(fēng)險(xiǎn)呢?
一、AI不會(huì)取代你,一個(gè)使用AI的人會(huì)取代你
要理解ChatGPT的革命性,不如先從搜索聊起。
90后以前的互聯(lián)網(wǎng)用戶們應(yīng)該都知道,國(guó)內(nèi)的中文信息服務(wù)大致經(jīng)歷了三個(gè)階段。
第一個(gè)階段是導(dǎo)航網(wǎng)站和門戶網(wǎng)站階段,尋找信息要經(jīng)由導(dǎo)航網(wǎng)站。
第二階段是搜索引擎階段。Page Rank算法的誕生讓用戶的開放性問題被轉(zhuǎn)換成互聯(lián)網(wǎng)信息圖譜上具有關(guān)聯(lián)性優(yōu)先級(jí)的、一個(gè)更具體的選項(xiàng)擴(kuò)列,人們可以通過搜索來獲得自己想要的信息。
第三階段是移動(dòng)互聯(lián)網(wǎng)階段。智能手機(jī)的普及和字節(jié)的推薦算法讓那些你想要的信息自動(dòng)被推送到你的面前。
不難看出,每一個(gè)階段的更迭都伴隨著效率的提升。如果把以上三個(gè)階段的效率分別比作步行,馬車和汽車,那么ChatGPT則更像是“導(dǎo)彈”。
這也就難怪谷歌CEO皮柴會(huì)如此火急火燎的在官網(wǎng)上宣布上馬類ChatGPT產(chǎn)品——一款實(shí)驗(yàn)性的對(duì)話AI服務(wù)Bard,即便這款產(chǎn)品在內(nèi)部算不上準(zhǔn)備充足。
因?yàn)榧叶伎毂煌盗恕?/p>
但ChatGPT,或者說將其包含在內(nèi)的AIGC展現(xiàn)的潛力,遠(yuǎn)不止搜索這一個(gè)領(lǐng)域。
比如今年2月8日,微軟就推出了由 ChatGPT 提供技術(shù)支持的高級(jí) Teams 產(chǎn)品, 不僅可以自動(dòng)幫助參會(huì)者生成會(huì)議記錄,即使沒有參加會(huì)議,智能回顧功能也能幫助用戶生成會(huì)議記錄和要點(diǎn)。
由ChatGPT中分拆而出的CodeX則成為了自動(dòng)補(bǔ)齊代碼應(yīng)用 Copilot 的基礎(chǔ),這款旨在輔助程序員寫代碼的應(yīng)用從去年 8 月開始收費(fèi),每月 10 美元。
至于實(shí)際效果?特斯拉前任AI總監(jiān)Andrej Karpathy透露,現(xiàn)在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準(zhǔn)確率。
游戲產(chǎn)業(yè)同樣面臨著來自ChatGPT的挑戰(zhàn)。國(guó)外開發(fā)者Bloc利用ChatGPT為游戲《騎馬與砍殺2》開發(fā)了一個(gè)實(shí)驗(yàn)性Mod,在ChatGPT的幫助下,原本相對(duì)呆板的NPC變得靈動(dòng)起來,不再只能重復(fù)幾句固定的臺(tái)詞。
此前社交媒體上討論火熱的AI繪畫同樣如此。去年8月,游戲設(shè)計(jì)師Jason Allen通過AI繪圖工具M(jìn)idjourney生成原畫,再經(jīng)過Photoshop潤(rùn)色而完成的作品《太空歌劇院》在科羅拉多州博覽會(huì)上獲得了數(shù)字類別的一等獎(jiǎng)。雖然AI繪畫的能力并不能和資深的人類畫師媲美,但無疑大大提高了創(chuàng)作的生產(chǎn)效率。據(jù)深燃報(bào)道,有業(yè)內(nèi)人士表示,“AI繪圖就已經(jīng)是生產(chǎn)力的一部分?!?/strong>
根據(jù)騰訊研究院《AIGC發(fā)展趨勢(shì)2023》,AIGC產(chǎn)業(yè)生態(tài)正在加速形成和發(fā)展,走向模型及服務(wù)的未來,其中包括以預(yù)訓(xùn)練模型為主的基礎(chǔ)層;以垂直化、場(chǎng)景化、個(gè)性化模型為主的中間層;和以圖像、語音、文字生成等具體AIGC應(yīng)用為主的應(yīng)用層。
這意味著ChatGPT這樣的產(chǎn)品或?qū)⒅饾u成為一種類似基礎(chǔ)設(shè)施的存在,一如pc和手機(jī)。
當(dāng)下,已經(jīng)有許多公司開始利用 GPT-3 系列模型做應(yīng)用端的開發(fā),根據(jù) gpt3demo 網(wǎng)站統(tǒng)計(jì),現(xiàn)在已經(jīng)有了 628 個(gè)調(diào)用 GPT-3 系列模型開發(fā)的應(yīng)用程序。背靠 GPT-3 模型的寫作輔助工具 Jasper,成立 18 個(gè)月估值達(dá) 15 億美元。
簡(jiǎn)而言之就是,以ChatGPT為代表的AIGC是目前少數(shù)可預(yù)見的,可以提升整個(gè)社會(huì)生產(chǎn)效率的可落地工具,就像蒸汽機(jī)解放雙手,汽車解放雙腿那樣。在這樣的大前提下,移動(dòng)互聯(lián)網(wǎng)時(shí)期字節(jié)超車百度的事件可能會(huì)再次重演。
ChatGPT 在 LinkedIn 分享的一篇,原本針對(duì)“ChatGPT會(huì)不會(huì)讓我失業(yè)”的帖子或許也適合回答開頭末尾的那個(gè)問題:“AI 不會(huì)取代你。一個(gè)使用 AI 的人將取代你”。
二、大廠的游戲
ChatGPT所在的AI賽道是典型的資金密集型,能夠參與到這個(gè)游戲的玩家寥寥無幾。這點(diǎn)從OpenAI的發(fā)展歷程就能看出。
OpenAI 在2015年末成立時(shí)是一家非營(yíng)利性機(jī)構(gòu),創(chuàng)始人都是硅谷大名鼎鼎的人物,比如特斯拉CEO馬斯克,YC總裁阿爾特曼等,但在“委身”微軟前,資金總是捉襟見肘。
這和2018年以后,OpenAI堅(jiān)持大模型訓(xùn)練有關(guān)。2015年以前,小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因?yàn)樾⌒偷哪P蛯?duì)于硬件的要求較低,同時(shí)和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點(diǎn)在于,對(duì)通用任務(wù)的處理表現(xiàn)并不好。換言之,他們很難針對(duì)特定領(lǐng)域或者場(chǎng)景去進(jìn)行定制。
在這個(gè)背景下,大模型脫穎而出。大模型可泛化能力強(qiáng),可以做到“舉一反三”,同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個(gè)場(chǎng)景的任務(wù),從而擺脫小模型應(yīng)用碎片化、作坊式開發(fā)的特點(diǎn)。簡(jiǎn)單來說,就是大模型更加“通用”。
2019年,OpenAI推出了大型語言模型GPT-2,參數(shù)超過15億,是上一代語言模型 GPT 的十倍,后續(xù)迭代的GPT3的參數(shù)更是達(dá)到1750億。大模型的訓(xùn)練讓自然語言模型取得了突破性的進(jìn)展,GPT-2已經(jīng)能根據(jù)用戶輸入的文字生成看上去邏輯正常的文字。
但大模型太花錢了。布羅克曼等人測(cè)算,訓(xùn)練大模型消耗的計(jì)算量,每 3、4 個(gè)月會(huì)翻一倍。據(jù)多位業(yè)內(nèi)人士估算,OpenAI 訓(xùn)練 GPT-3 一年,僅算力成本就有 2000 萬美元。
由于研發(fā)所需資金太大,OpenAI 在2019年轉(zhuǎn)變?yōu)橛舷扌徒M織,和微軟達(dá)成了資本掙到有限收益之后,后續(xù)收益歸非盈利實(shí)體。截至目前,微軟對(duì)OpenAI最新一輪投資額達(dá)100億美元。
無論是訓(xùn)練模型所需的龐大數(shù)據(jù)和算力,還是參與開發(fā)的頂級(jí)人工智能科學(xué)家,亦或是推廣和普及所需的生態(tài)支持,都足見產(chǎn)業(yè)的門檻之高,國(guó)內(nèi)也只有互聯(lián)網(wǎng)巨頭們有這個(gè)數(shù)據(jù)優(yōu)勢(shì)和資金積累。
這也是為什么日前原美團(tuán)聯(lián)合創(chuàng)始人王慧文在社交平臺(tái)官宣出資5000萬美元,要打造中國(guó)的OpenAI,卻被網(wǎng)友質(zhì)疑“5000萬美元夠干什么?”的原因。
基于數(shù)據(jù)安全和應(yīng)用效果的考慮,國(guó)內(nèi)需要有自己的ChatGPT,互聯(lián)網(wǎng)大廠們需要擔(dān)負(fù)起這個(gè)責(zé)任。
三、誰能率先突圍?
ChatGPT的爆火也讓很多國(guó)內(nèi)媒體開始反思,為什么中國(guó)的科技環(huán)境無法誕生這種創(chuàng)新?對(duì)于這類看法,伯虎財(cái)經(jīng)認(rèn)為,對(duì)國(guó)內(nèi)AI產(chǎn)業(yè)的看法不應(yīng)如此悲觀。
首先需要承認(rèn)的是,在ChatGPT上,國(guó)內(nèi)確實(shí)存在一定差距,普遍的看法認(rèn)為這種技術(shù)上的差距在2年左右。
同時(shí)大模型在某種意義代表著一種暴力美學(xué),訓(xùn)練大模型需要空前的語料數(shù)據(jù)。相對(duì)于英語語境,中文互聯(lián)網(wǎng)在表達(dá)習(xí)慣上會(huì)缺乏嚴(yán)謹(jǐn),比如讓許多中年人頭疼的拼音簡(jiǎn)寫,YYDS。這類表達(dá)必然會(huì)影響AI訓(xùn)練的效果和效率。這也是為什么ChatGPT爆火后,內(nèi)容質(zhì)量相對(duì)較高的知乎會(huì)迎來一波股價(jià)暴漲。
不過我們也要看到國(guó)內(nèi)AI產(chǎn)業(yè)也有足夠的底氣。
大模型的訓(xùn)練離不開算法、算力和數(shù)據(jù)。算法決定了其本身的學(xué)習(xí)能力,算力則影響著算法的學(xué)習(xí)效率,數(shù)據(jù)決定了AI的訓(xùn)練效果。
國(guó)內(nèi)擁有世界最大規(guī)模的互聯(lián)網(wǎng)用戶,在數(shù)據(jù)積累方面有一定優(yōu)勢(shì)。而根據(jù)《2021―2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,在算力上中美大致處于同一梯隊(duì)。
和芯片或者操作系統(tǒng)不同,國(guó)內(nèi)玩家在AI產(chǎn)業(yè)不需要面對(duì)前者必須直面的困難,比如核心技術(shù)壟斷,制造上的門檻,即便是ChatGPT,其本質(zhì)仍然屬于自然語言NLP的范疇,是人工智能技術(shù)長(zhǎng)期發(fā)展和積累的結(jié)果。
Meta首席人工智能科學(xué)家Yann LeCun也曾評(píng)論:“就底層技術(shù)而言,ChatGPT 并沒有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開展同樣的工作?!?/p>
也就是說,國(guó)內(nèi)具備追趕甚至超越的能力。當(dāng)前國(guó)內(nèi)大廠基本都具備訓(xùn)練大模型的能力,比如百度的文心大模型,阿里的“通義”大模型,華為的鵬城盤古大模型,騰訊的混元AI大模型等。
從AI相關(guān)技術(shù)來看,百度是少有的具備AI全棧能力的企業(yè),在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局。根據(jù)statista2021年的數(shù)據(jù),騰訊和百度的AI專利儲(chǔ)備分列世界前兩位。
相對(duì)而言,字節(jié)在應(yīng)用端的開發(fā)更領(lǐng)先。根據(jù)tech星球報(bào)道,在ChatGPT被用作寫文章前,字節(jié)跳動(dòng)就研發(fā)了Xiaomingbot自動(dòng)寫稿平臺(tái),自2016年上線以來,已經(jīng)累計(jì)寫了60萬篇文章,覆蓋了17項(xiàng)的體育賽事,支持6種語言。
(圖源:Tech星球)
此前國(guó)內(nèi)AI產(chǎn)業(yè)的投入大多面向其他產(chǎn)業(yè)方向,ChatGPT的橫空出世等于把方向統(tǒng)一了。當(dāng)下各家基本上確定了相關(guān)研發(fā)上線的時(shí)間表,最早的比如百度的“文心一言”在3月完成內(nèi)測(cè)后,就將和公眾見面。
Gartner預(yù)測(cè),到2025年,生成式AI將占到所有生成數(shù)據(jù)的10%,目前這個(gè)比例還不足1%。
在這波新的智能浪潮里,中國(guó)需要土生土長(zhǎng)的ChatGPT,互聯(lián)網(wǎng)大廠們也需要爭(zhēng)做潮頭的破浪者。
參考來源:
- 量子位:ChatGPT讓游戲NPC活了!交流不再靠選項(xiàng),問什么答什么,網(wǎng)友直呼童年夢(mèng)想成真
- 騰訊研究院:《AIGC發(fā)展趨勢(shì)2023》
- 品玩:谷歌發(fā)布自己的ChatGPT!華人團(tuán)隊(duì)主導(dǎo),緊急上線,新的搜索大戰(zhàn)要來了
- 騰訊研究院:一文讀懂:有關(guān)ChatGPT的十個(gè)問題
- 晚點(diǎn)LatePost:火雞追上雄鷹,OpenAI 的成功為何難以復(fù)制丨TECH TUESDAY
作者:陳平安
原文標(biāo)題:王慧文豪擲3.4億,眾人都想復(fù)制ChatGPT
來源公眾號(hào):伯虎財(cái)經(jīng)(ID:bohuFN),聚焦頭部企業(yè),以深度原創(chuàng)為特色,為你發(fā)掘精彩。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @伯虎財(cái)經(jīng) 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!