論關(guān)于GPT發(fā)展的異樣感及其思考

0 評論 4040 瀏覽 2 收藏 8 分鐘

這篇文章主要討論生成式AI領(lǐng)域的發(fā)展,盡管該領(lǐng)域技術(shù)日新月異,但其中仍存在一些問題。作者就這些問題進(jìn)行思考,并對微觀、宏觀兩個(gè)層面提出對應(yīng)的建議。希望能對你有所幫助。

在當(dāng)前火熱的生成式AI行業(yè)中,大模型的技術(shù)日新月異,對于那些一無所知的人來說,就如同面對著未知的世界,無所適從。

可以說,在這些領(lǐng)域上沒有足夠的技術(shù)知識(shí),就像是當(dāng)今社會(huì)的文盲一樣,可能會(huì)錯(cuò)失很多機(jī)會(huì)。

然而,隨著越來越多的企業(yè)、創(chuàng)業(yè)團(tuán)隊(duì)和研究機(jī)構(gòu)進(jìn)入這個(gè)領(lǐng)域,個(gè)人感到頗為奇怪,覺得這個(gè)領(lǐng)域的發(fā)展過快,仿佛有什么不對勁的地方。

這是一個(gè)非常有價(jià)值的話題,因此想在這里簡要分享一下想法。

一、GPT發(fā)展的異樣感

1. 要做中國的類ChatGPT

從各大廠商推出的大模型產(chǎn)品來看,它們借助自身的研發(fā)實(shí)力和財(cái)力,推出了文心一言、通義千問等產(chǎn)品,并早先進(jìn)行內(nèi)測和應(yīng)用。

但是,其本質(zhì)上的思路都是仿照OpenAI的思路,通過數(shù)據(jù)和預(yù)訓(xùn)練模型打造中國版的ChatGPT。初看起來,這似乎是適合我們發(fā)展的道路。

但這里面其實(shí)有著我們目前無法解決的兩個(gè)關(guān)鍵問題:

  1. 算力問題。如我國目前仍未有類似于英偉達(dá)的NVlink技術(shù)(將多個(gè)芯片連在一起的帶寬技術(shù),從而可以提供更為強(qiáng)大的計(jì)算能力),而這項(xiàng)技術(shù)是訓(xùn)練大模型的關(guān)鍵技術(shù)之一。
  2. 數(shù)據(jù)問題。在ChatGPT的訓(xùn)練數(shù)據(jù)中,中文數(shù)據(jù)占比僅為0.09905%,優(yōu)質(zhì)數(shù)據(jù)相較于其他語言,占比太少。

以上兩個(gè)問題,個(gè)人認(rèn)為是涉及到大模型行業(yè)發(fā)展的最重要的問題,沒有之一。

其中,問題1目前國內(nèi)并沒有可以攻克的實(shí)力,更多的需要依賴國外的技術(shù)支持。

問題2關(guān)于中文數(shù)據(jù)的問題,目前中文在全世界應(yīng)用的范圍有限,在解決中文數(shù)據(jù)質(zhì)量及數(shù)量問題上,仍需要時(shí)間。

2. 耗能及成本問題

根據(jù)《ChatGPT挑起的這場AI競賽,有一個(gè)骯臟的秘密》描述:訓(xùn)練GPT-3消耗了1287兆瓦時(shí),并導(dǎo)致超過550噸二氧化碳的排放——相當(dāng)于一個(gè)人在紐約和舊金山之間往返550次。

大模型的訓(xùn)練成本不是一個(gè)中小型甚至是大型公司能夠輕易承受的成本。此外,還需關(guān)注環(huán)境、災(zāi)害管理和訓(xùn)練方法等課題。這些因素會(huì)導(dǎo)致企業(yè)面臨高昂的成本問題。

盡管我個(gè)人認(rèn)為很多初創(chuàng)公司的思考仍然不夠,但這并不影響認(rèn)為這是一個(gè)需要關(guān)注的問題。

很多公司仍在喊口號:“未來,我們要打造屬于XX行業(yè)的大模型”。僅注重應(yīng)用場景的深度和廣度,并未提及到自身企業(yè)的優(yōu)勢、成本及技術(shù)經(jīng)驗(yàn)的儲(chǔ)備。

3. 大模型行業(yè)陷入了“內(nèi)卷”的惡性循環(huán)

類似于以往互聯(lián)網(wǎng)、電商的發(fā)展,很多企業(yè)(包括openAI)已經(jīng)在瘋狂搶奪大模型人才。相關(guān)JD描述不少都是需要有大模型訓(xùn)練、GPT使用工具經(jīng)驗(yàn)及prompt工程等要求。而這些在2022年前,都還不為大眾所熟悉。

薪酬方面只要牽扯到GPT大型模型相關(guān)的,基本都保持在20w-80w的高水平(以深圳為例)。

另外大模型也出現(xiàn)了不少行業(yè)大模型,如BloombergGPT(金融)、MathGPT(數(shù)學(xué))等,未來肯定還有更多行業(yè)屬性的大模型出現(xiàn)。

但這個(gè)是很奇怪的一個(gè)現(xiàn)象,類似于以往的語音agents,又將通用智能割裂成一個(gè)又一個(gè)模塊。后面也許又會(huì)變成比較哪一個(gè)行業(yè)大模型更智能的問題上。

二、引發(fā)的思考

1. 宏觀層面

1)國家層面

  1. 制定大模型、生成式AI的相關(guān)政策支持及監(jiān)管,持續(xù)不斷地推進(jìn)大模型行業(yè)發(fā)展。
  2. 探討在國內(nèi)應(yīng)用生成式AI的可行性,與各大高校、研究機(jī)構(gòu)及企業(yè)合作,可能還需要海外機(jī)構(gòu),逐步在各行業(yè)進(jìn)行應(yīng)用。
  3. 更新或者設(shè)立高等院校的關(guān)于生成式AI的相關(guān)專業(yè),另外還要注重芯片研發(fā)、統(tǒng)計(jì)科學(xué)及人工智能專業(yè)的發(fā)展。

2)企業(yè)層面

  1. 積極擁抱國外的先進(jìn)技術(shù),探索出存在差異化的產(chǎn)品定位/思路,從其他賽道超過美國,而不是從數(shù)據(jù)、算力方面突破。
  2. 做好后備資金及研發(fā)投入的支持,在保證自己能存活的前提下,鼓勵(lì)創(chuàng)新及發(fā)展。

2. 微觀層面

從業(yè)者或者期望從業(yè)者

  1. 自主學(xué)習(xí)。嘗試使用各類生成AI工具,在生活、工作及學(xué)習(xí)中使用,有時(shí)間可以整理分析各類AI工具的競品分析材料.
  2. 嘗試應(yīng)聘相關(guān)AI產(chǎn)品崗位時(shí),帶著你的思考和總結(jié)材料(如對目標(biāo)公司的產(chǎn)品分析及產(chǎn)品原型,特別是AI相關(guān)的場景應(yīng)用)去應(yīng)聘,不用很詳細(xì),但最好有自己的獨(dú)到見解。
  3. (慎用)考慮是否有必要進(jìn)修。AI行業(yè)本身就是存在一定門檻,很多時(shí)候?qū)夹g(shù)的學(xué)習(xí)需要系統(tǒng)化,結(jié)合自己的情況,了解海外或者國內(nèi)比較有名的院校(一般都是人工智能、數(shù)據(jù)科學(xué)、計(jì)算機(jī)等專業(yè))。

針對第三點(diǎn)尤其要提的是,由于當(dāng)前國內(nèi)的學(xué)歷貶值現(xiàn)象比較嚴(yán)重,深造是機(jī)會(huì)成本較高的選擇,無論是跨學(xué)科還是非跨學(xué)科,都有時(shí)間、經(jīng)濟(jì)和精力相關(guān)的成本。畢業(yè)后的就業(yè)也是一個(gè)挑戰(zhàn),所以需要結(jié)合自身情況,仔細(xì)考慮是否進(jìn)修。

參考內(nèi)容

hanniman,“最近ChatGPT這么火,總感覺有點(diǎn)不對勁”。

本文由 @SiegZhong 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!