通用智能面臨巨大掣肘,國產(chǎn)AIGC還在尋找光明
在AIGC的熱潮下,相關(guān)企業(yè)紛紛對此進(jìn)行投入。而在國外競品大踏步前行之際,國內(nèi)的通用智能企業(yè)境遇如何?對此,本文從來自O(shè)penAI的壓力、國產(chǎn)AIGC的進(jìn)擊障礙、國內(nèi)AIGC的擴(kuò)散難三個方面做了分析,希望對你有所幫助。
AIGC背后充滿了故事,在一家家企業(yè)手握巨額融資之時,人們耳邊再次響起了警鐘。誠然,在新的浪潮之下,符合商業(yè)規(guī)律的企業(yè)才能笑到最后。在國外競品大踏步前行之際,國內(nèi)的通用智能企業(yè)境遇如何?
前景很樂觀,但當(dāng)下似乎并沒那么好過。
一、來自O(shè)penAI的壓力
似乎OpenAI的進(jìn)步更快。
“我覺得我們和OpenAI的差距越來越大了”,一位AIGC從業(yè)者對數(shù)科星球(ID:digital-planet)這樣表述。前些日子,在ChatGPT推出后,不僅是英文對話,在中文領(lǐng)域,該系統(tǒng)的用戶體驗(yàn)也超越了國內(nèi)的眾多產(chǎn)品。以至于,一時間,人們的朋友圈被ChatGPT的對話刷屏。
“最早,我測試過一些特殊的中文語境,ChatGPT表現(xiàn)不好,不過最近我在測試的時候發(fā)現(xiàn)它進(jìn)步很快”,這位技術(shù)人員曾以諸如“關(guān)公戰(zhàn)秦瓊”等有中文歷史背景的話術(shù)測試機(jī)器人,他發(fā)現(xiàn),最近這款產(chǎn)品在中文適配方面有了明顯進(jìn)步。
赤裸裸的對照實(shí)驗(yàn)結(jié)果出現(xiàn)后,技術(shù)派的內(nèi)心是焦慮且復(fù)雜的。一些國內(nèi)企業(yè)對我們表示,以目前的進(jìn)度來看,光是追上OpenAI,就感覺“很吃力”。
雖然,目前OpenAI的終端產(chǎn)品由于眾所周知的問題未在國內(nèi)市場全面鋪開,但對于具有技術(shù)理想的相關(guān)企業(yè)來說,這種滋味是十分難受的。有人將這種情況描述為北斗未出現(xiàn)時的導(dǎo)航行業(yè),“從信創(chuàng)的角度考慮,中國的AIGC是肯定要有的,但技術(shù)差距也是不可忽視的”,一位投資人評價道。
客觀來說,造成國內(nèi)AIGC落后于同行的原因是多方面的:有A100顯卡的獲得受到制約、國內(nèi)人才隊(duì)伍發(fā)展較慢等諸多原因。其中,在硬件方面,大模型訓(xùn)練過于依賴進(jìn)口GPU顯卡,雖行業(yè)間出現(xiàn)了便宜的國產(chǎn)替代品,但以目前的技術(shù)水平,還不能給出滿意的性能支持;而在人才隊(duì)伍方面,一些行業(yè)人士稱“算法工程師多,但會大模型的鳳毛麟角”。
全局來看,當(dāng)下,似乎僅有百度公司、清北高校等團(tuán)隊(duì)立志于全身心投入于此。大模型所談?wù)呱醵啵袠I(yè)“孤勇者”數(shù)量寥寥。
二、國產(chǎn)AIGC的進(jìn)擊障礙
擺在通用智能或大模型發(fā)展之路的另一個障礙是小模型。
我們在文章中所提到的“大模型”概念是一個術(shù)語。之所以稱之為大模型,因其在訓(xùn)練數(shù)據(jù)過程中引入多模態(tài)等數(shù)據(jù),讓數(shù)據(jù)標(biāo)注的數(shù)量大規(guī)模增加,使之展現(xiàn)可打破行業(yè)藩籬的普適性。相對于小模型而言,具有通用性好、邊際成本低、效率高等特點(diǎn)。
后來,OpenAI再次點(diǎn)燃人們對通用智能的期待。在一些具有前瞻思維的技術(shù)派眼里,大模型對于各行各業(yè)的影響將是摧枯拉朽式的,他們一致認(rèn)為大模型是“當(dāng)之無愧”的未來發(fā)展方向。也就是說,技術(shù)上,大模型的發(fā)展上限更高,其會在未來某個時間點(diǎn)達(dá)到各種小模型的用戶體驗(yàn)閾值。
由于大模型的橫空出世,小模型統(tǒng)治AI的格局被打破。應(yīng)該說,就本質(zhì)而言,兩種技術(shù)路線背后代表著不同的利益。以至于,互聯(lián)網(wǎng)上,網(wǎng)友對兩種技術(shù)路線的討論十分熱烈:一會有人指責(zé)大模型是“大煉鋼鐵”,一會又有人攻訐小模型是“亞當(dāng)斯密小作坊”式的抱殘守缺。
客觀來說,小模型在當(dāng)今的市場競爭中仍然具有重大影響:從業(yè)者們通過算法微調(diào)、反復(fù)訓(xùn)練數(shù)據(jù)等措施下,一些產(chǎn)品收到了不錯的效果,對于客戶而言,甚至在一些領(lǐng)域內(nèi)的結(jié)果要好于大模型產(chǎn)品。
其次,國內(nèi)通用智能的AIGC缺少數(shù)據(jù)訓(xùn)練場景。
類似ChatGPT的訓(xùn)練場景尤為缺乏。在上文提到過的,這款產(chǎn)品之所以短時間之內(nèi)進(jìn)步神速,因大量用戶為其充當(dāng)了免費(fèi)的數(shù)據(jù)標(biāo)注員。不過,已目前情況來看,可與ChatGPT相較的數(shù)據(jù)訓(xùn)練場景在國內(nèi)還鮮有見到。
另外,產(chǎn)業(yè)界對大模型有著濃烈的觀望情緒。
在對談多家相關(guān)企業(yè)后,數(shù)科星球(ID:digital-planet)發(fā)現(xiàn)了產(chǎn)業(yè)界對AIGC持觀望態(tài)度的主要原因。概括來說,業(yè)界普遍存在這樣的憂慮:目前大模型應(yīng)用不成熟,驟而上馬將會對原有業(yè)務(wù)造成沖擊。
以電商售后和銀行電話客服場景為例,目前行業(yè)內(nèi)仍采用主流智能客服公司推出的QA問答庫技術(shù)??蛻羝髽I(yè)希冀大模型產(chǎn)品能夠解決QA庫無法承擔(dān)的長尾問題,覆蓋到檢索式問答路徑無法涉足的領(lǐng)域,但金融行業(yè)的語料庫等數(shù)據(jù)又不對外開放,讓大模型企業(yè)不得不重頭開始。
這都延遲了大模型進(jìn)軍具體行業(yè)的時間表。
目前,一些從業(yè)者透露,金融科技公司愿意為大模型企業(yè)提供“必要但不致命”的應(yīng)用場景。在這些場景中,客戶企業(yè)可以承受一定程度的容錯,也愿意投入時間和資源支持大模型的進(jìn)一步發(fā)展。“我們的主要客戶來源于金融機(jī)構(gòu)的創(chuàng)新部門,因?yàn)樗麄冎С忠恍┩ㄓ弥悄艿氖虑椤保?/strong>一位銷售人員對數(shù)科星球(ID:digital-planet)這樣說。
“死馬當(dāng)活馬醫(yī),反正沒辦法解決長尾,不如讓大模型試試”,這是金融行業(yè)業(yè)內(nèi)給出的真實(shí)看法。甘愿“冒風(fēng)險試一試”的場景有公文寫作、情感理解等。
總結(jié)而言,通用智能企業(yè)需要客單價高、數(shù)據(jù)訓(xùn)練場景豐富的派單需求,但這個問題又與企業(yè)的現(xiàn)實(shí)考量和預(yù)算投入相互矛盾。
沒得數(shù)據(jù)用來訓(xùn)練、沒得大錢(投資除外)養(yǎng)活產(chǎn)品,是擺在現(xiàn)實(shí)的兩大難題。
三、國內(nèi)AIGC的擴(kuò)散難
元宇宙爆火,燃遍各行各業(yè)。它能否成為助力通用型AIGC擴(kuò)散的有力平臺?
這是一個有趣的想象。答案是,可以,但很難。
目前,AIGC和元宇宙的發(fā)展雖然存在相關(guān)性,不過就目前的情況來看,二者還未完全合流,處在“你做你的、我做我的”的階段。
舉例來說,在一些社群中,我們曾討論這樣的使用場景:在在線繪畫App中嵌入AIGC功能,使用戶在提交繪畫作品后自動生成AIGC圖片。面對這個問題,某些供應(yīng)商對數(shù)科星球(ID:digital-planet)分享:“實(shí)際上,在第三方App中嵌入AIGC難度很大,要有能力處理高并發(fā),要低延時,從而不影響用戶體驗(yàn)”,在他的想法中,甲方的需求可以滿足,但如若在實(shí)時在線的基礎(chǔ)上,成本頗高。
退而求其次,供應(yīng)商給出了離線生成或自建圖庫的方式滿足需求(自建圖庫是預(yù)先在系統(tǒng)保存大量已經(jīng)生成的圖片,用戶有需求時直接調(diào)用)。但很明顯,這種折中的方式違背了AIGC設(shè)計(jì)的初衷。時間長了,對于訓(xùn)練大模型更是無從談起。
在同樣爆火的數(shù)字人中,AIGC的應(yīng)用場景也不算多。目前,市面上絕大多數(shù)數(shù)字人均屬“服務(wù)型數(shù)字人”。它們被廣泛應(yīng)用在虛擬的辦事大廳、博物館、手語電視臺的手語節(jié)目等場景之中。
剖開數(shù)字人產(chǎn)業(yè)鏈可以看得更加直觀:在這個產(chǎn)業(yè)鏈中,底層為算法層,負(fù)責(zé)驅(qū)動面部表情和手勢動作;中層為渲染層;上層為構(gòu)成層,負(fù)責(zé)建立數(shù)字人圖像。但除了底層“數(shù)字腦”領(lǐng)域,其他層面與通用智能結(jié)合較少。
在某知名投資機(jī)構(gòu)投資人看來,“未來的數(shù)字人會相當(dāng)多”,他認(rèn)為,人們會擁有具有服務(wù)和陪伴屬性的虛擬分身。但在技術(shù)上,想讓人工智能具備情感陪伴功能還尚需時日,“至少目前技術(shù)是達(dá)不到的”,一位技術(shù)人員補(bǔ)充說。
整體來看,目前的數(shù)字人大多承擔(dān)著IP形象功能,能說話的數(shù)字人還比較少。在一些先進(jìn)的數(shù)字人中,“中之人”又是必不可缺的因素(其承擔(dān)動作捕捉、虛擬拍攝、表情抓取和后期合成、渲染精修等工作的真人)。表面上,這種數(shù)字人比較高端,但其背后通常有大量人員為其服務(wù),制作成本雖有所降低,但整體制作成本也并不低廉。
以上原因都阻止了AIGC或通用智能擴(kuò)散至尋常百姓家。
四、結(jié)尾
企業(yè)顯然不會坐以待斃。他們給出的策略大體分為三塊:對外投資以擴(kuò)充數(shù)據(jù)訓(xùn)練場景、夯實(shí)客戶關(guān)系以獲取現(xiàn)金流、堆人堆設(shè)備砸錢砸出大模型。
以上基本盤是投資機(jī)構(gòu)給出的巨額投資。
“這好比把高科技做成了勞動密集型企業(yè)”,一個業(yè)內(nèi)人士哂笑。不過,在當(dāng)下的時間點(diǎn),這是沒辦法的辦法。技術(shù)上,只要機(jī)器足夠、標(biāo)注正確,哪怕是“堆”,也可達(dá)到預(yù)期目的。
錢的方面,高科技企業(yè)已下定決心“內(nèi)卷”數(shù)字經(jīng)濟(jì)同行,有銷售人員將其稱之為“關(guān)系是第一生產(chǎn)力”。不過這種思路面臨一個問題,就是大模型和通用智能的認(rèn)知度要高。
“我們拜訪了很多客戶,但很多人其實(shí)根本不理解大模型”,一位業(yè)內(nèi)人士對數(shù)科星球(ID:digital-planet)表述。在他的眼里,傳統(tǒng)數(shù)字經(jīng)濟(jì)在新技術(shù)面前有巨大的提升空間。
舉例來說,比如政務(wù)大屏。
“之前為調(diào)取一個地方數(shù)據(jù),大屏只能靠下拉、下拉、再下拉的方式調(diào)用,而現(xiàn)在對語音助手說‘我要今年的生產(chǎn)情況’,就能自動生成”,這位業(yè)內(nèi)人士解答,在他眼里,東西是好東西,但在買家面前變成了另外一個景色:“如果一個領(lǐng)導(dǎo)想做,他只需要1個理由去做,如果他不想做,他會找出100個理由不做”。
AIGC熱潮高企,但一線銷售人員往往會頻頻碰灰。在高科技浪潮風(fēng)起云涌的當(dāng)下,很多人承擔(dān)著不能言說的苦衷。
作者:苑晶;編輯:十里香;公眾號:數(shù)科星球(ID:digital-planet)
本文由 @數(shù)科星球 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!