中國生成式AI的“物種大爆炸”
國內(nèi)的生成式AI正在迅速地發(fā)展中,可以看到,算法備案的數(shù)量和頻率都在上升,并且,生成式AI在互聯(lián)網(wǎng)領域迅速擴展,同時在向更多垂直領域蔓延。更詳細的解讀,我們不妨來看看本文的梳理。
最近國外的Sora風頭正勁,讓不少國人產(chǎn)生了悲觀情緒。其實,國內(nèi)生成式AI也在迅速的發(fā)展中,就在Sora發(fā)布后不久的2月18日,網(wǎng)信辦發(fā)布了第四批深度合成服務算法備案信息,從中可以一窺我國生成式AI的現(xiàn)狀。
什么是深度合成服務?是指利用深度學習、虛擬現(xiàn)實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網(wǎng)絡信息的技術,包括但不限于:
(一)篇章生成、文本風格轉(zhuǎn)換、問答對話等生成或者編輯文本內(nèi)容的技術;
(二)文本轉(zhuǎn)語音、語音轉(zhuǎn)換、語音屬性編輯等生成或者編輯語音內(nèi)容的技術;
(三)音樂生成、場景聲編輯等生成或者編輯非語音內(nèi)容的技術;
(四)人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態(tài)操控等生成或者編輯圖像、視頻內(nèi)容中生物特征的技術;
(五)圖像生成、圖像增強、圖像修復等生成或者編輯圖像、視頻內(nèi)容中非生物特征的技術;
(六)三維重建、數(shù)字仿真等生成或者編輯數(shù)字人物、虛擬場景的技術。
《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》是在2022年11月3日審議通過的,在不到一個月后的11月30日,ChatGPT就橫空出世了。
圖片來源:網(wǎng)信辦
不難發(fā)現(xiàn),深度合成服務的概念與生成式AI有很大的重合——半年后我國發(fā)布的《生成式人工智能服務管理暫行辦法》中,定義生成式人工智能技術是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關技術。
按照規(guī)定,在我國境內(nèi)提供深度合成服務,需要進行相應的備案,從2023年6月至今,已經(jīng)有4批備案,合計546個算法,可以說是迎來了生成式AI的“物種大爆炸”。
從圖不難看到,算法備案的數(shù)量和頻率都在上升,第四批備案距離發(fā)布第三批備案僅有一個月,算法數(shù)量也從129個增長到了266個。其中,服務技術支持者和服務提供者累計下來分別為151和395個。(深度合成服務提供者,是指提供深度合成服務的組織、個人;深度合成服務技術支持者,是指為深度合成服務提供技術支持的組織、個人。)
一、大廠成為主力軍
在這些算法中,既有來自互聯(lián)網(wǎng)大廠的,也包括垂直領域的領軍企業(yè),還有一眾的創(chuàng)業(yè)公司。
先看服務技術支持者,算法備案數(shù)量的前十名基本都來自大廠,在后面的榜單中,也有科大訊飛、京東科技、出門問問、360、獵戶星空等知名互聯(lián)網(wǎng)公司。相對來說,對外提供技術服務的門檻要高于自用,會出現(xiàn)這種情況也就不奇怪了。
去年大模型爆火,備案的546個算法中,大模型的算法足足有70個,不過大多數(shù)都是企業(yè)用于自身業(yè)務的,對外提供技術支持的僅有19個,并且包含多個垂類大模型,通用大模型為數(shù)并不多,可見“百模大戰(zhàn)”有些名不副實。
再來看服務提供者,由于數(shù)量過多(395個),就不一一列舉了,重點說一下大模型,表單中的內(nèi)容和上表有些許重合,比如百度的文心大模型,因為有的大模型既可對外做技術支持,也可以用于自家的產(chǎn)品。
值得一提的是,2023年生成式AI的浪潮中,騰訊表現(xiàn)的較為低調(diào),卻在技術支持者榜單中數(shù)量排名第一。除了技術力量強大外,大廠涉獵的行業(yè)多,因此有更多的落地場景,可以身兼“賣水人”和“掘金者”兩個角色,例如騰訊,深度合成服務算法備案中,囊括了人臉融合、語音合成、繪畫、P圖等多個領域。
與之類似的是網(wǎng)易,作為服務技術支持者,算法涉及圖像、語音生成、文本生成、三維場景等多個行業(yè);作為服務提供者,算法則服務了有道詞典、逆水寒手游等應用。
但要說自身應用算法最廣泛的大廠,則莫過于阿里巴巴??赡茉从诮M織拆分的緣故,阿里巴巴對外提供技術支持的算法都來自達摩院,但淘寶、釘釘以及天貓等,又都有各自的算法備案。DoNews向達摩院了解到,淘寶、釘釘?shù)却蟛糠旨夹g來自于自研,也有部分技術有達摩院提供或者聯(lián)合研發(fā)。
百度的文心大模型是目前國內(nèi)大模型的領軍者,在數(shù)字人、語音合成及識別、文生文/圖、人臉融合等領域都有算法,不過在產(chǎn)品層面就明顯單調(diào)許多,只展現(xiàn)了文心一言大模型的App和網(wǎng)站。由此可見,單純看算法數(shù)量,并不能全面體現(xiàn)企業(yè)的AI能力。
華為云則是徹底走“2B”路線,目前擁有6個算法備案,全部作為服務技術支持者,主要分為兩類:盤古及MetaStudio(數(shù)字內(nèi)容生產(chǎn)線)。
二、行業(yè)應用加速落地
通過整理算法備案的資料,我們還發(fā)現(xiàn)另一個情況,生成式AI在互聯(lián)網(wǎng)領域迅速擴展,并在向更多垂直領域蔓延。
比如,電商就是一個重點發(fā)展大模型的行業(yè),阿里巴巴旗下的電商最積極擁抱AI。
短視頻領域也大量應用了生成式AI技術,抖音和快手一如既往是領頭羊,應用場景集中在特效、合成、換臉幾大方向。
傳統(tǒng)行業(yè)也在積極擁抱生成式AI,比如醫(yī)療健康,應用主要集中在健康咨詢、醫(yī)療內(nèi)容生成上。
2024年開年,AI手機成為了熱點話題,OPPO和vivo都提前進行了大模型的算法備案。
此外,不少令人意想不到的行業(yè),也在應用生成式AI。比如家電巨頭TCL,看似和生成式AI不沾邊,卻通過TCL智能文本生成算法,在APP中根據(jù)用戶輸入的文本內(nèi)容,生成產(chǎn)品說明和使用指導。
在教育領域,好未來一共備案了多達8個算法,既有自用也有對外做輸出的,展現(xiàn)了強大的科技實力。母嬰行業(yè),寶寶樹孕育(APP)應用的寶寶樹母嬰家庭領域大模型生成合成算法,可以根據(jù)用戶提出的備孕育兒問題,生成備孕育兒等相關知識內(nèi)容,輸出文本內(nèi)容回復。
還有一個重要的落地場景,就是汽車行業(yè)。年初的CES上,奔馳、寶馬、大眾等汽車廠商都展示了融合最新AI大模型技術的車機系統(tǒng),比亞迪也在近期推出了全新的整車智能化架構“璇璣”及其AI大模型“璇璣AI大模型”,“智駕”正在成為新能源汽車標配。
通過深度合成服務算法備案信息,我們可以看到,生成式AI在中國蓬勃發(fā)展,雖然有只見廣度不見深度的嫌疑,但隨著生成式AI的不斷深入產(chǎn)業(yè)落地,未來我們也將看到更多和更好行業(yè)案例涌現(xiàn)。
作者:小不董;編輯:李信馬
微信公眾號:DoNews(ID:ilovedonews),不局限于對互聯(lián)網(wǎng)行業(yè)的追蹤與探索,更要向未來、向未知的方向邁進。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @DoNews 授權發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!