淺談游戲行業(yè)當(dāng)前的AI動畫/視頻工具
自從ChatGPT和Sora發(fā)布后,在我們的工作流程中,AI能參與的部分越來越多。比如本文從游戲行業(yè)從業(yè)者的視角出發(fā),談?wù)劗?dāng)前對于AI動畫/視頻的一些思考。
最近,Sora的公布給所有行業(yè)的人帶來了狠狠地Impact,所有從業(yè)者都在期待著AI動畫/視頻技術(shù)的革新,并為行業(yè)帶來的效率提升。
本文將從游戲行業(yè)從業(yè)者的視角出發(fā),談?wù)劗?dāng)前對于AI動畫/視頻的一些思考。BTW,目前AI技術(shù)日新月異,本人對于某個領(lǐng)域的能力的AI技術(shù)認(rèn)知可能有所滯后,歡迎指正。
一、游戲行業(yè)的美術(shù)資源
游戲行業(yè)是一個嚴(yán)重依賴美術(shù)資源的行業(yè)。無論是在游戲的研發(fā)、營銷還是運營過程中,都需要大量的美術(shù)資源。
1. 研發(fā)側(cè)
在游戲研發(fā)階段,策劃設(shè)計游戲玩法和系統(tǒng),將其交由美術(shù)團隊進行角色、界面和場景設(shè)計,最終由開發(fā)團隊完成游戲的開發(fā)和測試工作。根據(jù)游戲類型的不同,所需的美術(shù)資源也會有所差異。
美術(shù)資源主要分為:
- 2D美術(shù)資源(如角色設(shè)計、背景設(shè)計、道具設(shè)計、UI界面設(shè)計)
- 3D美術(shù)資源(如角色建模、場景建模、動畫設(shè)計、貼圖紋理)
- 動畫資源(括角色動作、戰(zhàn)斗效果、場景光影以及UI交互等)
根據(jù)東方財富證券的報告,游戲研發(fā)成本占收入比約在 15%-35%,美術(shù)成本一般占到游戲研發(fā)成本的 50-70%。根據(jù)伽馬數(shù)據(jù),2023年中國游戲市場實際銷售收入3029.64億元。因此,此處美術(shù)成本約為200~800億元。
數(shù)據(jù)來源:游戲工委、伽馬數(shù)據(jù)(CNG)
2. 營銷側(cè)
在游戲開發(fā)完成后,游戲公司需要進行游戲營銷,以有限的成本吸引更多精準(zhǔn)的用戶。常見的獲客手段包括投放廣告、聯(lián)合運營和品牌宣傳等。在營銷過程中,需要大量的營銷美術(shù)資源,如圖片、動圖和視頻,用于廣告投放、聯(lián)運商城以及品牌宣傳。比如,我們常見的洗腦廣告視頻,這些是由真人拍攝的廣告視頻。
根據(jù)游戲新知的數(shù)據(jù),營銷一直是游戲公司支出的重要部分,因此對美術(shù)資源的需求也非常高。
3. 運營側(cè)
一旦吸引用戶進入游戲,運營團隊的主要任務(wù)是促進用戶活躍、提高留存率并引導(dǎo)用戶進行付費轉(zhuǎn)化。在運營過程中,需要大量的美術(shù)資源,與營銷所需的素材相似,但主要用于運營活動和社群內(nèi)容構(gòu)建,包括圖片、動圖和視頻等美術(shù)素材。
綜上所述,游戲行業(yè)對美術(shù)資源的需求主要分為3類:2D美術(shù)資源、3D美術(shù)資源和動畫資源。
二、當(dāng)前游戲行業(yè)美術(shù)對AI的應(yīng)用
根據(jù)伽馬數(shù)據(jù)的報告顯示,自AI繪畫技術(shù)問世以來,某游戲企業(yè)在美術(shù)方面取得了顯著進展。據(jù)稱,該企業(yè)目前在美術(shù)方面的成本節(jié)省率達到40%,文案創(chuàng)作效率提升超過50%,而未來在研發(fā)端,整體成本預(yù)計將下降30%。以往需要兩周完成的2D美術(shù)資源生產(chǎn),如今僅需3天便可完成。
一個完整的2D美術(shù)資源的生產(chǎn)應(yīng)該包含以下流程:
然而,由于當(dāng)前AI技術(shù)的“可控性”和“穩(wěn)定性”仍有提升空間,因此AI工具主要在激發(fā)靈感、制作草稿以及需求確認(rèn)等方面發(fā)揮作用。
盡管部分素材可以直接采用AI生成的成稿,但這僅適用于少數(shù)情況。美術(shù)人員可以通過文生圖/圖生圖等方式進行抽卡,激發(fā)創(chuàng)作靈感,并快速形成草稿,從而顯著提高美術(shù)資源的生產(chǎn)效率。
同時,借助已生成的草稿,可以快速與需求方進行對齊?;蛘?,需求方可以通過AI工具生成樣圖,與美術(shù)人員進行需求確認(rèn)。這種方式可以大大減少由溝通問題導(dǎo)致的需求差異,從而減少返工情況,進一步提高美術(shù)資源的生產(chǎn)效率。
當(dāng)前,雖然在3D美術(shù)資源領(lǐng)域已經(jīng)出現(xiàn)了一些能夠快速生成資源的工具,但相比之下,仍未有2D美術(shù)資源的生成成熟,然而這方面的討論將暫且擱置。在美術(shù)資源的各個類型中,AI視頻工具在動畫美術(shù)資源的制作中發(fā)揮著一定的輔助作用,盡管也存在一些挑戰(zhàn)。根據(jù)前文的分析,游戲行業(yè)中動畫素材的制作場景主要涉及以下方面:
- 研發(fā)側(cè):角色動作、戰(zhàn)斗效果、場景光影、UI交互等;
- 營銷側(cè):視頻素材、動圖素材;
- 運營側(cè):活動/內(nèi)容運營素材等;
所有這些方面都可以通過與AI動畫/視頻相關(guān)工具的結(jié)合來實現(xiàn)成本降低、效率提升的目標(biāo)。
我們先拆解下現(xiàn)在動畫素材制作的流程,主要有以下環(huán)節(jié):
1. 尋找靈感
在進行動畫素材的制作之前,美術(shù)人員通常會利用第三方平臺進行調(diào)研,以收集靈感和素材。
對于營銷層面的視頻素材的制作靈感收集,他們使用像DataEye、AppGrowing等網(wǎng)站,這些平臺匯集了廣告領(lǐng)域中最熱門和最新的視頻素材。通過這些調(diào)研,制作者可以了解哪些素材在廣告投放中效果良好、哪些是當(dāng)前熱門的素材,以及哪些具有潛力,從而指導(dǎo)他們的視頻素材創(chuàng)作。
然而,海量數(shù)據(jù)分析是一項耗時耗力的工作。動畫/視頻制作本身就是一個人力密集型的過程,如果還需要額外的時間用于靈感收集,那將增加額外的成本。
熱門且效果良好的素材具有明顯的數(shù)據(jù)特征,可以通過數(shù)據(jù)規(guī)則快速提取,但仍需要人工識別其中的參考內(nèi)容。而那些具有潛力的素材則往往沒有明顯的數(shù)據(jù)特征,因此只能在海量數(shù)據(jù)中進行挖掘,有些許像大海撈針。
假設(shè)我們能夠應(yīng)用AI技術(shù)來增強業(yè)務(wù)能力,通過AI動畫/視頻分析,系統(tǒng)可以解構(gòu)視頻中的元素并進行標(biāo)簽分類,將這些分類信息存儲在靈感庫中,以便設(shè)計師快速提取靈感,同時也有助于快速發(fā)現(xiàn)潛力內(nèi)容。通過AI技術(shù),我們可以將海量數(shù)據(jù)濃縮為高價值信息,從而提升業(yè)務(wù)生產(chǎn)效率。
目前,B站提供了AI視頻分析功能,但僅適用于部分視頻。沒有配音或字幕的視頻以及發(fā)布時間早于24年的視頻無法使用該功能。估計B站的AI視頻能力主要通過OCR和語音識別技術(shù)提取視頻文本內(nèi)容,并將其提交給LLM進行總結(jié)。
然而,游戲的動畫/視頻素材生產(chǎn),更多的是涉及沒有文本內(nèi)容的畫面(角色動作、戰(zhàn)斗效果、場景光影、UI交互、游戲?qū)崨r視頻等)。類似于B站的視頻分析能力,目前還無法從這些畫面中提取信息。這就需要依賴基于視覺內(nèi)容的AI分析模型。目前一些SaaS廠商提供了相關(guān)能力,但是要提煉出美術(shù)設(shè)計師所關(guān)心的內(nèi)容仍然具有一定難度,因此這些模型更多地用于視頻內(nèi)容審核。
圖片來源于商湯(左)和網(wǎng)易易盾(右)
2. 制作草稿
動畫素材實質(zhì)上是2D/3D美術(shù)資源在時間維度上的延續(xù),因此動畫的草稿相對復(fù)雜,涉及腳本、分鏡等設(shè)計內(nèi)容,其中的溝通成本和試錯成本遠(yuǎn)高于2D/3D美術(shù)資源。
目前存在幾個方向的AI視頻/動畫工具,可以在制作草稿過程中發(fā)揮作用:
1)素材搜索匹配:
在調(diào)研過程中,發(fā)現(xiàn)一類AI動畫/視頻工具,通過輸入文本/圖片,AI能夠匹配相關(guān)度較高的視頻素材并進行拼接,同時使用AI聲音進行配音,快速生成相關(guān)動畫/視頻內(nèi)容。
圖中為度加創(chuàng)作工具
這類AI動畫/視頻工具的核心在于素材搜索匹配能力。
通過對素材庫中的視頻進行分析、拆解、打標(biāo)簽,再根據(jù)用戶的提示詞匹配最合適的動畫/視頻內(nèi)容,從而拼接成動畫/視頻。這個過程涉及到AI文本生成、語音合成、動畫/視頻剪輯等能力,可以歸類為剪輯工具。
然而,當(dāng)前這類工具可能存在以下問題:
i)素材上下文相關(guān)性:
由于視頻是由多個素材拼接而成,若AI無法理解素材之間的關(guān)系,在動畫/視頻剪輯過程中使用了矛盾的素材,將影響最終成片效果。
ii)素材版權(quán):
生成的動畫/視頻片段來源于其他視頻素材,可能涉及版權(quán)問題。工具需要解決和規(guī)避侵權(quán)內(nèi)容的識別問題。
iii)素材庫的大?。?/strong>
素材庫規(guī)模的大小直接影響這類視頻生成工具的效果和生成的視頻多樣性。龐大的素材庫需要大量版權(quán)資源或內(nèi)容平臺支持,從而構(gòu)建工具的“網(wǎng)絡(luò)效應(yīng)”,而較小的素材庫會限制工具的效果。
因而,這個方向的AI工具,內(nèi)容巨頭企業(yè)才更容易做得更好。
iv)搜索匹配的準(zhǔn)確度:
動畫/視頻分析AI對動畫/視頻內(nèi)容的理解有限,導(dǎo)致搜索匹配結(jié)果準(zhǔn)確度問題,與用戶設(shè)想的畫面可能存在一定差距。在生成多個動畫/視頻片段拼接而成的視頻時,準(zhǔn)確率問題會疊加,使成品動畫/視頻偏離原始設(shè)想。
這些問題導(dǎo)致素材搜索匹配相關(guān)的AI產(chǎn)品工具,在當(dāng)前并不是那么好用。
2)文/圖生視頻:
Sora屬于文/圖生視頻的AI方向。在Sora發(fā)布之前,市場上已有相關(guān)工具如Pika、RunwayGen2、Stable Video Diffusion,它們可以根據(jù)用戶輸入的文本或靜態(tài)圖片,生成幾秒鐘的視頻/動畫。
然而,目前市面上的文/圖生視頻AI工具存在明顯缺陷,例如:
i)未能理解物理世界:
正如Runway之前宣布要通用世界模型(General World Model),像Gen-2這樣的視頻生成AI,僅僅是生成了具有有一定運動的短視頻,但是在處理攝像機運動或物體運動等問題上存在局限。
比如這里,我用張倆男孩打架的圖片,生成的視頻中,男孩揮出去的手反而貫穿了自己的腦袋。
雖然Sora也具備了通用世界模型的基礎(chǔ)能力,但是也同樣存在“對物理世界理解不足”的問題,比如知名的“玻璃破碎”、“虛空椅子”。這些訓(xùn)練數(shù)據(jù)不足的情況,使得在多主體之間的運動無法被準(zhǔn)確表達。
ii)主體一致性問題:
在AI生成的動畫/視頻中,人物外貌、動作等可能隨著人物動作的變化而發(fā)生變化,導(dǎo)致主體一致性問題,影響視頻質(zhì)量。如下圖的案例中,原本是生成馬斯克的視頻,但是在視頻的最后幾秒,馬斯克變成了一個黃種女人。
視頻素材來源于知乎用戶sunny
iii)無法生成游戲行業(yè)垂直內(nèi)容:
像是角色動作、戰(zhàn)斗效果、場景光影、UI交互、游戲?qū)崨r視頻等內(nèi)容,AI工具的生成效果極差。因此對于游戲行業(yè),大概率僅有視頻類動畫素材的生產(chǎn)過程才能用上這類AI工具。
3. 收集素材
制作視頻類動畫素材涉及收集素材的過程,其中需要結(jié)合分鏡稿,收集足夠的素材以供剪輯使用。這一過程與制作草稿的工具需求大致相同,可以借助“素材搜索匹配”和“文/圖生視頻工具”的AI能力來輔助。
4. 成稿
一旦素材齊全,下一步就是將所收集/制作的素材拼接成最終的成品稿。這個過程涉及到多種類型的AI動畫/視頻工具,種類繁多且多樣,較難一一概括,以下是我觀察到的一些類型,而且大多都只能用在視頻類型的素材剪輯上。
1)視頻拆條:
這類工具旨在快速將視頻按需求進行剪輯拆分和拼接。舉例來說,火山引擎提供了“視頻拆條”功能,利用AI畫面和語音識別自動將視頻進行拆分,同時支持對視頻進行進階設(shè)置。這種工具可用于對長視頻進行分割處理,以便進行短視頻合成。
又比如,“vidyo.ai”提供的視頻拆條能力,在基于語音識別的基礎(chǔ)上,還提供了針對不同內(nèi)容平臺的格式轉(zhuǎn)化能力。
2)配音:
語音配音在制作視頻類內(nèi)容時扮演著重要的角色。盡管在嚴(yán)格意義上,配音并不屬于AI視頻工具的范疇,但卻是制作視頻內(nèi)容不可或缺的一環(huán)。當(dāng)前的AI生成語音技術(shù)已經(jīng)相當(dāng)成熟,以剪映官方為例,他們提供了完善的配音音色功能,用戶可以通過輸入文本生成對應(yīng)的音頻內(nèi)容。
3)字幕:
視頻制作中不可或缺的一環(huán)是字幕。隨著技術(shù)的發(fā)展,字幕生成技術(shù)也日趨成熟,例如,剪映已經(jīng)具備了自動生成字幕的能力。
4)畫面編輯:
我覺得很多視頻工具都可以歸到這一類里面,比如視頻剪輯軟件里面都會配備的濾鏡能力,通過應(yīng)用特定的濾鏡效果,使視頻呈現(xiàn)出特定風(fēng)格和視覺效果。
同時,市面上也有能將夠穩(wěn)定將視頻轉(zhuǎn)換成其他風(fēng)格的工具,如Ebsynth。
Runway里面除了視頻生成能力,還提供了像是一鍵刪除背景、一鍵修復(fù)、一鍵模糊等效果編輯AI。
perfectly-clear提供的編輯能力可用于改善視頻的色彩、提高對比度、消除噪點、改善視頻的清晰度,以及消除視頻中的抖動和模糊。
騰訊云提供的AI換臉技術(shù)將真人視頻中的人臉替換成其他人臉。
5)數(shù)字人:
幾乎所有主要廠商都在積極探索并應(yīng)用這一技術(shù)。其核心在于利用AI生成個性化的數(shù)字人物,并結(jié)合專屬的AI音色,使得這些AI數(shù)字人可以替代用戶進行視頻解說。在直播帶貨等場景中,這種技術(shù)不僅可以提高效率,還能有效節(jié)省人力成本。
四、小結(jié)
結(jié)合我的調(diào)研,目前游戲行業(yè)相關(guān)的AI視頻/動畫工具可分為4大類:
- 動畫/視頻分析:利用人工智能的分析和理解能力,提煉出美術(shù)設(shè)計所關(guān)注的核心信息,將大量信息壓縮成關(guān)鍵要點,從而提高尋找靈感的效率。
- 素材搜索匹配:基于視頻分析的AI技術(shù),通過對素材庫中的視頻進行分析、解構(gòu)和標(biāo)記,再根據(jù)用戶提供的關(guān)鍵詞匹配最適合的動畫/視頻內(nèi)容,提高視頻類動畫資源制作的效率。
- 動畫/視頻生成:基于生成式AI技術(shù),能夠通過文本和圖像內(nèi)容生成動畫視頻內(nèi)容。
- 剪輯工具類:輔助動畫資源的制作,提高制作效率。
目前的AI視頻/動畫工具更多偏向于視頻類動畫素材的生產(chǎn),更適用于與營銷相關(guān)的業(yè)務(wù)生產(chǎn),因為這方面對于大型模型的定制化要求較低。然而,對于與動效相關(guān)的動畫生產(chǎn),可能需要游戲行業(yè)垂直領(lǐng)域大型模型能力的進一步發(fā)展。
我將收集到的AI視頻/動畫工具給到美術(shù)設(shè)計,他們的回答是:“好像什么都能做,但是又好像做不好的感覺??偛荒転榱诉@碗醋(使用AI),才包的這頓餃子吧(做動畫/視頻)。”剖析其中的原因,主要是:
- 素材搜索匹配、視頻生成類當(dāng)前AI工具對于游戲行業(yè)垂直程度不夠高,無法生成足夠高準(zhǔn)度的內(nèi)容。而且動畫素材有別于圖片素材,AI圖片生成內(nèi)容的準(zhǔn)確度不高時候,美術(shù)還可以上手修改,但是當(dāng)AI視頻生成的準(zhǔn)確度不高的時候,逐幀修改成本過高,不具有可行性。
- 工具分散,未能較好貼合生產(chǎn)流程。大部分的AI工具分布在不同的平臺上,“收集靈感”——“制作草稿”——“收集素材”——“剪輯成稿”的過程需要跳轉(zhuǎn)的平臺過多,同時各類工具的更新和版本調(diào)整也需要人力去跟進和維護,再加上大部分工具使用場景很小,單獨購買性價比不高。整體需要耗費過多的精力和成本,這有礙于AI工具對于制作的提效。
- 由于工具使用都是分散在各類工具平臺上,AI工具的使用不能進行AI資產(chǎn)的積累,無法形成工具使用的“邊際成本遞減”。(比如文/圖生圖的AI使用,可以通過低模型訓(xùn)練、參數(shù)調(diào)試的方式,快速將AI工具變成業(yè)務(wù)的形狀,提高生產(chǎn)效率)
- 目前收集到的大部分AI視頻/動畫工具,普遍都是需要收費的。要么按請求量收費,要么是會員制,動則每個月上百塊。結(jié)合前文提到的AI準(zhǔn)確度不高和工具分散問題,業(yè)務(wù)可能需要在多個平臺多次“抽卡”(調(diào)侃準(zhǔn)確度不高,就好像游戲抽卡那樣,需要N次才能出來想要的結(jié)果),這個過程大大加大了成本的消耗,使得AI的使用成本甚至可能高于人肉。
隨著越來越多AI公司的入局,以上提到的問題一定會被解決,正如萬物摩爾定律所描述,成本問題也會越來越低。Sora的出現(xiàn),無疑是對這個過程的加速。
但是我也想談?wù)勎覍ξ磥碚雇囊恍┯^點,我覺得未來的AI動畫/視頻工具一定是背靠視頻剪輯/動畫制作工具的,并集成大多數(shù)的AI工具(All in one),因為:
1.工具集成&貼合工作流帶來的用戶體驗優(yōu)勢:
視頻剪輯/動畫制作工具本身就是貼合用戶工作流程的產(chǎn)品形態(tài)。當(dāng)AI工具集成在一起時,用戶可以直接利用AI能力進行生產(chǎn),無需研究各種AI工具,減少額外精力消耗。同時,基于用戶使用習(xí)慣,產(chǎn)品可以提供AI數(shù)據(jù)資產(chǎn)積累能力,定制化模型,更貼合用戶使用習(xí)慣,構(gòu)成用戶的沉沒成本。
2.用戶增長優(yōu)勢:
現(xiàn)有視頻剪輯/動畫制作工具已有一批忠實用戶群體,發(fā)展AI能力時無需從零開始用戶增長。在成熟工具上構(gòu)建AI能力,加固了產(chǎn)品壁壘。
3.更容易構(gòu)建數(shù)據(jù)飛輪,構(gòu)建數(shù)據(jù)壁壘:
借助平臺原有的用戶積累,能夠利用龐大的素材積累、數(shù)據(jù)積累訓(xùn)練優(yōu)秀的大模型,打造優(yōu)質(zhì)的視頻產(chǎn)品功能,從而吸引更多用戶,構(gòu)建數(shù)據(jù)飛輪,構(gòu)建自身的壁壘。
4.工具更具有可控性問題的解決方案:
AI動畫/視頻生成工具是具有本質(zhì)上的矛盾的,文本是低維信息,卻需要準(zhǔn)確表達動畫/視頻這種高維信息,這個過程必定伴隨信息的失真。文生視頻必定是不能100%傳達制作者的想法的。這個過程就需要編輯工具的存在,通過人工編輯的接入,將內(nèi)容準(zhǔn)確表達。而且,通過編輯工具,我們也能通過人力彌補AI的準(zhǔn)確度問題,使得在AI能力能準(zhǔn)確生成我們需要的內(nèi)容之前,我們也能利用AI進行效率的提升。
因此背靠視頻剪輯/動畫制作工具,更容易進行編輯工具構(gòu)建,從而解決可控性問題。
專欄作家
檸檬餅干凈又衛(wèi)生,公眾號:檸檬餅干凈又衛(wèi)生,人人都是產(chǎn)品經(jīng)理專欄作家。一名游戲行業(yè)的B端產(chǎn)品,負(fù)責(zé)過游戲行業(yè)內(nèi)CRM 、風(fēng)控、BI、SDK、AI相關(guān)的內(nèi)容,定期輸出個人思考或總結(jié)文章~
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!