Sora大片真相:人工特效參與,被指誤導(dǎo)大眾

量子位
0 評(píng)論 1536 瀏覽 0 收藏 10 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

最近,有消息稱Sora火爆的短片《氣球人》,其視頻畫面并非完全由AI生成,其中有大量視覺效果需要人類后期實(shí)現(xiàn)。這可就引起人們的圍觀和討論了,究竟是怎么個(gè)事兒,不妨跟著作者來捋一捋。

啊?Sora火爆短片《氣球人》,也“造假”了???

背后藝術(shù)家團(tuán)隊(duì)的最新揭秘,可謂一石激起千層浪:

原來,視頻畫面并非完全由AI生成,其中有大量視覺效果需要人類后期實(shí)現(xiàn)。

be like:

這下網(wǎng)友不干了,合著大家伙兒跟OpenAI玩真心,OpenAI背后卻耍起心眼子來了:

他們含糊其辭,就是希望觀眾認(rèn)為短片完全是AI生成的,這是不是有點(diǎn)不誠實(shí)了啊。

這不是人工智能生成的視頻,而是使用了一些AI技術(shù)的視頻。

還有網(wǎng)友直接開噴:誤導(dǎo)性營銷!這是誤導(dǎo)性營銷!

究竟是怎么個(gè)事兒,咱們還是具體捋一捋。

一、揭秘Sora大片工作流

盡管OpenAI一開始就介紹了,《氣球人》這樣的短片出自藝術(shù)家團(tuán)隊(duì)之手,他們只是把Sora開放給了藝術(shù)家使用,但官方并未提及短片具體是如何制作而成的。

現(xiàn)在,《氣球人》背后的藝術(shù)家團(tuán)隊(duì)Shy Kids自己來了個(gè)大揭秘,內(nèi)容包括:

  • 視頻片段一致性如何實(shí)現(xiàn)
  • 他們?nèi)绾翁幚鞸ora生成的視頻素材
  • Sora生成視頻的局限性及后期處理

1. 視頻一致性

《氣球人》中主角形象的一致性可謂驚艷眾人。

但實(shí)際上吧,據(jù)Shy Kids團(tuán)隊(duì)中負(fù)責(zé)后期制作的老哥Patrick Cederberg(簡稱老帕)透露,想要實(shí)現(xiàn)這種前后一致并不是寫寫提示詞就能成的。

Sora并沒有提供工具,來幫助實(shí)現(xiàn)不同鏡頭之間的主體一致性。也就是說,哪怕提示詞都是一樣的,兩次運(yùn)行的結(jié)果也會(huì)有所不同。

他們的做法是,盡可能詳細(xì)地去對(duì)主角形象進(jìn)行描述。

解釋角色的服裝以及氣球的類型是我們解決一致性問題的方法,目前Sora還沒有集成適當(dāng)?shù)墓δ軄韺?shí)現(xiàn)此類控制。

即便如此,團(tuán)隊(duì)在用Sora生成視頻素材時(shí)還是遇到了不少這樣那樣的問題。

比如,提示詞里明明寫了氣球是黃色的,但Sora生成的片段里氣球卻可能變紅。

2. 視頻素材處理

一致性之外,老帕提到,在時(shí)間軸方面,Sora允許用戶修改關(guān)鍵幀。但這種時(shí)間控制并不精準(zhǔn),無法保證一定能實(shí)現(xiàn)預(yù)想的效果。

另外,想要實(shí)現(xiàn)這個(gè)鏡頭:

即把鏡頭焦點(diǎn)從牛仔褲一路上移到氣球頭,也得人類自己后期裁切平移畫面,因?yàn)镾ora本身不會(huì)渲染這樣的鏡頭:它總是傾向于把焦點(diǎn)集中在氣球頭上。

老帕還談到,他們?cè)趯懱崾驹~時(shí)也遇到了一些問題:

OpenAI在讓藝術(shù)家試用Sora前,并沒有考慮到真正的電影制作人是如何思考的。

簡單來說,就是Sora對(duì)攝影術(shù)語(比如跟拍、平移等)的理解有限。老帕認(rèn)為,這一點(diǎn)上Sora不如Runway。

值得一提的是,盡管Sora原生支持生成1080p視頻,但老帕他們實(shí)際上生成的素材都是480p的。他們是在后期使用Topaz等工具對(duì)視頻素材進(jìn)行了超分處理。

生成速度方面,根據(jù)老帕的回憶,每次大概需要10-20分鐘的時(shí)間。

3. 視頻后期

接下來,就到了網(wǎng)友們反應(yīng)最強(qiáng)烈的部分——后期。

前面已經(jīng)說到,Sora本身還解決不了不同視頻片段里一致性的問題。

除了氣球不一定符合設(shè)定,或許是因?yàn)橛?xùn)練數(shù)據(jù)的原因,Sora還喜歡自動(dòng)給氣球加上奇奇怪怪的人臉。

給主角生成其實(shí)并不需要的假人頭。

Sora還很堅(jiān)定地認(rèn)為氣球得帶根繩。

總而言之言而總之,這些都需要老帕上手丟到AE里,進(jìn)行后期處理。

另外,盡管Shy Kids發(fā)現(xiàn)“35mm膠卷”這樣的關(guān)鍵詞很好用,能讓Sora生成的視頻畫面風(fēng)格更一致,但藝術(shù)家們?nèi)孕枰獮樽詈蟮某善稣{(diào)色,為畫面添加顆粒和閃爍效果,以使整部影片畫面更加協(xié)調(diào)統(tǒng)一。

老帕還提到了一個(gè)有意思的細(xì)節(jié):

Sora很喜歡慢鏡頭。

我不知道為什么,但有很多鏡頭看上去都是0.5倍速和0.75倍速。

因此我們需要對(duì)大量畫面進(jìn)行調(diào)速,免得影片看上去像個(gè)大型慢動(dòng)作項(xiàng)目。

那么,Sora生成的視頻素材有多少最終被用在了影片里?

“數(shù)學(xué)很差”的老帕估計(jì)了一下,大概是300:1。

音頻方面,Sora目前還不能生成聲音,因此旁白和音樂都是團(tuán)隊(duì)自己加上去的。

4. 版權(quán)

為了不侵犯版權(quán),OpenAI給Sora上了一些限制。

比如,你不能把提示詞寫成“35mm膠卷,未來宇宙飛船中,一名男子拿著光劍靠近”,那樣Sora會(huì)直接拒絕生成,因?yàn)檫@畫面太像《星球大戰(zhàn)》了。

哦對(duì),像什么“阿羅諾夫斯基式鏡頭”和“希區(qū)柯克變焦”也是不行的。

二、3人團(tuán)隊(duì)2周制作完成

該說不說,在外界卷起風(fēng)波之前,Shy Kids團(tuán)隊(duì)對(duì)于Sora的表現(xiàn)還是很滿意的。

畢竟,制作《氣球人》這樣一個(gè)高質(zhì)量短片,最后只用了他們仨1.5到2周的時(shí)間。

團(tuán)隊(duì)認(rèn)為,現(xiàn)在,對(duì)于專業(yè)的電影團(tuán)隊(duì)來說,Sora當(dāng)然還有很大進(jìn)步空間,但對(duì)于大部分人而言,Sora已經(jīng)足夠驚艷。

用老帕自己的話說:

我覺得人們應(yīng)該將Sora變成工作流里的一部分。

不過,如果他們不想跟AI沾邊,也沒關(guān)系。

對(duì)于這樣的觀點(diǎn),也有不少網(wǎng)友表示認(rèn)同,認(rèn)為Sora這樣的視頻生成AI,是對(duì)現(xiàn)有工作流很好的補(bǔ)充。

Adobe把它們集成進(jìn)軟件里,就是一個(gè)很不錯(cuò)的主意。

但,“我厭倦了OpenAI們的精美Demo營銷”。

還有網(wǎng)友不滿的點(diǎn)在于,爆火的“人工智能生成視頻”背后有大量的人類工作,他們投入數(shù)百個(gè)小時(shí)工作,卻被AI掩蓋了真實(shí)的價(jià)值。

那么,這事兒你怎么看?

參考鏈接:

[1]https://www.fxguide.com/fxfeatured/actually-using-sora/

[2]https://twitter.com/bilawalsidhu/status/1783544598259794046

作者:魚羊

來源公眾號(hào):量子位(ID:QbitAI),追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!