Sora來臨,它能搶了誰的飯碗?
OpenAI又有“新活”了,2024年初,OpenAI發(fā)布了新的視頻生成模型Sora,引起了各行業(yè)的廣泛關(guān)注。本文分享了Sora與其他視頻生成模型相比具有的優(yōu)點(diǎn),并推斷了Sora會(huì)對影視行業(yè)帶來的影響,快來閱讀吧!
繼ChatGPT后,OpenAI在2024年初又掀起了人們的討論熱情。
2月16日清晨,OpenAI發(fā)布了文生視頻AI模型Sora,引爆全球網(wǎng)絡(luò)。與以往的文生視頻模型Runway和Pika不同,Sora可以持續(xù)地模擬人物、動(dòng)物和物體,并生成同一角色的多個(gè)景別的鏡頭,在整個(gè)視頻中保持其外觀和背景。
此外,Sora還可以生成圖片。與以往相比,這些圖片中的細(xì)節(jié)更清晰,包括臉上的斑點(diǎn)和嘴唇上的細(xì)紋,分辨率最高可達(dá)2048×2048。
一石激起千層浪,Sora發(fā)布后,一眾科技圈大佬紛紛下場討論。馬斯克表示“gg humans”(gg/good games原指游戲結(jié)束時(shí)玩家互相致意,后引申為“游戲結(jié)束”);周鴻祎預(yù)言:“這可能給廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來巨大顛覆”;前阿里副總裁賈揚(yáng)清則評(píng)價(jià):“真的非常?!薄?/p>
“霸榜”近日科技板塊熱點(diǎn)的Sora大模型亮點(diǎn)在哪里?具體來看,這會(huì)對影視制作行業(yè)起到怎樣的影響?
01 高質(zhì)量、長時(shí)間、多景別
簡單來講,Sora能夠根據(jù)文本提示,創(chuàng)建60秒的視頻、擴(kuò)展現(xiàn)有視頻以及從圖像中生成視頻,視頻中還包含復(fù)雜的場景和鏡頭運(yùn)動(dòng)。
OpenAI官網(wǎng)展現(xiàn)了多段Sora制作的視頻,身著黑色皮衣、紅色裙子的女子在雨后的夜晚行走在東京市區(qū)街道上,女子皮膚毛孔色沉清晰可見,路面積水反映著路燈倒影,視頻真實(shí)度十分之高,如果不是偶爾穿幫的左右腿,很難一眼判斷是AI制作的視頻。
在運(yùn)鏡、構(gòu)圖等方面,Sora視頻都呈現(xiàn)出大幅度的提升,一舉將AI視頻提升至“next?level” 。
圖源OpenAI
此外,Sora不僅能夠生成完整的60秒視頻,還能延長已生成的視頻。也就是說,給Sora一段視頻,它可以自動(dòng)生成前面或者后面的視頻。
更離譜的是,Sora可以生成不同機(jī)位、不同景別的視頻,并進(jìn)行剪輯。且在不同的機(jī)位下,無論是廣角、中景、近景、特寫,室內(nèi)還是室外,視頻中人物和背景的關(guān)系都一致,不受影響。
圖源OpenAI
也就是說,僅需要一段文字,Sora模型就可以生成一段60s的1080p視頻,包含不同景別鏡頭。不由得讓人感嘆——“真實(shí)和虛幻的差別,到底還有多大距離?”
值得注意的是,文生視頻早已存在,根據(jù)知名投資機(jī)構(gòu)a16z統(tǒng)計(jì),截至2023年底,市場上共有21個(gè)公開的AI視頻模型,例如Google的Lumiere、Stability AI的SVD、以及視頻生成大模型Gen-2的開發(fā)商Runway。其中,Runway2023年6月底完成C輪融資后,估值則是超過15億美元。
Sora 公開后,東吳證券對目前主要的視頻生成模型做了對比。他將Sora、W.A.L.T、Gen-2和Emu Video、Pika 1.0、Stable Video六個(gè)模型的特點(diǎn)、生成視頻表現(xiàn)等特點(diǎn)進(jìn)行對比分析。結(jié)論是,Sora在生成時(shí)長、一致性等方面都有顯著的優(yōu)勢,具有突破性的語義理解能力。
圖源東吳證券
去年年初,ChatGPT橫空出世,而一年后,Sora就實(shí)現(xiàn)了視頻的快速創(chuàng)作,如此快的發(fā)展速度令人心驚。畢竟一年前,AI生成視頻還是這樣。
圖源網(wǎng)絡(luò)
有B站網(wǎng)友表示:“小時(shí)候還想過,未來會(huì)不會(huì)有這樣一種拍電影的技術(shù),戴上腦機(jī)后靠人腦的想象來生成各種各樣壯麗恢宏的電影畫面,誰知這個(gè)現(xiàn)實(shí)已經(jīng)不遠(yuǎn)了?!?/p>
雖然目前Sora還處于測試階段,只面向邀請的制作者和安全專家開放測試(據(jù)稱是一些視覺藝術(shù)家、設(shè)計(jì)師和電影制作人)。然而資本端已然聞風(fēng)而動(dòng),CB Insights的數(shù)據(jù)則顯示,OpenAI目前是世界上最有價(jià)值的科技初創(chuàng)企業(yè)之一,僅次于字節(jié)跳動(dòng)和SpaceX。
在根據(jù)Thrive牽頭的收購要約進(jìn)行現(xiàn)有股票出售后,當(dāng)前OpenAI的估值已經(jīng)達(dá)到800億美元以上,達(dá)到九個(gè)月前的近3倍。
只不過,有人歡喜有人愁,對于一些影視行業(yè)從業(yè)者和AGI視頻初創(chuàng)公司,Sora的問世很難說是喜事。
02 風(fēng)暴來襲
Sora發(fā)布,最直觀的影響就是AGI視頻創(chuàng)業(yè)公司。
曾在2023年熱映影片《瞬息全宇宙》中參與制作的Runway,其 CEO瓦倫祖拉在Sora發(fā)布后,在X平臺(tái)上發(fā)布了兩個(gè)字,“Game On.”(競爭開始了)。
圖源X平臺(tái)
對于字節(jié)跳動(dòng)來說,Sora的出現(xiàn)無疑是對于剪映的一大威脅。今年,就在Sora問世的一周前,原抖音集團(tuán)CEO張楠卸任,轉(zhuǎn)而投入剪映,反映出抖音對于AIGC工具的重視。隨著Sora的不斷發(fā)展,剪映如何才能學(xué)習(xí)Sora并創(chuàng)新,成為了當(dāng)務(wù)之急。
除此之外,Sora類AI模型對于好萊塢以及電影、電視、廣告等領(lǐng)域的影響是最直觀的。
美國行業(yè)調(diào)查公司CVL Economics,上個(gè)月發(fā)布的一項(xiàng)對300位好萊塢行業(yè)領(lǐng)袖的調(diào)查顯示,75%的受訪者承認(rèn),生成式AI(工具、軟件、模型)已經(jīng)促使他們業(yè)務(wù)部門削減與合并工作崗位,擔(dān)憂情緒彌漫在整個(gè)好萊塢。
那些掌控著好萊塢行業(yè)秩序的大佬預(yù)計(jì),未來三年好萊塢總計(jì)會(huì)有超過20萬人的工作崗位會(huì)遭受AI沖擊,尤其是視覺特效、音效師、畫圖師等后期工作崗位。
圖源OpenAI
不過,回顧內(nèi)容創(chuàng)作的歷史,工具的發(fā)展無法阻擋,進(jìn)步是常態(tài),比起抵制,創(chuàng)作者更要思考哪些環(huán)節(jié)和內(nèi)容變得更有價(jià)值。
從AI 制作視頻的流程上來看,當(dāng)前的Sora需要先輸入一段文字,隨后再生成視頻,視頻的原創(chuàng)性還是在依賴著創(chuàng)作者的審美,Sora的工具屬性更加突出。比起原創(chuàng)內(nèi)容,Sora的優(yōu)勢更在于,那些需要耗費(fèi)大量人力物力的特效片段。
所以,也有網(wǎng)友預(yù)測,雖然未來視頻制作流程中的剪輯師、特效師等后期崗位會(huì)面臨更為嚴(yán)峻的處境。但過往那些受限于拍攝成本、拍攝技術(shù)的內(nèi)容,則會(huì)更受關(guān)注。
理想的情況下,Sora未來能夠代替更多機(jī)械、重復(fù)的工作,使得創(chuàng)作者可以集中精力于創(chuàng)新的、深度的解讀,給文化消費(fèi)者們提供更優(yōu)質(zhì)的內(nèi)容。
此外,由于AI的理解內(nèi)容更加偏向于輸入“關(guān)鍵詞”,而非劇本。所以在未來,如何創(chuàng)作出適合AI 理解的劇本,從而生成視頻,也是值得關(guān)注的問題。
03 Sora的價(jià)值,不止視頻
目前來看,Sora最直觀的影響是視頻制作行業(yè),但他的野心,或者是眾多大模型的野心遠(yuǎn)不止于此。
OpenAI官網(wǎng)上,將Sora定位為世界模擬器。OpenAI認(rèn)為,其能夠有效地模擬物理和數(shù)字世界,包括其中的物體、動(dòng)物和人類等各種因素。根據(jù)OpenAI的報(bào)告顯示,Sora在理解地球物理世界的規(guī)律層面,取得了巨大的進(jìn)展。
當(dāng)然,目前的Sora作為一個(gè)模擬器當(dāng)前還存在著一定的缺陷,世界模型仍然不夠完善。在OpenAI發(fā)布的48個(gè)Sora生成的視頻中,就出現(xiàn)了不少穿幫的畫面。
例如玻璃杯還沒有破碎,但是液體已經(jīng)流出;人們在沙漠中挖出變形塑料椅子;一個(gè)男人在倒著跑跑步機(jī)等不符合邏輯的視頻內(nèi)容。簡單來說,一些對于人類來說約定俗成的因果規(guī)律,Sora模型短期內(nèi)無法推理。
圖源OpenAI
就已有信息來看,目前的Sora仍處于1.0階段,在處理精細(xì)的背景時(shí)常常出現(xiàn)力不從心的情況,但沒人會(huì)否認(rèn)Sora對于AGI實(shí)現(xiàn)路程上的里程碑地位。
AI風(fēng)口下,Sora的出現(xiàn)讓我們看到了AGI實(shí)現(xiàn)的可能,也逼迫著同行業(yè)內(nèi)不斷創(chuàng)新發(fā)展。畢竟泡沫過后,贏家只能有一個(gè)。
作者:光也
來源公眾號(hào):TopKlout克勞銳(ID:TopKlout),一個(gè)集好看和有料于一身的自媒體生態(tài)觀察號(hào)
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @TopKlout克勞銳 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!