如何冷靜看待視頻大模型Sora?
Sora出現(xiàn)之后,許多人都在思考它會(huì)對(duì)影視行業(yè)或者其他行業(yè)帶來什么影響。這篇文章里,作者分享了他對(duì)Sora的觀察和思考,一起來看一下。
我對(duì)sora的觀察思考都在這里:
1.Sora剛出來的時(shí)候,看到最多的詞匯是“王炸”,“視頻行業(yè)完蛋了”,“人類的落日”。在我看來,這絕對(duì)不是王炸,最多是“四個(gè)3”,因?yàn)檫@僅僅是開端,讓大家過過癮,實(shí)際投入生產(chǎn)和商業(yè)化的路還很長,另外按照OpenAI的風(fēng)格,現(xiàn)在醞釀著更強(qiáng)大的可以投入生產(chǎn)的能力。
2.為什么說是一個(gè)開端,未來是什么樣子?如果我是視頻生產(chǎn)者,我的使用場景是,投喂幾個(gè)圖片或視頻元素,按照我意愿生成一個(gè)完整的視頻,比如全員會(huì)的開場視頻,需要有公司的logo,有虛擬公司吉祥物的形象,甚至有高管的發(fā)言。又比如做一個(gè)產(chǎn)品宣傳視頻,需要把我們產(chǎn)品的界面照片輸入進(jìn)去,比如學(xué)習(xí)機(jī),自動(dòng)生成一個(gè)學(xué)習(xí)機(jī)的宣傳視頻。
如果Sora能夠做到這一步,原本制作視頻的成本是10天,壓縮成2個(gè)小時(shí),才是顛覆行業(yè),視頻從業(yè)者的落日。
但現(xiàn)在已經(jīng)看到Sora的能力,他的描述能力,也就是把腦海中想象的畫面通過文字具象化的能力,很多人類是不具備這種能力的。所以要達(dá)到上面說的場景, 只是時(shí)間問題。
3.Sora僅僅具備描述能力,缺少的是想象力和共情能力。所以靠想象力產(chǎn)生價(jià)值的工作長期還無法取代,比如演員,我們看電影,看的是演員的微表情,性格特征,從而共情,比如賈玲的堅(jiān)韌,沈騰經(jīng)歷坎坷的逆風(fēng)翻盤,沒有賽車手經(jīng)歷的韓寒拍不出《飛馳人生》。
所以說替代影視行業(yè),時(shí)間尚早。冷靜對(duì)待自媒體的夸張表達(dá)。
4.Sora不是第一個(gè)生成視頻的工具,他為什么會(huì)火?
從我目前的觀察來看,生成視頻的質(zhì)量最好。體現(xiàn)在這幾個(gè)點(diǎn):
第一時(shí)間比較長,長達(dá)1分鐘的超長視頻,內(nèi)容長度遠(yuǎn)遠(yuǎn)高于市面上的AI視頻模型。60秒達(dá)到了抖音快手的內(nèi)容要求;
第二視頻內(nèi)容的連貫性,其他生成的視頻二維效果較好,但是對(duì)三維空間以及物體應(yīng)如何交互沒有內(nèi)在的理解,導(dǎo)致AI視頻往往會(huì)出現(xiàn)人物扭曲和變形。Sora生成的視頻一鏡到底,視頻中的舞龍,背景人物,都達(dá)到了驚人的一致性,各種鏡頭隨意切換,人物都是保持了極高的穩(wěn)定性。
第三是細(xì)節(jié)表現(xiàn),人物的眼睫毛惟妙惟俏,舞獅畫面獅頭的麒麟隨風(fēng)擺動(dòng)。
5.有的公司假期還沒結(jié)束,還沒有正式上班,就開始行動(dòng)了,重點(diǎn)討論Sora的產(chǎn)品布局。對(duì)于組織和個(gè)人來說,想抓住這波機(jī)會(huì),至少先關(guān)注再嘗試,且不能忽視。借用一句話,先看見,再相信。
6.Sora對(duì)教育產(chǎn)品有什么影響?或許偽直播,錄播課是不是都可以成為過去式了?
只需要知識(shí)點(diǎn)的輸入,就能生成一個(gè)生動(dòng)形象的而且是真實(shí)的主講老師講課視頻。
對(duì)于教研老師的能力或許是操控AI的能力了。
說到最后,人類遠(yuǎn)古經(jīng)歷石器時(shí)代、青銅時(shí)代、鐵器時(shí)代。有的工具在人類手上始終是靜止的工具,有的工具在人類手上變成神奇的魔法棒。
作者:靈魂工程,微信公眾號(hào):靈魂工程(linghun1949)
本文由@靈魂工程 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Sora 官網(wǎng)演示視頻截圖
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒評(píng)論,等你發(fā)揮!