當(dāng)Vision Pro+AI Sora,將碰撞出什么火花?
Vision Pro 的出現(xiàn),搭建起了虛擬世界和現(xiàn)實(shí)世界的橋梁,而 Sora 模型的出現(xiàn),則又為 Vision Pro 的落地可能性添加了更多火花。怎么看待Vision Pro + Sora 的結(jié)合?一起來(lái)看看本文的解讀與分享。
今年2月份兩個(gè)產(chǎn)品的發(fā)布,在2024新年一開(kāi)年扔出了王炸,一個(gè)是2024年2月2日的 蘋(píng)果公司 Vision pro頭顯發(fā)布,另外一個(gè)是同年2月16日 Open AI 發(fā)布的Sora 文生視頻的虛擬世界模擬器生成模型,我們來(lái)看下兩個(gè)王炸產(chǎn)品碰撞在一起,會(huì)激發(fā)出什么樣的火花?
一、Vision pro——新時(shí)代的空間計(jì)算機(jī)
蘋(píng)果Vision pro剛剛發(fā)布,一躍成為迄今最先進(jìn)的虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)眼鏡,蘋(píng)果公司將其稱為“空間計(jì)算機(jī)”,OpenAI的創(chuàng)始人兼首席執(zhí)行官山姆·奧特曼評(píng)價(jià):蘋(píng)果Vision pro是自iPhone以后第二驚艷的技術(shù)。 實(shí)際上手體驗(yàn)時(shí),當(dāng)你帶上眼睛后,沉浸式呈現(xiàn)眼前是一個(gè)虛擬空間,它以高分辨率屏幕,支持重放事件和人物的三維視頻錄像,看起來(lái)就像置身其中,只需要通過(guò)簡(jiǎn)單的眼神和隔空手勢(shì)操作。
1. Vision pro 定位:打通虛擬世界與現(xiàn)實(shí)世界的橋梁,呈現(xiàn)虛擬世界的載體
Vision pro出現(xiàn)讓空間計(jì)算這個(gè)詞得到現(xiàn)實(shí)中完美呈現(xiàn),簡(jiǎn)單說(shuō)將我們周圍的現(xiàn)實(shí)物理世界和虛擬世界無(wú)縫整合,同時(shí)讓人類可以實(shí)現(xiàn)毫無(wú)違和感地操控物體和空間,提供了一種全新的互動(dòng)體驗(yàn)。
再夸張一些,在Vision pro搭建世界中,將虛擬和物理世界融為一體了,不論是一輛汽車還是一臺(tái)電視,都將成為空間計(jì)算設(shè)備。
通過(guò)Vision pro強(qiáng)大的空間計(jì)算能力,可以用戶提供高清晰度、強(qiáng)互動(dòng)性的沉浸式風(fēng)景展現(xiàn):置身于月球登陸,探索南極洲冰川。
2. Vision pro現(xiàn)階段瓶頸——沉浸式體驗(yàn)資源生產(chǎn)匱乏
雖然Vision pro在技術(shù)和體驗(yàn)上實(shí)現(xiàn)了重大突破,但仍存在諸多不足,需要進(jìn)一步完善和優(yōu)化。比如在于虛擬世界的搭建上和3D電影 沉浸式影片照片體驗(yàn),現(xiàn)階段都是基于VisionPro頭顯專用流媒體資源(至今為止可以訪問(wèn)僅150 深度的3D娛樂(lè)項(xiàng)目),且需要依賴于強(qiáng)大的虛擬世界搭建引擎和海量可支持3D的視頻模型資源,哪怕是內(nèi)置的3D攝像頭可以拍攝照片或視頻,但也需要用戶自主去捕捉拍攝,才能實(shí)現(xiàn)進(jìn)一步呈現(xiàn)。
而這一切的資源限制,隨著OpenAI Sora近期發(fā)布,讓一切限制有了突破的可能性。
二、Sora 發(fā)布——虛擬新世界的創(chuàng)造引擎
如果說(shuō)Vision pro 頭顯是開(kāi)啟新世界大門(mén)的鑰匙,那么Sora可以理解為虛擬新世界的創(chuàng)造引擎,所有呈現(xiàn)的內(nèi)容在未來(lái)都可以由Sora來(lái)制作且呈現(xiàn)在使用者眼前。
眾所周知,視頻是不能P的這個(gè)定律,也隨著sora的發(fā)布被打破了。
Sora 不僅僅是一個(gè)文生視頻的軟件,而是 作為世界模擬器的視頻生成模型”,“他并不是僅僅對(duì)于現(xiàn)實(shí)世界的鏡像,而是基于你的描述,構(gòu)建新的一個(gè)符合現(xiàn)實(shí)世界物理規(guī)律和運(yùn)轉(zhuǎn)虛擬世界,第一次AI可以理解這個(gè)世界的定義,并且基于這些世界運(yùn)轉(zhuǎn)規(guī)律再進(jìn)行二次創(chuàng)造。
1. Vision pro 與sora 結(jié)合——?jiǎng)?chuàng)造一個(gè)更加有趣的虛擬世界
Vision pro 頭顯顯示技術(shù)呈現(xiàn)的是一個(gè)與現(xiàn)實(shí)結(jié)合的虛擬空間,背后是基于現(xiàn)有的流媒體素材進(jìn)行3D化改造,但當(dāng)虛擬3D流媒體素材視頻不再是拘泥于現(xiàn)有的視頻素材,是可以通過(guò)你的描述由Sora 自定義生成新的視頻呢?
過(guò)去Vision pro 里搭建的3D媒體資源可以理解為是在一片魚(yú)塘里尋找合適的魚(yú)來(lái)匹配呈現(xiàn),Sora的出現(xiàn)將整個(gè)魚(yú)塘規(guī)模成幾何倍擴(kuò)大,可能是一整個(gè)海洋,甚至超越整個(gè)海洋的容量,通過(guò)這樣大的資源庫(kù)進(jìn)行快速生成,不再受限于已有資源的限制,對(duì)于Vision pro來(lái)講,用戶使用和發(fā)揮的空間被放大到最大化。
大膽想象下,你可以通過(guò)自己的口述,讓Sora 虛擬世界技術(shù)在Vision pro里搭建自己的新世界。甚至可以將夢(mèng)中的畫(huà)面口述出來(lái),讓sora幫你還原夢(mèng)中1:1虛擬景象 ,通過(guò)Vision pro 呈現(xiàn)出來(lái)夢(mèng)中的景象,在沉浸式技術(shù)的加持下,你自己就真實(shí)置身于自己搭建的虛幻世界中,參與其中,你還能分清虛擬和現(xiàn)實(shí)世界的差異性嗎?
2. Vision pro 與sora結(jié)合不僅在于3D視頻資源供給,而是打破了信息傳遞的介質(zhì)
過(guò)去我們希望將腦海中的想法表達(dá)出來(lái),需要通過(guò)自己將大腦中想法轉(zhuǎn)化為其他人可理解的文字,圖片,形狀,盡可能降低折損傳遞,但無(wú)論如何都很難完美的呈現(xiàn)。
但通過(guò)Vision pro 與sora結(jié)合,你可以將你的想法通過(guò)口述方式傳遞給sora,由sora去生產(chǎn)還原你腦海中的想法,并支持可視化的在線編輯修改,最后由Vision pro 完美無(wú)損呈現(xiàn)你的可視化想法,完全不需要進(jìn)行更多折損的轉(zhuǎn)化路徑。
3. 顛覆未來(lái)工作方式和生活方式
未來(lái)在公司宣講或者講課,開(kāi)會(huì)等場(chǎng)景,大家可以想象下,呈現(xiàn)在我們面前的不再在是一個(gè)枯燥單調(diào)的word/ppt方案,而是一個(gè)通過(guò)聲音和畫(huà)面以及感知觸摸方式進(jìn)行交互的虛擬可視化方案,你不再是方案的旁觀者,而是作為方案中的參與者去呈現(xiàn),直接顛覆了未來(lái)的工作和生活方式。
如果再結(jié)合未來(lái)馬斯克腦接口的神經(jīng)連接實(shí)現(xiàn),甚至省去口述的步驟,所想及所得,阿凡達(dá)的虛擬世界在未來(lái)真的有望實(shí)現(xiàn)。
未來(lái)每個(gè)人都可以擁有一個(gè)像科幻電影鋼鐵俠中屬于自己賈維斯。
其實(shí)openAI已經(jīng)為蘋(píng)果Vision pro帶來(lái)了ChatGPT,允許用戶直接在應(yīng)用程序中提出問(wèn)題,獲得答案,獲得建議,甚至生成圖像和文本。在不久的將來(lái),我們將不再需要在聊天界面中輸入信息,而是更頻繁地通過(guò)與AI助手應(yīng)用對(duì)話來(lái)表達(dá)我們的需求。
未來(lái)引入Sora的助力后,Vision pro呈現(xiàn)回答的方式會(huì)更加立體直觀,比如遇到一個(gè)比較棘手的問(wèn)題,如汽車引擎無(wú)法啟動(dòng)的故障,sora會(huì)自動(dòng)生成一個(gè)汽車的拆解3D影響。一步步教你如何解決問(wèn)題。
三、總結(jié)
雖然現(xiàn)階段無(wú)論是Vision pro還是Sora仍有很多不足,包括被大家詬病的Vision pro尿袋設(shè)計(jì),以及頭顯的太重的問(wèn)題,Sora生成視頻中也有一些違背自然規(guī)律翻車內(nèi)容,也還未實(shí)現(xiàn)3D 顯式建模。但隨著科技的快速發(fā)展,按照目前迭代速度和算法持續(xù)優(yōu)化,這些問(wèn)題在不久將來(lái)一定可以解決。
我們要將眼光放長(zhǎng)遠(yuǎn)一些,未來(lái)10年,甚至3-5年后再看這些產(chǎn)品,會(huì)發(fā)展的非常成熟和完善。不要忘了僅1年時(shí)間,Open AI就已經(jīng)從GPT3-GPT4-迭代到Sora,放在過(guò)去完全不敢想象的進(jìn)步, 技術(shù)的突飛猛進(jìn)速度已遠(yuǎn)超出我們的預(yù)期和想象 ,所以科幻走進(jìn)現(xiàn)實(shí),只是早晚的事情。
Sora生成的視頻截圖。提示詞:打印一個(gè)人跑步的場(chǎng)景,35 毫米電影膠片。
庫(kù)克對(duì)Vision pro的希望是“定義下一個(gè)十年”,而生成式AI恰巧會(huì)在接下來(lái)的10年時(shí)間內(nèi)快速發(fā)展。據(jù)彭博社最新報(bào)告顯示,預(yù)計(jì)生成式AI市場(chǎng)規(guī)模將會(huì)在2032年擴(kuò)大至1.3萬(wàn)億美元。需要知道,2022年生成式AI的市場(chǎng)規(guī)模不過(guò)400億美元,連1.3萬(wàn)億美元的零頭都不到。
如果說(shuō)Vision pro能夠搭上生成式AI這輛車,那么在接下來(lái)的10年時(shí)間里必定會(huì)成為蘋(píng)果又一劃時(shí)代的產(chǎn)品,而Sora和Vision pro的結(jié)合對(duì)于雙方都是很好的補(bǔ)充,在虛擬和現(xiàn)實(shí)世界之間已經(jīng)建立了一個(gè)鏈接,這讓無(wú)論是頭號(hào)玩家式的虛擬世界,還是機(jī)器人更像人類,都充滿了更大的可能性。
本文由 @黑人阿貍 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自蘋(píng)果官網(wǎng)截圖
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!