一区二区三区性感电影,中文日产乱幕九区无线码,精品伊人久久大香线蕉网站

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

從AI中找商機(jī)，XR內(nèi)容創(chuàng)作也該迎來春天了

VR陀螺

2024-12-30

0 評(píng)論 215 瀏覽 0 收藏

12 分鐘

“AI 賦能 XR 創(chuàng)作，3D 內(nèi)容迎曙光?！?在科技飛速發(fā)展的當(dāng)下，AI 如何為 XR 內(nèi)容創(chuàng)作帶來新契機(jī)？其又將如何重塑 3D 內(nèi)容生態(tài)？

元橋2024年AI 3D生成又邁出了很大的一步。12月初，谷歌DeepMind發(fā)布了新一代世界模型Genie 2，可以「一張圖生成1分鐘游戲3D世界」，引發(fā)網(wǎng)友驚呼。而在谷歌發(fā)布Genie 2的前兩天，AI學(xué)者、斯坦福大學(xué)教授李飛飛公布了她的第一個(gè)空間智能創(chuàng)業(yè)項(xiàng)目：「僅憑借1張圖，就能生成一個(gè)3D游戲世界的AI系統(tǒng)」。幾乎同一時(shí)間，雙方發(fā)布的AI模型系統(tǒng)都瞄準(zhǔn)了3D世界。前不久，庫(kù)克曾在一次采訪中表示，“對(duì)于Vision Pro來說，最大考驗(yàn)是生態(tài)系統(tǒng)。”但這又不僅僅是Vision Pro面臨的難關(guān)，可以說這么多年整個(gè)XR生態(tài)的發(fā)展邏輯都是內(nèi)容要比硬件難推，算是XR行業(yè)的老問題。如今看來，生成式AI技術(shù)的大成熟已推動(dòng)AI 3D內(nèi)容創(chuàng)作進(jìn)入了新的時(shí)代。

?谷歌與李飛飛的又一次推進(jìn)，看見空間智能?2022年，谷歌發(fā)布AI 3D模型DreamFusion，突破了對(duì)傳統(tǒng)3D建模的限制，能夠通過簡(jiǎn)單的文本描述自動(dòng)生成高質(zhì)量的3D模型。這一創(chuàng)新使得3D建模變得更加智能化、簡(jiǎn)便化。同時(shí)DreamFusion的到來，也為游戲、VR、電影制作等行業(yè)帶來了很大的創(chuàng)作提升。從2023年開始，AI 3D開始受到業(yè)內(nèi)廣泛關(guān)注，當(dāng)年出現(xiàn)的新模型就有近20個(gè)，包括ProlificDreamer與One-2-3-45++等，很多團(tuán)隊(duì)已經(jīng)實(shí)現(xiàn)能夠從一句話或者一張圖生成高質(zhì)量的三維模型。雖然AI 3D模型的發(fā)展越來越熱鬧，但也有其不足的地方，主要是大多數(shù)AI 3D生成的方法都是借助「2D擴(kuò)散模型生成3D模型」的路徑。這種路徑一大問題就是耗時(shí)，ProlificDreamer作者就曾在知乎上表示這些方法目前的主要局限之一便是生成時(shí)間太慢。此外，還需要突破兩個(gè)關(guān)鍵的技術(shù)點(diǎn)，即：首先Loss的計(jì)算，利用預(yù)訓(xùn)練的2D文生圖模型，計(jì)算出三維表征渲染出的2D圖像和文本之間的Loss，間接判斷渲染出的圖像是否符合2D擴(kuò)散模型的先驗(yàn)知識(shí)。?其次通過NeRF、DMTet等可微分、可渲染的三維表征渲染2D圖像，然后用2D文生圖模型監(jiān)督蒸餾，將Loss得到的梯度回傳到這些表征當(dāng)中，從而實(shí)現(xiàn)幾何形狀和顏色的優(yōu)化，得到可用的3D模型。

DreamFusion的生成效果展示這一套邏輯走下來，雖然相較于傳統(tǒng)的模式已經(jīng)可以便捷地生成高質(zhì)量的3D模型，但距離普通用戶創(chuàng)作還是很遠(yuǎn)。但今年李飛飛與谷歌發(fā)布新的模型，直指UGC內(nèi)容創(chuàng)作平臺(tái)，暗隱了新一輪的內(nèi)容創(chuàng)作革命。12月3日，李飛飛創(chuàng)業(yè)公司W(wǎng)orld Labs展示了單圖生成3D世界的AI系統(tǒng)。李飛飛表示，“無論怎樣理論化這個(gè)想法，都很難用語(yǔ)言描述一張照片或一句話生成3D場(chǎng)景的互動(dòng)體驗(yàn)?！?

World Labs的單圖生成3D場(chǎng)景的效果演示除了可以實(shí)現(xiàn)單圖探索3D世界之外，還可以改變其中物體顏色，動(dòng)態(tài)調(diào)整背景光影，在場(chǎng)景中插入其他對(duì)象。你能夠像玩游戲那樣，自由地移動(dòng)相機(jī)來探索這個(gè)3D世界，淺景深、希區(qū)柯克變焦等操作均可行。英偉達(dá)高級(jí)研究科學(xué)家、李飛飛高徒Jim Fan總結(jié)道，“GenAI正在創(chuàng)造越來越高維度的人類體驗(yàn)快照；Stable Diffusion是2D快照；Sora是2D+時(shí)間維度的快照；而World Labs是3D、完全沉浸式的快照?！倍驮跇I(yè)內(nèi)都還沉浸在World Labs所展示的3D世界系統(tǒng)時(shí)，谷歌DeepMind又相繼發(fā)布了大型基礎(chǔ)世界模型Genie 2，再次點(diǎn)燃了人們的想象空間。Genie 2可根據(jù)一張圖生成可供人類或AI智能體游玩的無限3D世界。也就是說，Genie 2不僅能創(chuàng)造出一個(gè)逼真的3D游戲場(chǎng)景，用戶還能在這個(gè)場(chǎng)景里進(jìn)行互動(dòng)。此外，Genie 2還支持3D空間中的重力、光線、反射、煙霧等物理模擬以及特殊效果模擬和生成。

從靜態(tài)3D模型生成到可交互的動(dòng)態(tài)3D內(nèi)容生成，3D生成的發(fā)展路徑終究還是指向了UGC內(nèi)容平臺(tái)，也就是說未來必然是每個(gè)人都可以零門檻、零成本實(shí)時(shí)創(chuàng)作3D體驗(yàn)。眾所周知，3D內(nèi)容創(chuàng)作一直都需要專業(yè)的人員與技術(shù)完成，是唯一一個(gè)沒有UGC內(nèi)容平臺(tái)的信息載體，但3D內(nèi)容必然會(huì)迎來爆發(fā)的那一天，而這一步也終離不開UGC內(nèi)容平臺(tái)。從World Labs與Genie 2中不難看出，無論是李飛飛的工作團(tuán)隊(duì)還是谷歌的大模型，科技巨頭都在推動(dòng)這一步的到來。?從AI中找商機(jī)，XR內(nèi)容創(chuàng)作也該迎來春天了?2024年，XR內(nèi)容創(chuàng)作大體依然很苦。據(jù)VR陀螺了解，目前能賺錢的XR內(nèi)容團(tuán)隊(duì)大致分為三種：一是，專門負(fù)責(zé)海外市場(chǎng)，有一定的專業(yè)度，同時(shí)海外相比國(guó)內(nèi)市場(chǎng)也較為理想；二是，做線下內(nèi)容，類似于體驗(yàn)店/大空間，尤其今年VR大空間爆發(fā)，不少內(nèi)容團(tuán)隊(duì)開始分力專做這一塊；三是，負(fù)責(zé)一些小的項(xiàng)目，或者專門為一些大廠提供內(nèi)容搭建輔助。但隨著AI 3D創(chuàng)作的到來，一些特別的情況已經(jīng)出現(xiàn)。不少創(chuàng)作者開始從AI中找商機(jī)，例如10月份UGC內(nèi)容平臺(tái)Roblox玩家RG使用Tripo生成的一頂3D粉色貝雷帽，在1小時(shí)內(nèi)吸引了超3000名玩家涌入Tripo。RG也靠售賣游戲配飾賺到了超過1億Robux（Roblox內(nèi)的代幣，折合約35萬(wàn)美元，近250萬(wàn)元人民幣）。

與此同時(shí)，在TikTok、Roblox等內(nèi)容平臺(tái)上，也已經(jīng)有創(chuàng)作者通過AI 3D內(nèi)容賺到了第一桶金。更為重要的是，很多創(chuàng)作者在社交媒體平臺(tái)上發(fā)布的3D模型視頻，完全能夠?qū)氲接螒虻漠嬅嬷惺褂谩I技術(shù)的成熟為創(chuàng)作者提供了全新的商業(yè)思路，除了公開平臺(tái)上AI 3D創(chuàng)作的盈利模式之外，電商領(lǐng)域?qū)?D內(nèi)容的需求也在增強(qiáng)。例如，亞馬遜推出的Virtual Try-On的3D功能，支持商家上傳自己物品的3D模型，以提高商品的吸引力。而像Vision Pro上淘寶、京東等網(wǎng)購(gòu)平臺(tái)，雖然體驗(yàn)讓人驚艷，但3D內(nèi)容還是太少。為了能夠豐富3D內(nèi)容生態(tài)，11月份淘寶還推出了全球首場(chǎng)3D空間交互直播。

不難看出，業(yè)內(nèi)已經(jīng)意識(shí)到隨著空間計(jì)算的逐步發(fā)展，行業(yè)對(duì)3D資產(chǎn)的需求已經(jīng)變得越來越高。亞馬遜官方也表示，“超過9成的消費(fèi)者認(rèn)為3D商品會(huì)影響自己的購(gòu)物決策，因此電商領(lǐng)域?qū)?D生成內(nèi)容的應(yīng)用，將會(huì)成為一個(gè)可行的商業(yè)化方向”。面向一個(gè)既定的未來，3D內(nèi)容創(chuàng)作存在著無限的想象空間。不僅新型企業(yè)可以從中分得一杯羹，一些小的XR內(nèi)容團(tuán)隊(duì)甚至個(gè)人創(chuàng)作者也終迎來另一風(fēng)起。進(jìn)一步看，在AI技術(shù)的發(fā)展下，3D創(chuàng)作的市場(chǎng)也正在被緩緩打開。Meta在宣布與卡梅隆合作打造「世界級(jí)3D娛樂體驗(yàn)」后也表示，“使用虛擬和混合現(xiàn)實(shí)頭顯的人數(shù)比以往任何時(shí)候都多，為沉浸式講故事開啟了令人興奮的新可能性。通過與Lightstorm Vision的合作，我們致力于推動(dòng)媒體發(fā)展，并通過使用包括AI在內(nèi)的先進(jìn)工具，提升內(nèi)容創(chuàng)作者制作高質(zhì)量立體內(nèi)容的能力?！盇I正在助力3D內(nèi)容產(chǎn)業(yè)的發(fā)展向更深的領(lǐng)域邁進(jìn)。對(duì)于內(nèi)容創(chuàng)作來說，將會(huì)迎來很大的機(jī)遇，在新行業(yè)與新技術(shù)之上騰飛。也正如馬云回歸后的首次演講所言，“20年前，互聯(lián)網(wǎng)剛剛到來的時(shí)候，我們這一代人很幸運(yùn)，抓住了互聯(lián)網(wǎng)時(shí)代的機(jī)遇。從今天來看，未來20年的AI時(shí)代能帶來的改變會(huì)超出所有人的想象，因?yàn)锳I會(huì)是一個(gè)更加偉大的時(shí)代。”?寫在最后?從技術(shù)發(fā)展路徑來看，AI已經(jīng)在3D內(nèi)容生成領(lǐng)域有了重大的進(jìn)步，并且已被業(yè)內(nèi)視為是占據(jù)絕對(duì)重要性的技術(shù)。隨著AI技術(shù)不斷發(fā)展，AI 3D的成熟也將會(huì)助推應(yīng)用層面不斷出現(xiàn)新的現(xiàn)象，而AR/MR的普及也將會(huì)帶動(dòng)3D內(nèi)容不斷豐富。乘著技術(shù)的風(fēng)，加碼布局的頭部企業(yè)動(dòng)作也越來越頻繁，除了卡梅隆與Meta的合作之外；迪士尼也組建了全新的技術(shù)辦公室，以探索AI與混合現(xiàn)實(shí)的應(yīng)用；佳能發(fā)布了新款鏡頭，專為3D VR視頻拍攝設(shè)計(jì)，可用于Meta Quest 3等頭戴設(shè)備以及Vision Pro空間視頻的拍攝；前段時(shí)間影像技術(shù)公司Blackmagic Design還推出了專為拍攝沉浸式視頻而設(shè)計(jì)的商業(yè)攝像機(jī)URSA Cine Immersive。毫無疑問，3D內(nèi)容生態(tài)已是明確的趨勢(shì)，一些頭部企業(yè)的布局也都指向了這點(diǎn)。隨著行業(yè)發(fā)展逐步滲透，也映射了未來內(nèi)容生態(tài)的變革和新方向。?

本文由人人都是產(chǎn)品經(jīng)理作者【VR陀螺】，微信公眾號(hào)：【VR陀螺】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App