從抖音、快手背后的技術(shù),談AI內(nèi)容產(chǎn)品的啟發(fā)

9 評論 7236 瀏覽 12 收藏 13 分鐘

#本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵(lì)計(jì)劃》出品。

不知不覺中,AI技術(shù)已經(jīng)滲透了我們的生活,比如短視頻平臺就有AI/AR道具,創(chuàng)作者可以利用這一類道具來創(chuàng)造更有趣的內(nèi)容。具體而言,有哪些AI技術(shù)可以應(yīng)用在內(nèi)容類型產(chǎn)品中、增加創(chuàng)作的多樣性?不妨來看看作者的總結(jié)。

最近因?yàn)楣ぷ髟蚪佑|到了快手的AI技術(shù)(主要是CV方向的),也跟快手的技術(shù)團(tuán)隊(duì)做了一些訪談。不由得感嘆其實(shí)快手的技術(shù)還是非常領(lǐng)先的,甚至很多場景做得比抖音還要早,技術(shù)單拎出來比字節(jié)的技術(shù)更加能打、更加領(lǐng)先。

但是為什么AI技術(shù)如此出眾的快手卻在大眾市場上或者是我們談的商業(yè)市場上不如抖音呢?互聯(lián)網(wǎng)的競爭如此激烈,原則上在占用用戶時(shí)間的維度上大家都是競品,人們知道字節(jié)的輕顏、剪映、醒圖,但是很少人知道快手也有對標(biāo)的一甜、快影和原片。

從抖音、快手背后的技術(shù)談AI內(nèi)容產(chǎn)品的啟發(fā)

圖1 快手頭條有一系列對標(biāo)的競品

首先需要澄清的一點(diǎn)是,AI技術(shù)并不是萬能的。很多商業(yè)上的成功,并不代表這家公司只是因?yàn)榧夹g(shù)很厲害、算法很牛逼,商業(yè)上就一定很成功,這個(gè)不是充分必要條件,技術(shù)很牛逼最多只是一個(gè)充分條件。

商業(yè)上的成功,或者是我們世俗定義的成功,更多還包括組織上的成功(人才的管理、激勵(lì),組織協(xié)同工作、效能最大化)、產(chǎn)品的成功、對于人性的洞察與應(yīng)用,對于商業(yè)模式的理解等等,這些全部要素才能最終使得一款產(chǎn)品真正地走向成功并且生命周期足夠長。

比如說微信就是一個(gè)很典型的例子,微信有AI技術(shù)么?當(dāng)然,但這些都是潤物細(xì)無聲的存在,微信并不會為了AI而AI,比如微信掃一掃入口識圖、識街景、識商品/長按翻譯/語音轉(zhuǎn)文字等,這些都是AI技術(shù)能力產(chǎn)品化,但是這些并不是微信這個(gè)產(chǎn)品的全部,或者說,這些技術(shù)只是幫助微信更好地向用戶提供一個(gè)交流溝通的工具,讓人們更加無障礙地交流互動。

問一個(gè)問題,對于抖音或者快手來講,大部分人是刷視頻還是調(diào)用攝像頭主動拍攝視頻呢?

相信大家的答案應(yīng)該是一致的,大部分人用抖音快手還是用來瀏覽,kill time。真正使用抖音里面的各種AI/AR道具UGC創(chuàng)作內(nèi)容的還是少數(shù),大部分用戶如果使用道具可能是嘗鮮,比如一些拍同款;對于專業(yè)的內(nèi)容創(chuàng)作者,主要是通過內(nèi)容本身的編排設(shè)定來吸引觀眾,也不太依賴于AI的模板或者是各種道具。即使需要使用AI的各種剪輯等特效技術(shù),可能也是在視頻創(chuàng)作過程中使用,即作一個(gè)AI賦能的視頻編輯工具,比如類似剪映。

但是問題又回到了起點(diǎn),為什么快手很多的gan(對抗生成網(wǎng)絡(luò))等AI生成技術(shù)比抖音好很多呢?頭條不是算法起家嘛?通過近一周多時(shí)間仔細(xì)分析兩家公司的背景,嘗試得出的原因總結(jié)如下:

1)基因使然

快手最早是從動圖gif剪輯工具起家,本身就是一家技術(shù)驅(qū)動型的公司,且創(chuàng)始人宿華和程一笑也都是技術(shù)出身,因此營造工程師的樂園,重點(diǎn)在CV等技術(shù)上加大投入,用技術(shù)來驅(qū)動產(chǎn)品,通過一些AI加持的爆款特效+專題運(yùn)營來激發(fā)用戶活躍度;這個(gè)是快手這家公司的底層邏輯。

2)老鐵需求

快手本身的平臺特質(zhì)跟抖音就有很大區(qū)別,抖音是符合馬太效應(yīng)的,即主要的80%流量都導(dǎo)向頭部的20%網(wǎng)紅,而網(wǎng)紅生產(chǎn)的內(nèi)容是通過抖音大數(shù)據(jù)平臺算法得出的。

快手則相反,致力于構(gòu)建一個(gè)公平的平臺機(jī)制,如果流量太高反而會被限流,更多的鼓勵(lì)是平民生產(chǎn)內(nèi)容,構(gòu)建同城或者是你身邊跟你很相似的人的故事。這些人可能就與你我一樣是個(gè)普通人,背后沒有MCN機(jī)構(gòu)、沒有巧妙構(gòu)思的腳本、專業(yè)的剪輯,因此這些“平民”需要AI加持、需要一些工具來低成本地創(chuàng)造內(nèi)容,記錄自己的生活。

從這個(gè)角度來講,快手更需要更加強(qiáng)大的內(nèi)容創(chuàng)作生成技術(shù)來幫助普通人實(shí)現(xiàn)明星夢,或者是拍同款。

雖然AI技術(shù)不是萬能的,短視頻的核心還是內(nèi)容為王、圍繞內(nèi)容構(gòu)建各式各樣的玩法;但是通過AI技術(shù)加持,幫助大家高效地生產(chǎn)內(nèi)容、創(chuàng)造有趣的、好玩的內(nèi)容,所以接下來想談?wù)?,具體有哪些AI技術(shù)是可以應(yīng)用在內(nèi)容類型產(chǎn)品中的。

一、物體/動作檢測技術(shù)

這一類應(yīng)該是最早應(yīng)用在短視頻內(nèi)容創(chuàng)作上的,包括很多自拍相機(jī)也有類似的功能。比如眨眼睛、吐舌頭、比各種手勢來觸發(fā)一些特效,這些是基于人臉的。同理,基于一些生活中的圖標(biāo)、物體檢測來觸發(fā)一些特效。

從抖音、快手背后的技術(shù)談AI內(nèi)容產(chǎn)品的啟發(fā)

圖2 比心特效

二、美顏、美妝、美體、美牙等人像美化功能

這些其實(shí)都是基于關(guān)鍵點(diǎn)技術(shù),無論是人臉的關(guān)鍵點(diǎn)檢測還是人體的關(guān)鍵點(diǎn)檢測技術(shù),不論是5點(diǎn)、21點(diǎn)還是137、200+、1000+的點(diǎn),又從2D的關(guān)鍵點(diǎn)到3D的關(guān)鍵點(diǎn),這里都是為了幫助機(jī)器確認(rèn)人臉的五官位置以及面部輪廓來進(jìn)行的比例調(diào)整,比如大眼、瘦臉、瘦腰、拉腿等等。

這些比較基礎(chǔ),對于關(guān)鍵數(shù)量依賴比較少。如果想要做得更加精細(xì),比如美妝里面需要進(jìn)行眼妝(睫毛、眼影、眼線、眼瞼下至、臥蠶)等等小部位的刻畫,這就需要關(guān)鍵點(diǎn)數(shù)量的增加,甚至如果想要做豐額頭、高鼻梁、低顴骨、豐蘋果肌等效果,就需要一些3D mesh(從原來的點(diǎn)形成網(wǎng)狀結(jié)構(gòu))的輔助。

從抖音、快手背后的技術(shù)談AI內(nèi)容產(chǎn)品的啟發(fā)

圖3 2D人臉關(guān)鍵點(diǎn)和3D關(guān)鍵點(diǎn),人像美化的最基礎(chǔ)技術(shù)

從抖音、快手背后的技術(shù)談AI內(nèi)容產(chǎn)品的啟發(fā)

圖4 人體關(guān)鍵點(diǎn)技術(shù)

又或者是如果在美體這個(gè)用戶體驗(yàn)做到既可以拉腿、細(xì)腰、豐胸,同時(shí)又不讓背景畸變,就需要引入matting和inpAInting的技術(shù)了(既摳圖和補(bǔ)全),有些場景下也可以使用3D人體重建的技術(shù)。比如說剪映軟件里的換背景功能也依賴于摳圖能力。

牙齒美白、口紅依賴于分割技術(shù),比如我最近在使用剪映牙齒美白功能的時(shí)候,嘴巴前面有一個(gè)遮擋物時(shí),就會在遮擋物上就浮現(xiàn)了一個(gè)白色的月牙狀不明物體,這是因?yàn)檠例X沒有像嘴巴一樣做遮擋狀態(tài)的判斷,呈現(xiàn)了一種俗稱“穿幫”的畫面,非常尷尬。

三、AR類(人和環(huán)境)

所謂AR類的,我們統(tǒng)一都定義為在已有的現(xiàn)實(shí)空間中疊加3D渲染的CG素材,不論是疊加在人臉上的、還是疊加在環(huán)境中的。

這些底層技術(shù)一部分依賴于3D的人臉關(guān)鍵點(diǎn)的定位技術(shù),另一部分依賴于對于空間的3D定位技術(shù),如何在不同的用戶手機(jī)姿態(tài)運(yùn)動下、用戶本身做各種動作的情況下,能保證疊加3D素材的絕對位置的固定(因?yàn)楝F(xiàn)實(shí)生活中的物體都是絕對靜止的、不會隨著手機(jī)的運(yùn)動而動來動去),這個(gè)是對于技術(shù)考驗(yàn)最大的部分。

當(dāng)然3D素材的精致程度,很大程度也依賴于CG的生成效果。

從抖音、快手背后的技術(shù)談AI內(nèi)容產(chǎn)品的啟發(fā)

圖5 google基于Android像開發(fā)者提供的ARcore能力,對標(biāo)的蘋果有ARkit

同時(shí),這類型的技術(shù)還非常適合跟廣告主結(jié)合,廣告主通過某個(gè)主題的風(fēng)格或者元素,平臺推出、大V優(yōu)先使用引發(fā)網(wǎng)友參與最后形成二次傳播,使得品牌的產(chǎn)品及形象在網(wǎng)友中引發(fā)廣大的討論。

比如在ins上,Gucci、LV、Dior就訂制了很多富含自己品牌元素的AR貼紙?zhí)籽b供用戶使用,用戶在拍照錄視頻玩的同時(shí),也可以體驗(yàn)產(chǎn)品虛擬試穿、試戴的效果,進(jìn)一步促進(jìn)購買轉(zhuǎn)化。

從抖音、快手背后的技術(shù)談AI內(nèi)容產(chǎn)品的啟發(fā)

圖6 ins上的gucci lens(特效)

四、生成類網(wǎng)絡(luò)(GAN)

隨著螞蟻呀嘿的一夜爆火,zao等AI換臉引發(fā)社會廣泛倫理道德的討論,社會對于GAN生成類的特效一直有很高的熱度,比如說“變?nèi)龤q”、當(dāng)你老了、迪士尼風(fēng)、國漫風(fēng)、手繪小姐姐等等。

由于GAN本身網(wǎng)絡(luò)的特性就十分適合短視頻這類、以內(nèi)容生產(chǎn)作為主要驅(qū)動力的產(chǎn)品定位,通過使網(wǎng)絡(luò)學(xué)習(xí)大量的目標(biāo)圖片的風(fēng)格,AI技術(shù)結(jié)合一些短視頻類的模板就可以非常快速地幫助用戶生成非常搞笑的、可愛的、炫酷的短視頻內(nèi)容,也非常適合結(jié)合短視頻平臺的各種節(jié)日運(yùn)營活動展開,比如萬圣節(jié)生成鬼怪妝容、兒童節(jié)生成兒童臉,520/情人節(jié)“變男友”等等。

從抖音、快手背后的技術(shù)談AI內(nèi)容產(chǎn)品的啟發(fā)

圖7 快手平臺520活動變男友,應(yīng)用的就是GAN網(wǎng)絡(luò)生成有夫妻相的男友

雖然在任何時(shí)代,內(nèi)容為王此話不假,但是在所有UGC的平臺都已經(jīng)被AI深度滲透、成為不可或缺的一部分的時(shí)候,你的產(chǎn)品沒有反而無法留住用戶。此時(shí)的AI技術(shù)在Kano模型當(dāng)中已經(jīng)從一個(gè)魅力需求變成了一個(gè)基礎(chǔ)需求。

據(jù)內(nèi)部消息,小紅書已經(jīng)大規(guī)模高薪聘請CV算法工程師來幫助提升其平臺內(nèi)容的AI多樣性,你認(rèn)為這必要么?

 

作者:大仙河,7年AI產(chǎn)品相關(guān)經(jīng)驗(yàn);微信號 :大仙河知識學(xué)堂

本文由@大仙河 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

本文為人人都是產(chǎn)品經(jīng)理《原創(chuàng)激勵(lì)計(jì)劃》出品。

題圖來自?Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 小紅書這樣做是有必要的

    回復(fù)
  2. 小紅書的做法并無沒有道理的…

    回復(fù)
  3. 短視頻真的是離不開智能AI,尤其是各種美顏功能,畢竟抖音最火的還得是帥哥美女顏值高好看的

    來自北京 回復(fù)
    1. 哈哈 說的對~為什么博主只存在于網(wǎng)絡(luò)中

      回復(fù)
  4. 我感覺有AI技術(shù)的加持,會使視頻內(nèi)容更加新奇有趣。

    來自江蘇 回復(fù)
  5. 雖然短視頻的核心還是內(nèi)容為王、圍繞內(nèi)容構(gòu)建各式各樣的玩法;但是通過AI技術(shù)加持,能夠創(chuàng)造更加有趣的、好玩的內(nèi)容

    來自湖北 回復(fù)
    1. 但是這類內(nèi)容會不會只是曇花一現(xiàn) 沒有什么生命力 沒辦法歷久彌新

      來自廣東 回復(fù)
  6. 據(jù)內(nèi)部消息,小紅書已經(jīng)大規(guī)模高薪聘請CV算法工程師來幫助提升其平臺內(nèi)容的AI多樣性,你認(rèn)為這必要么?

    有必要。

    來自河南 回復(fù)
    1. 怎么講~

      來自廣東 回復(fù)