智能剪輯功能調(diào)研報(bào)告:詳解抖音的音樂(lè)卡點(diǎn)模式

1 評(píng)論 11604 瀏覽 57 收藏 14 分鐘

本文通過(guò)對(duì)市面上智能剪輯功能進(jìn)行體驗(yàn),挖掘不同產(chǎn)品的功能模式,還原產(chǎn)品的邏輯和結(jié)構(gòu),并通過(guò)競(jìng)品對(duì)比分析,總結(jié)了智能剪輯功能的迭代方向。

01 調(diào)研背景

1. 什么是智能剪輯?

傳統(tǒng)的視頻剪輯,需要人工進(jìn)行大量后期處理工作,包括手動(dòng)剪輯、拼接、選擇音樂(lè)、增加轉(zhuǎn)場(chǎng)、調(diào)色、字幕等,門檻較高,且耗時(shí)費(fèi)力。

而智能剪輯則使得整個(gè)剪輯過(guò)程更加智能化、標(biāo)準(zhǔn)化、簡(jiǎn)單化,可顯著降低創(chuàng)作門檻,提升普通創(chuàng)作者的創(chuàng)作意愿和創(chuàng)作能力。

市面上主流短視頻產(chǎn)品已經(jīng)普遍開發(fā)了智能剪輯功能,其中核心優(yōu)化了以下三個(gè)關(guān)鍵環(huán)節(jié):

(1)判斷素材的類型,智能組合剪輯;

(2)智能匹配音樂(lè),結(jié)合智能剪輯,可生成音樂(lè)卡點(diǎn)視頻;

(3)智能增加動(dòng)效,包括轉(zhuǎn)場(chǎng)、特效、濾鏡等豐富效果。

2. 為什么要做智能剪輯?

先上結(jié)論:智能剪輯功能可以有效降低普通用戶的生產(chǎn)門檻,幫助用戶進(jìn)行低成本地剪輯。

首先,說(shuō)一下為什么主流的短視頻產(chǎn)品中有智能剪輯功能,而制作長(zhǎng)視頻的專業(yè)剪輯軟件基本沒(méi)有這個(gè)功能。

一是因?yàn)橛脩舻恼蜻x擇,使用專業(yè)剪輯軟件的用戶整體上有一定的制作能力,而日常使用短視頻APP用戶的制作能力普遍偏低,更適合使用輕量的智能剪輯功能。

二是載體本身的原因,長(zhǎng)視頻更多是敘事結(jié)構(gòu),適合講故事,前后邏輯關(guān)系緊密,需要結(jié)合人的思考和創(chuàng)意,而機(jī)器智能暫時(shí)無(wú)法通過(guò)聲音、文字、圖像等素材理解其邏輯。

但是短視頻則要自由得多,偏個(gè)人向主題的也較多,比如自拍、旅游、美食等等,不需要復(fù)雜的剪輯。

其次,再看一下智能剪輯功能對(duì)短視頻產(chǎn)品本身的收益。

對(duì)短視頻產(chǎn)品來(lái)說(shuō),絕大部分用戶是消費(fèi)者,只有少部分用戶是生產(chǎn)者,消費(fèi)者們會(huì)去消費(fèi)生產(chǎn)者們創(chuàng)作的內(nèi)容,消費(fèi)者們雖然有一定的創(chuàng)作意愿,但創(chuàng)作能力較弱,消費(fèi)者轉(zhuǎn)變?yōu)樯a(chǎn)者的成本也較高。

即便是UGC生態(tài)的短視頻產(chǎn)品,也會(huì)逐漸從UGC發(fā)展為PGC,中間態(tài)就是所謂的UPGC。

在這個(gè)過(guò)程中,大量普通用戶生產(chǎn)的低質(zhì)量、低價(jià)值內(nèi)容會(huì)被篩選掉,而專業(yè)用戶生產(chǎn)的高質(zhì)量、高價(jià)值內(nèi)容會(huì)獲得更多曝光,到最后,我們?cè)诙桃曨l產(chǎn)品中看到的就基本是專業(yè)用戶生產(chǎn)的內(nèi)容了。

那為什么還要做針對(duì)普通消費(fèi)者或者說(shuō)尾部生產(chǎn)者的智能剪輯呢?

因?yàn)槠胀ㄓ脩粢琅f存在生產(chǎn)需求,有一定的生產(chǎn)意愿,會(huì)拍攝旅游、美食或者記錄重要的生活事件等等,而制作視頻后常常會(huì)發(fā)布在朋友圈、微博、抖音、快手等社交網(wǎng)絡(luò)中,或者直接分享給自己的家人朋友。

也就是說(shuō)生產(chǎn)視頻需求的背后,本質(zhì)是社交需求。

這和消費(fèi)視頻完全是兩個(gè)邏輯,幫助頭部創(chuàng)作者進(jìn)行生產(chǎn),是為了普通消費(fèi)者有內(nèi)容可看,但激勵(lì)并幫助普通用戶生產(chǎn)內(nèi)容,則是促進(jìn)用戶使用產(chǎn)品的一個(gè)重要手段,同時(shí)可以豐富UGC生態(tài),最終涌現(xiàn)出專業(yè)生產(chǎn)者。

總結(jié)一下:

(1)目標(biāo)用戶:尾部生產(chǎn)者,典型特征是低粉、無(wú)固定創(chuàng)作主題、作品偏個(gè)人向。

(2)使用場(chǎng)景:拍攝旅游、美食或者記錄重要的生活事件后,想要做一個(gè)短視頻分享到自己的社交網(wǎng)絡(luò),但是專業(yè)的視頻剪輯軟件太復(fù)雜,不太會(huì)用,也沒(méi)有時(shí)間去琢磨。

(3)滿足需求:表面滿足了小白化制作短視頻的需求,本質(zhì)是滿足了社交需求、炫耀心理。

02 調(diào)研目標(biāo)

了解市面競(jìng)品智能剪輯功能的優(yōu)劣,并結(jié)合實(shí)際的業(yè)務(wù)場(chǎng)景與技術(shù)能力,輸出可落地的產(chǎn)品方案。

03 調(diào)研詳情

1. 競(jìng)品速覽

頭部競(jìng)品:抖音、快手

腰部競(jìng)品:微視、VUE、美拍、小影

跨域競(jìng)品:大疆、Quik

根據(jù)上表的概覽,會(huì)發(fā)現(xiàn)【智能剪輯】功能的核心要素有三個(gè):剪裁、音樂(lè)和視覺。

首先,算法會(huì)對(duì)素材內(nèi)容進(jìn)行分析,識(shí)別素材的場(chǎng)景,然后匹配對(duì)應(yīng)的音樂(lè)和動(dòng)效。

每個(gè)音樂(lè)都會(huì)有相應(yīng)的節(jié)拍點(diǎn),根據(jù)節(jié)拍點(diǎn),會(huì)對(duì)每段素材剪裁為一定的播放長(zhǎng)度,然后拼接在一起。

這里會(huì)出現(xiàn)另一個(gè)問(wèn)題,就是怎么找到每段素材中的高質(zhì)量精彩片段?

因此也需要借助算法,識(shí)別和篩選素材中的精彩片段進(jìn)行合理剪裁。

而視覺效果包括轉(zhuǎn)場(chǎng)特效、畫面裝飾、濾鏡、貼紙等,也需要識(shí)別素材的對(duì)應(yīng)場(chǎng)景進(jìn)行匹配。

通過(guò)上述的分析會(huì)發(fā)現(xiàn),根據(jù)剪裁、音樂(lè)、動(dòng)效三者之間的關(guān)系,市面上主流的【智能剪裁】功能的模式有三種:

(1)【音樂(lè)可選+無(wú)動(dòng)效】:音樂(lè)根據(jù)素材進(jìn)行匹配和推薦,可手動(dòng)切換,素材會(huì)根據(jù)音樂(lè)再次剪裁,無(wú)轉(zhuǎn)場(chǎng)、頁(yè)面裝飾等視覺效果,典型代表是抖音;

(2)【音樂(lè)固定+動(dòng)效固定】:音樂(lè)和動(dòng)效綁定,兩者都是固定的,不能組合,也就是集成為“模板”,每個(gè)模板的剪裁也是固定的,此時(shí)需要用戶自己手動(dòng)選擇模板,典型代表是微視;

(3)【音樂(lè)可選+動(dòng)效可選】:音樂(lè)根據(jù)素材進(jìn)行匹配和推薦,可手動(dòng)切換,素材會(huì)根據(jù)音樂(lè)再次剪裁,同時(shí)轉(zhuǎn)場(chǎng)、頁(yè)面裝飾等視覺效果集成為統(tǒng)一風(fēng)格的“主題”,可進(jìn)行切換,典型代表是快手和VUE。

2. 核心競(jìng)品詳述

根據(jù)以上分析,音樂(lè)智能匹配和視頻精彩片段智能選取,這兩個(gè)關(guān)鍵環(huán)節(jié)主要依靠算法解決,對(duì)于用戶而言相當(dāng)于黑盒。

而另一個(gè)關(guān)鍵點(diǎn),怎么依靠音樂(lè)節(jié)拍點(diǎn)劃分素材的長(zhǎng)度,則有規(guī)律可循,因此,下文將針對(duì)抖音的音樂(lè)卡點(diǎn)模式進(jìn)行簡(jiǎn)單實(shí)驗(yàn),推測(cè)其智能剪裁規(guī)則。

整體分為三個(gè)環(huán)節(jié):導(dǎo)入素材、制作流程、發(fā)布。

導(dǎo)入素材:可同時(shí)導(dǎo)入圖片和視頻,素材總數(shù)的上限是35。

制作流程:默認(rèn)音樂(lè)卡點(diǎn)模式,會(huì)根據(jù)匹配的音樂(lè),對(duì)素材進(jìn)行裁剪,也可以手動(dòng)調(diào)整素材片段的順序,但是因?yàn)槊總€(gè)音樂(lè)的卡點(diǎn)位置是固定的,因此每個(gè)素材片段剪裁的長(zhǎng)度也是固定的,只能調(diào)整每段素材剪裁的位置。

舉個(gè)例子,我上傳了4段視頻,基于匹配的音樂(lè)自動(dòng)剪裁后,4段素材分別的長(zhǎng)度為:5.6s、4.4s、4.4s、5.6s。

現(xiàn)在我將第4段素材(有人像)的位置從第4個(gè)位置移動(dòng)到第2個(gè)位置,然后第4段視頻(有人像)的長(zhǎng)度從5.6s轉(zhuǎn)變?yōu)?.4s,也就是說(shuō)根據(jù)素材的數(shù)量會(huì)計(jì)算音樂(lè)卡點(diǎn)的位置,分配相同數(shù)量的位置,每個(gè)位置的長(zhǎng)度是固定的。

接下來(lái),將通過(guò)簡(jiǎn)單實(shí)驗(yàn),歸納總結(jié)其裁剪規(guī)則。

在此次簡(jiǎn)單實(shí)驗(yàn)中,通過(guò)將素材總時(shí)長(zhǎng)逐漸增加,從3秒到890秒,我們可以看到以下規(guī)律:

(1)素材數(shù)量>=2時(shí),才能進(jìn)入【音樂(lè)卡點(diǎn)】模式;

(2)素材總時(shí)長(zhǎng)30秒左右是臨界點(diǎn)

  1. 總時(shí)長(zhǎng)在30秒以下的素材,裁剪后保留的比例為55%~60%;
  2. 總時(shí)長(zhǎng)在30秒以上、50秒以下的素材,裁剪后保留的時(shí)長(zhǎng)逐漸貼近20秒,保留的時(shí)長(zhǎng)不再有大幅的增加;
  3. 總時(shí)長(zhǎng)在50秒以下的素材,裁剪后保留的時(shí)長(zhǎng)穩(wěn)定在20秒左右,因此保留的比例會(huì)迅速下跌;

(3)抖音導(dǎo)入素材的限制是,每段素材必須大于1秒,且素材的總數(shù)量不能超過(guò)35個(gè);

  1. 通過(guò)實(shí)驗(yàn)可以看到,剪裁后的總時(shí)長(zhǎng)上限為20秒,在最多35段素材的情況下,平均每段素材剪裁后的長(zhǎng)度為0.57秒,因此可見”35“基本接近了維持視頻最終效果的極限,素材數(shù)量再增多,將會(huì)影響視頻效果;
  2. 隨著素材數(shù)量和素材時(shí)長(zhǎng)的增加,每段素材剪裁后的時(shí)長(zhǎng)將逐漸接近1秒,直至1秒以下,因此需要限制每段素材必須大于1秒。

04 結(jié)論與方案

本次報(bào)告通過(guò)對(duì)市面競(jìng)品的掃描,總結(jié)歸納了市面上主流【智能剪輯】功能的三種模式:

(1)【音樂(lè)可選+無(wú)動(dòng)效】:音樂(lè)根據(jù)素材進(jìn)行匹配和推薦,可手動(dòng)切換,素材會(huì)根據(jù)音樂(lè)再次剪裁,無(wú)轉(zhuǎn)場(chǎng)、頁(yè)面裝飾等視覺效果,典型代表是抖音;

(2)【音樂(lè)固定+動(dòng)效固定】:音樂(lè)和動(dòng)效綁定,兩者都是固定的,不能組合,也就是集成為“模板”,每個(gè)模板的剪裁也是固定的,此時(shí)需要用戶自己手動(dòng)選擇模板,典型代表是快手、微視;

(3)【音樂(lè)可選+動(dòng)效可選】:音樂(lè)根據(jù)素材進(jìn)行匹配和推薦,可手動(dòng)切換,素材會(huì)根據(jù)音樂(lè)再次剪裁,同時(shí)轉(zhuǎn)場(chǎng)、頁(yè)面裝飾等視覺效果集成為統(tǒng)一風(fēng)格的“主題”,可進(jìn)行切換,典型代表是VUE。

并針對(duì)抖音的音樂(lè)卡點(diǎn)模式進(jìn)行了拆解,通過(guò)實(shí)驗(yàn)推測(cè)其智能剪裁的規(guī)則:

(1)總時(shí)長(zhǎng)在30秒以下的素材,裁剪后保留的比例為55%~60%;

(2)總時(shí)長(zhǎng)在30秒以上的素材,裁剪后保留的時(shí)長(zhǎng)逐漸貼近20秒;

(3)導(dǎo)入的每段素材必須大于1秒,且導(dǎo)入的素材總數(shù)量不能超過(guò)35個(gè),這樣才能保證最終的視覺效果。

但是只了解其規(guī)則是不夠的,需要能夠輸出為可落地的方案才有價(jià)值。

接下來(lái),我將結(jié)合多個(gè)競(jìng)品的功能亮點(diǎn),并刪繁就簡(jiǎn),初步策劃足夠簡(jiǎn)單、足夠好用的【智能剪輯】功能。

  1. 建議采用【音樂(lè)可選+動(dòng)效可選】的模式,即根據(jù)上傳的素材進(jìn)行場(chǎng)景識(shí)別,智能匹配音樂(lè)和相關(guān)的視覺主題。
  2. 素材需根據(jù)所匹配的音樂(lè)進(jìn)行智能裁剪,用戶手動(dòng)更換音樂(lè),需再次裁剪。
  3. 視覺主題則采用通用樣式,包括通用性的頁(yè)面裝飾、濾鏡和轉(zhuǎn)場(chǎng)特效,用戶可手動(dòng)更換,對(duì)素材剪裁沒(méi)有影響。
  4. 用戶手動(dòng)剪裁素材或調(diào)整素材順序需要客戶端的渲染能力,成本較高,可考慮在后續(xù)迭代。

 

 

本文由 @岳小魚 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 更多產(chǎn)品思考,歡迎關(guān)注微信公眾號(hào),搜索:岳小魚

    來(lái)自浙江 回復(fù)