AI產(chǎn)品分析 (二):深扒美圖秀秀中擄獲萬千少女芳心的“AI秘籍”
這是AI產(chǎn)品分析的第二期,沿著同樣的思路,本期一起深扒美圖秀秀擄獲萬千少女芳心的“AI秘籍”~
上一期我們一起體驗(yàn)了抖音里的各項(xiàng)黑科技,見證了抖音以短視頻為載體,基于人臉關(guān)鍵點(diǎn)檢測(cè)、圖像語義分割、風(fēng)格遷移、表情識(shí)別、圖像分類等計(jì)算機(jī)視覺技術(shù)為用戶提供了專業(yè)、新奇、搞怪的體驗(yàn)。
在AI產(chǎn)品專題的第二期,我們對(duì)美圖秀秀AI版塊進(jìn)行體驗(yàn)及分析,由于該版塊分為“動(dòng)漫化身”、“繪畫機(jī)器人”、“跨次元相機(jī)”、“少女照相機(jī)”、“夢(mèng)幻娃娃機(jī)”等5個(gè)入口,但后四項(xiàng)底層的邏輯設(shè)計(jì)基本相同,因此本文將后四項(xiàng)當(dāng)成一個(gè)整體展開,話不多說,開始我們的旅程吧~
一、動(dòng)漫化身
1. 用戶-場(chǎng)景-需求分析
“動(dòng)漫化身”是美圖秀秀幾個(gè)月前才上線的新功能,該功能一方面是為了應(yīng)對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),另一方面是基于平臺(tái)發(fā)展及用戶需求,為更好地理解該功能點(diǎn),首先對(duì)其進(jìn)行簡(jiǎn)單用戶-場(chǎng)景-需求分析如下。
2. 功能目的
大家都知道,美圖是一個(gè)工具型圖像美化產(chǎn)品,其初衷在于打造一款最為簡(jiǎn)單的修圖產(chǎn)品,過去也有人將其笑稱為“傻瓜式Photoshop”。而結(jié)合美圖產(chǎn)品更新的動(dòng)態(tài),迎著人工智能的東風(fēng),美圖對(duì)用戶提供的產(chǎn)品服務(wù)也開始呈現(xiàn)多元化及娛樂化。
基于上述的用戶-場(chǎng)景-需求分析,可見對(duì)用戶而言,該功能可滿足他們對(duì)于動(dòng)漫、對(duì)美及對(duì)新鮮事物的興趣、好奇心及虛榮心。
而對(duì)平臺(tái)而言,該功能的上線不僅為平臺(tái)增加了一項(xiàng)服務(wù),同時(shí)也使得產(chǎn)品定位不再局限于機(jī)械化的工具,變得更加豐滿且有趣。而從商業(yè)角度,該功能的上線也使得美圖的流量進(jìn)一步增強(qiáng),則平臺(tái)的廣告機(jī)會(huì)及變現(xiàn)能力也進(jìn)一步強(qiáng)化。
3. 功能邏輯
基于上述“動(dòng)漫化身”的邏輯流程,在進(jìn)行相片(人臉)采集之后,系統(tǒng)通過檢測(cè)人臉特征點(diǎn)后構(gòu)建二元空間映射,并進(jìn)行視覺配準(zhǔn),最終經(jīng)渲染后生成用戶的動(dòng)漫形象。而更具特色的體驗(yàn)在于,生成動(dòng)漫形象之后,用戶還可以選擇生成照片、視頻或表情包的形式。
且在制作視頻/表情包的過程中,畫面中的卡通形象可隨著用戶的表情變化而動(dòng)態(tài)變化,進(jìn)行細(xì)節(jié)調(diào)整后生成的圖像更細(xì)致。同時(shí)在動(dòng)態(tài)的過程中,使得用戶身臨其境般地享受到變身的過程,對(duì)用戶的吸引力更足。
視頻模式下,還可以進(jìn)行音樂搭配,產(chǎn)品元素很豐富。此外,用戶還可以根據(jù)不同的心情和喜好進(jìn)行卡通人物形象的風(fēng)格及裝扮,進(jìn)一步滿足了不同性別、不同風(fēng)格用戶的個(gè)性化需求。
如上圖是“動(dòng)漫化身”生成的效果圖,左側(cè)的趙麗穎的相片,通過算法處理后,風(fēng)格完全改變,但在生成的圖片中,對(duì)于五官及服飾一定程度上仍保留了原有的基本特征。
如上圖,是表情包模式下生成的圖片效果,可以添加文字,也可以隨意根據(jù)喜好變更表情,制作的效果栩栩如生,尤其是進(jìn)行表情及面部細(xì)節(jié)微調(diào)時(shí),那種互動(dòng)的感覺可能是更讓用戶著迷的。
4. 功能上線及迭代
“動(dòng)漫化身”功能從2018年12月18日左右在美圖秀秀8.3.5.0版本中上線,提出使用AI畫手為你繪制專屬動(dòng)漫圣誕頭像的超萌動(dòng)畫模式,享受捏臉換裝小樂趣,該功能上線后受到許多用戶的喜愛,至今已有154830805人體驗(yàn)。此后的版本迭代中,平臺(tái)也顯示出了極大的重視度,基本每次更新都有針對(duì)該功能的說明。
5. 技術(shù)分析
綜合上述分析可得,“動(dòng)漫化身”功能以簡(jiǎn)單的流程,滿足了平臺(tái)服務(wù)的年輕群體追求卡通動(dòng)漫的萌趣效果,整體體驗(yàn)流暢,渲染生成的速度較快且效果生動(dòng)形象。
但體驗(yàn)中發(fā)現(xiàn),算法仍存在偶發(fā)性的視覺檢測(cè)失靈,且可選的裝扮選項(xiàng)比較單一,少數(shù)的裝扮加載延時(shí)較長,這與后臺(tái)算法的效率及穩(wěn)定性有關(guān)。
- “動(dòng)漫化身”使用的技術(shù)十分豐富,首先是人臉檢測(cè),用于檢測(cè)及定位用戶人臉,這一步是整個(gè)功能實(shí)現(xiàn)的核心基礎(chǔ)。
- 其次是人臉關(guān)鍵點(diǎn)檢測(cè),后續(xù)的視頻、表情包動(dòng)態(tài)調(diào)整及生成,都是基于人臉關(guān)鍵點(diǎn)的定位后進(jìn)行的變換操作。
- 再者還有人臉分割,通過人體、皮膚、頭發(fā)、五官的等區(qū)域的精確分割,獲得不同部位的具體位置,之后在進(jìn)行風(fēng)格調(diào)整時(shí),才能進(jìn)行具體替換。
- 最后從整體的效果來看,通過建模生成的卡通人物的立體感及真實(shí)感體驗(yàn)都比較棒,這是AR現(xiàn)實(shí)增強(qiáng)處理的效果。
技術(shù)關(guān)鍵詞:人臉檢測(cè)、關(guān)鍵點(diǎn)定位、人臉分割、AR增強(qiáng)
二、繪畫大師Andy
1.?用戶-場(chǎng)景-需求
繪畫機(jī)器人Andy可以算是美圖秀秀比較獨(dú)特的一個(gè)功能點(diǎn),Andy和“動(dòng)漫化身”功能存在一定的關(guān)聯(lián),但又不完全相同,二者在底層用戶的需求及具體地實(shí)現(xiàn)中還是存在一些區(qū)別,該項(xiàng)功能點(diǎn)的用戶-場(chǎng)景-需求分析如下。
從中可見,繪畫機(jī)器人Andy聚焦于滿足用戶以一種更省時(shí)省力的方式獲得自畫像的需求,而“漫畫化身”,則更注重滿足用戶“化身”漫畫形象并進(jìn)行動(dòng)態(tài)互動(dòng)的需求。概括地說,前者專注于結(jié)果,而后者過程的體驗(yàn)更具特色。
2. 功能目的
基于上述用戶-場(chǎng)景-需求的分析,我們可以從中對(duì)Andy提出的目的進(jìn)行簡(jiǎn)單分析。從用戶的角度,該功能對(duì)于那些比較宅的、愛美的以及勤儉節(jié)約的用戶而言,可以滿足他們足不出戶、不花一分錢,就可以打造出獨(dú)屬于自己風(fēng)格的插畫及各種形象,享受全方位的“繪畫服務(wù)”。而且畫不好重來幾乎沒有任何成本,直觀地可理解為美圖爸爸直接為用戶提供了一個(gè)私人“畫師”。
而從平臺(tái)的角度,同樣離不開的邏輯是,怎么才能在保持核心功能清晰明了的情況下,將同一項(xiàng)技術(shù)無限擴(kuò)展,打造出更多樣化的服務(wù),滿足不同用戶群體的個(gè)性化需求,而美圖一直都在踐行這樣的邏輯。
2. 功能邏輯
可見繪畫機(jī)器人Andy在照片采集部分的流程和之前“動(dòng)漫化身”的流程邏輯基本一致,但不同之處在于,圖像生成之后,繪畫機(jī)器人Andy和用戶之間就沒有屏幕上的實(shí)時(shí)互動(dòng)進(jìn)行細(xì)節(jié)調(diào)整了,只需靜靜等待,即可生成自畫像。
同時(shí)和“動(dòng)漫化身”一樣,也可以選擇不同的風(fēng)格生成,而且親身驗(yàn)證,不同風(fēng)格選項(xiàng)生成的效果區(qū)分度還挺大的,以下是體驗(yàn)效果展示。
從該結(jié)果中看出,Andy 根據(jù)左側(cè)相片畫出的圖像比較精美,細(xì)節(jié)的刻畫也比較到位,且相較“動(dòng)漫化身”而言,繪畫機(jī)器人的效果更為貼近原圖,藝術(shù)創(chuàng)作的成分較少,如頭發(fā)、配飾等,刻畫中和原圖保持了一致,可見后臺(tái)算法設(shè)計(jì)的嚴(yán)謹(jǐn)度。
3. 功能細(xì)分對(duì)比
值得指出的是,美圖AI版塊雖然在設(shè)計(jì)中設(shè)置了“動(dòng)漫化身”、“繪畫機(jī)器人”、“跨次元相機(jī)”、“少女照相館”、“夢(mèng)幻娃娃機(jī)”等入口,但實(shí)際上,后四項(xiàng)動(dòng)能在整體的功能邏輯上是基本相同的。
因此,“跨次元相機(jī)”、“少女照相館”、“夢(mèng)幻娃娃機(jī)”可視作和繪畫機(jī)器人同一功能下的不同效果,但它們發(fā)布的時(shí)間更早。
換個(gè)角度來看,可以理解成,它們是美圖在推出Andy之前美圖秀秀利用計(jì)算機(jī)視覺技術(shù)做出的一些嘗試,也正是因?yàn)檫@些積累,使得平臺(tái)的數(shù)據(jù)及算法都獲得了較大的改進(jìn)和提升,才促成了Andy的出現(xiàn)。
為了進(jìn)一步理解Andy和其剩余幾項(xiàng)本質(zhì)的不同,我們結(jié)合各自上線時(shí)間、體驗(yàn)人數(shù)進(jìn)一步做出說明。
如圖,其中“跨次元相機(jī)”最早上線于2017年1月10日,已有860240131人進(jìn)行了體驗(yàn),而隨后在2017年5月28日和2017年9月26日,美圖又進(jìn)一步上線了“少女照相館”和“夢(mèng)幻娃娃機(jī)”。但是這兩項(xiàng)的體驗(yàn)人數(shù)相對(duì)就低很多,而2017年11月30日上線的繪畫機(jī)器人,獲得的效果就比較突出,直接達(dá)到了749224112,按照當(dāng)前的走勢(shì),極有可能趕超“跨次元相機(jī)”。
究其原因,從體驗(yàn)中分析認(rèn)為,“跨次元”包含的風(fēng)格選項(xiàng)較多,同時(shí)該功能上線時(shí)間較早,并且在上線之初還利用了明星效應(yīng)(anglababy)以及一些節(jié)日主題(元旦、春節(jié)等)進(jìn)行運(yùn)營,所以體驗(yàn)人數(shù)較多。
而繪畫機(jī)器人取得的效果明顯更為優(yōu)異的原因在于,平臺(tái)在數(shù)據(jù)和技術(shù)上的積累更為成熟,使得圖像處理的算法更為準(zhǔn)確和良好。我們可以明顯地看到,由Andy生成圖像的質(zhì)量及細(xì)節(jié)處理都更加優(yōu)秀。
如圖,是這四種不同功能效果的對(duì)比。
對(duì)應(yīng)原圖,從左到右依次為“繪畫機(jī)器人”、“跨次元相機(jī)”、“少女照相機(jī)”、“夢(mèng)幻娃娃機(jī)”,各個(gè)圖像最終的成像特點(diǎn)和本身的命名對(duì)應(yīng)較為明顯,尤其是反復(fù)來回體驗(yàn)后它們的區(qū)別和特色就會(huì)更為清晰。也可以通過這四項(xiàng)功能,更為清楚地認(rèn)知到,美圖秀秀在產(chǎn)品功能的進(jìn)步,與其自身技術(shù)的發(fā)展一直緊密結(jié)合。
不可否認(rèn),基于機(jī)器學(xué)習(xí)原理,Andy接受的訓(xùn)練數(shù)據(jù)越來越多,“繪畫經(jīng)驗(yàn)”越來越豐富,它已經(jīng)從一個(gè)機(jī)械死板的繪畫小白,變得越來越成熟,而美圖爸爸給它的終極定位是向它的兄弟微軟小冰看齊,稱霸AI繪畫界。
在體驗(yàn)的過程中,相對(duì)動(dòng)漫化身功能而言,Andy繪畫功能的靈活性互動(dòng)性差一些。但整體觀感上,Andy的成像更具風(fēng)格及藝術(shù)性,所以可能更得女性用戶青睞。但體驗(yàn)中有一個(gè)微小的不足在于,點(diǎn)擊對(duì)比按鈕的時(shí)候,原圖像和繪畫生成的圖像呈覆蓋關(guān)系,而不是放到一個(gè)屏幕中進(jìn)行對(duì)比,這可能也是受限于手機(jī)屏幕太小的原因。
4. 技術(shù)分析
該項(xiàng)功能涉及的技術(shù)除了人臉檢測(cè)外,還包括圖像生成技術(shù)?;谌四槞z測(cè)及分析,算法初步捕獲了人臉特征,而后將這些特征輸入訓(xùn)練好的圖像生成網(wǎng)絡(luò)DrawNet處理后生成用戶的照片畫像,其中DrawNet網(wǎng)絡(luò)由美圖自主研發(fā)并完成搭建及訓(xùn)練,最終部署于平臺(tái)。
同時(shí),從生成的效果圖中也可以看出,Andy在繪畫的過程對(duì)于人物照片的膚色、發(fā)型、服飾等信息的捕獲也比較準(zhǔn)確,這是因?yàn)樗麄兪褂昧藢iT用于頭發(fā)檢測(cè)及膚色檢測(cè)的算法。
美圖爸爸期待Andy隨著更多用戶的參與,獲得更多訓(xùn)練學(xué)習(xí)的樣本后,繪畫技藝可以得到一定的成長和改變,不至于很快就被用戶厭棄,希望這個(gè)希望不僅僅是希望吧!
技術(shù)關(guān)鍵詞:人臉檢測(cè) 頭發(fā)檢測(cè) 膚色檢測(cè) 圖像生成等
總結(jié)
通過本期對(duì)美圖秀秀AI版塊的進(jìn)一步分析,同時(shí)結(jié)合上一期對(duì)抖音的體驗(yàn),我們可以更深入地意識(shí)到,目前類似于人臉檢測(cè)、關(guān)鍵點(diǎn)識(shí)別、人體分割及圖像生成等技術(shù)在產(chǎn)品中的應(yīng)用非常廣泛,也有很多新奇的玩法,不過依然還有很多的成長空間可以探索。
作者:Luna,公眾號(hào):有三AI,一個(gè)專注于人工智能技術(shù)與產(chǎn)品落地的公眾號(hào),希望可以和熱愛AI的人有更深入交流,一起見證AI改變生活!
本文由 @ Luna 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自網(wǎng)絡(luò)
需求是省錢 ,我怎么理解不了。能解釋下嗎思路嗎?