對(duì)于AI繪畫(huà)產(chǎn)品商業(yè)化落地的分析思考
隨著AI技術(shù)的不斷發(fā)展,繪畫(huà)這類擁有美感、情感的文藝作品也逐漸出現(xiàn)了AI的身影。從提升工作效率的角度,AI繪畫(huà)產(chǎn)品確實(shí)有它的作用。但要真正實(shí)現(xiàn)商業(yè)化,AI繪畫(huà)產(chǎn)品還有很長(zhǎng)一段路要走。
只需要一句“咒語(yǔ)“就能生成一張質(zhì)量比大多數(shù)人水平高的圖像內(nèi)容。這種技術(shù)上的變革對(duì)圖像內(nèi)容創(chuàng)作領(lǐng)域可以說(shuō)是顛覆式的改變。不僅可以幫助畫(huà)家創(chuàng)作出更加出色的作品,還能夠幫助普通人輕松地創(chuàng)作出高質(zhì)量的畫(huà)作。
繪畫(huà)對(duì)于我來(lái)說(shuō)一點(diǎn)也不陌生,高中學(xué)了3年美術(shù)和大學(xué)4年工業(yè)設(shè)計(jì),如果當(dāng)時(shí)有AI繪畫(huà),不知道什么感想,至少當(dāng)時(shí)還是很享受繪畫(huà)的過(guò)程,從結(jié)果上可能并沒(méi)有AI的效果好,也分享幾張高中時(shí)期我的作品,大學(xué)時(shí)期的一些汽車手繪稿一時(shí)沒(méi)找到。
那我現(xiàn)在的角色變成一名產(chǎn)品經(jīng)理,對(duì)AI繪畫(huà)產(chǎn)品很感興趣,有必要全面去解析下,我會(huì)從產(chǎn)品價(jià)值、使用場(chǎng)景、產(chǎn)品現(xiàn)狀、商業(yè)機(jī)會(huì)以及制約因素去分析:
- AI繪畫(huà)解決了什么問(wèn)題帶來(lái)什么價(jià)值?
- AI繪畫(huà)在藝術(shù)設(shè)計(jì)領(lǐng)域的應(yīng)用場(chǎng)景?
- AI繪畫(huà)目前產(chǎn)品形態(tài)和發(fā)展現(xiàn)狀?
- AI繪畫(huà)的商業(yè)機(jī)會(huì)有哪些和制約因素?
一、AI繪畫(huà)解決什么問(wèn)題帶來(lái)什么價(jià)值?
1. 圖像生成門檻降低,效率的提升,促使圖像生成“平民化”
AI繪畫(huà)的產(chǎn)物是圖像,圖像對(duì)人類具有豐富的價(jià)值,包括信息傳達(dá)、創(chuàng)意表達(dá)、歷史記錄、美感享受和交流溝通等方面,對(duì)于人類的認(rèn)知、情感和文化發(fā)展起著重要作用。
而繪畫(huà)工具從原始的紙筆調(diào)色盤到數(shù)字化時(shí)代的數(shù)位板、繪圖軟件再到AI時(shí)代,任何人用簡(jiǎn)單的幾行文字就能創(chuàng)作出高質(zhì)量的藝術(shù)作品,人類創(chuàng)作的門檻一再被降低,促使圖像生成“平民化”,圖像生成的生產(chǎn)力得到指數(shù)級(jí)的提升。
2. 圖像品質(zhì)的提升和激發(fā)創(chuàng)作靈感,讓生活充滿設(shè)計(jì)感
AI對(duì)大量的繪畫(huà)作品進(jìn)行學(xué)習(xí)、融合和再塑,且一直處于不斷進(jìn)化的階段,生成的圖像質(zhì)量比絕大數(shù)初級(jí)創(chuàng)作者水平要高,對(duì)低端生成市場(chǎng)會(huì)進(jìn)一步淘汰,迫使創(chuàng)作者不得不通過(guò)學(xué)習(xí)AI繪畫(huà)技術(shù),更好地運(yùn)用AI技術(shù)來(lái)創(chuàng)作更加出色的作品,使自己的作品更具創(chuàng)意和價(jià)值。另一方面對(duì)于內(nèi)容消費(fèi)來(lái)說(shuō),審美需求也在提升,追求豐富高品質(zhì)的視覺(jué)體驗(yàn)。
AI繪畫(huà)為我們未來(lái)的生活帶來(lái)了充滿設(shè)計(jì)感的視覺(jué)盛宴,美無(wú)處不在。
3. 個(gè)性化的定制能力的提高,做到千人千圖
用戶可以根據(jù)自己的需求和喜好,夠幫助人們快速生成各種風(fēng)格的圖像,定制出更符合個(gè)性化要求的圖像作品,未來(lái)能直接鏈接生產(chǎn)端進(jìn)行生產(chǎn)。
例如,在服裝設(shè)計(jì)行業(yè)中,AI繪畫(huà)技術(shù)可以用來(lái)快速生成各種樣式的服裝圖案,這些圖案可以基于不同的主題、風(fēng)格、顏色、材質(zhì)等因素進(jìn)行定制。
AI繪畫(huà)在藝術(shù)設(shè)計(jì)領(lǐng)域的應(yīng)用場(chǎng)景?
可以通過(guò)的雙鉆設(shè)計(jì)模型來(lái)分析AI繪畫(huà)對(duì)不同階段的作用,雙鉆模型適合所有的設(shè)計(jì)領(lǐng)域,形成了標(biāo)準(zhǔn)流程,只要設(shè)計(jì)過(guò)程中有圖像的地方都可以使用AI輔助設(shè)計(jì)。
- 第一階段——發(fā)現(xiàn)期。此階段可以通過(guò)ChatGPT去做些資料收集、競(jìng)品分析,提煉需求的關(guān)鍵詞。可以提供一些參照?qǐng)D生關(guān)鍵詞,有助于對(duì)需求達(dá)成共識(shí)和效率提升。
- 第二個(gè)階段是——定義期。此階段AI繪畫(huà)可以通過(guò)生成各種風(fēng)格和風(fēng)格組合的圖像,為設(shè)計(jì)師提供創(chuàng)意的靈感來(lái)源,通過(guò)直觀的圖像輔助明確設(shè)計(jì)方向。
- 第三階段是——發(fā)展期。此步是真正開(kāi)展設(shè)計(jì)創(chuàng)意了,這個(gè)階段我們要把問(wèn)題具體化,通過(guò)AI圖像工具快速生成多種效果方案。
- 第四階段是——交付期。選擇某種方案進(jìn)行深化,此階段目前Ai的編輯能力還相對(duì)較弱,但也是可以使用AI繪畫(huà)的控制技術(shù)針對(duì)性的調(diào)整,如現(xiàn)在的ControlNet 技術(shù)和圖像編輯工具。
總的來(lái)說(shuō),AI繪畫(huà)可以在創(chuàng)作設(shè)計(jì)的各個(gè)環(huán)節(jié)為設(shè)計(jì)師提供更多的可能性和創(chuàng)意空間,提高設(shè)計(jì)效率和質(zhì)量。
作為工業(yè)設(shè)計(jì)專業(yè)出生,從工業(yè)設(shè)計(jì)的視角聊下AI在哪些流程場(chǎng)景中輔助設(shè)計(jì)。
對(duì)于工業(yè)設(shè)計(jì)目前主要在概念設(shè)計(jì)上進(jìn)行輔助設(shè)計(jì),根據(jù)功能需求和風(fēng)格方向來(lái)輸出效果圖,設(shè)計(jì)師設(shè)計(jì)習(xí)慣得不同或產(chǎn)品屬性的不同,會(huì)選擇直接通過(guò)AI繪畫(huà)工具直接生成概念效果圖,或先輸出草圖在通過(guò)AI繪畫(huà)工具輸出概念效果圖。
要生成大概率符合自己預(yù)期的效果圖,要具備上至少這兩種能力:
- 念“咒語(yǔ)”的能力
- 工具的控制能力
“咒語(yǔ)”能力體現(xiàn)的是設(shè)計(jì)師本身的設(shè)計(jì)經(jīng)驗(yàn)、想法、思維,也是最能體現(xiàn)設(shè)計(jì)師的價(jià)值,在AI代替出圖環(huán)節(jié),也是最能體現(xiàn)設(shè)計(jì)師之間的差距。
在此之后需要總結(jié)一套自己念“咒語(yǔ)”結(jié)構(gòu)化語(yǔ)言,便于更好的與AI交互,讓AI懂你。在工業(yè)設(shè)計(jì)領(lǐng)域會(huì)總結(jié)一套專用的 prompt。
對(duì)于藝術(shù)創(chuàng)作,更多是表達(dá)個(gè)人想法和靈感,而藝術(shù)設(shè)計(jì)更多是解決具體的問(wèn)題再是風(fēng)格的追求,對(duì)繪畫(huà)工具可控性要求會(huì)更高。
設(shè)計(jì)會(huì)選擇Stable Diffusion通過(guò)LORA控制風(fēng)格和 ControlNet 來(lái)控制局部細(xì)節(jié)。(一些設(shè)計(jì)師會(huì)結(jié)合MJ和SD共同出圖)
訓(xùn)練LORA的目的是讓AI理解抽象的風(fēng)格,例如科技感的、女性化的、極簡(jiǎn)的,對(duì)于人類來(lái)說(shuō)都是感性詞匯??梢杂肔ORA去訓(xùn)練,同一風(fēng)格系列作品、同一類目、不同風(fēng)格作品、同一類目同一風(fēng)格作品,單個(gè)產(chǎn)品對(duì)象,不同類目不同風(fēng)格,這是目前MJ上沒(méi)有的功能。
ControlNet根據(jù)邊緣檢測(cè)、草圖處理等各種條件來(lái)進(jìn)一步控制圖像生成和細(xì)化細(xì)節(jié)。
跟一些在做工業(yè)設(shè)計(jì)的同學(xué)交流了下AI的使用體驗(yàn),整體來(lái)看AI在工業(yè)產(chǎn)品設(shè)計(jì)場(chǎng)景中還比較初級(jí)的輔助階段,想要達(dá)到滿意的作品還是有一定的差距,要花很多時(shí)間去學(xué)習(xí)工具和訓(xùn)練模型,后期還需要大量人工修改,工具上還有很大的改進(jìn)空間。
想要真正能作為設(shè)計(jì)師的創(chuàng)意、效率工具,還是需要針對(duì)細(xì)分領(lǐng)域根據(jù)行業(yè)know how深化產(chǎn)品能力,同時(shí)應(yīng)用場(chǎng)景還需要進(jìn)行拓展,不僅僅是出圖的工具,如果3D模型技術(shù)成熟會(huì)進(jìn)一步提升創(chuàng)意的效率,讓設(shè)計(jì)師把精力去研究用戶和發(fā)揮靈感創(chuàng)意,減少重復(fù)性、技巧性的工作,使設(shè)計(jì)真正回歸到本質(zhì)。
二、AI繪畫(huà)目前產(chǎn)品形態(tài)和發(fā)展現(xiàn)狀?
AI繪畫(huà)的大模型和應(yīng)用非常多,但最有名的非Midjourney和Stable Diffusion莫屬,只需要鍵入簡(jiǎn)單的語(yǔ)言描述,只需短短幾分鐘,便可生成畫(huà)作,那從以下幾個(gè)方面了解下AI繪畫(huà)產(chǎn)品形態(tài)和市場(chǎng)表現(xiàn):
- AI繪畫(huà)產(chǎn)品生態(tài)體系結(jié)構(gòu)?
- 國(guó)內(nèi)AI繪畫(huà)的產(chǎn)品都有什么功能,之間的差異有什么差異?
- AI 繪畫(huà)產(chǎn)品用戶關(guān)注哪些方面的需求?
- AI 繪畫(huà)產(chǎn)品商業(yè)模式,用戶是否愿意買單?
模型層:基礎(chǔ)模型上目前主要還是以外國(guó)模型表現(xiàn)出色,Stable Diffusion的開(kāi)源使得模型訓(xùn)練門檻的降低涌現(xiàn)了大量的AI繪畫(huà)產(chǎn)品,促進(jìn)圖像生成技術(shù)有更多的創(chuàng)意和場(chǎng)景落地。閉源模型以Midjourney為代表,同時(shí)將模型直接部署在Discord社交平臺(tái),提供直接的應(yīng)用,操作簡(jiǎn)單,圖片效果驚艷。
平臺(tái)/工具層:閉源模型廠商基于平臺(tái)提供API接口給下游客戶,例如客戶在自己應(yīng)用上調(diào)用MidjourneyAPI。如果API無(wú)法滿足的情況一些廠家也提供模型訓(xùn)練工具,例如百度的文心千帆平臺(tái)提供數(shù)據(jù)處理、模型開(kāi)發(fā)、模型部署一站式模型開(kāi)發(fā)。
應(yīng)用層:國(guó)內(nèi)大多數(shù)AI繪畫(huà)產(chǎn)品都是基于Stable Diffusion模型開(kāi)發(fā),看到更多的是藝術(shù)創(chuàng)意類產(chǎn)品,生成一些藝術(shù)繪畫(huà)、二元次漫畫(huà)等,例如6pen Art,畫(huà)宇宙;領(lǐng)域設(shè)計(jì)類目前處于往定制化項(xiàng)目路線較多,例如,Tiamat為設(shè)計(jì)領(lǐng)域提供定制化模型服務(wù)。
模型將成為應(yīng)用的基礎(chǔ)設(shè)施,科技公司將具有革命性的模型,對(duì)外開(kāi)源和提供API服務(wù),創(chuàng)業(yè)公司可以根據(jù)自身需求研發(fā)或調(diào)用大模型API,專注打磨應(yīng)用和服務(wù)客戶。
國(guó)內(nèi)AI繪畫(huà)的產(chǎn)品都有什么功能,之間的有什么差異?
通過(guò)體驗(yàn)Midjourney以及國(guó)內(nèi)多個(gè)知名A繪畫(huà)產(chǎn)品,在功能體驗(yàn)上個(gè)人總結(jié)兩個(gè)類別,類似手機(jī)操作系統(tǒng),Midjourney類似蘋果和以Stable Diffusion為基礎(chǔ)開(kāi)發(fā)的安卓類。
功能上Midjourney的功能操作極其簡(jiǎn)單,主要通過(guò)描述關(guān)鍵詞來(lái)生成創(chuàng)意作品,注重創(chuàng)意本身,國(guó)內(nèi)大多數(shù)應(yīng)用基于Stable Diffusion模型開(kāi)發(fā),功能可控性比較豐富,可以選擇不同模型,包括可調(diào)用MidjourneyAPI和自研模型等,甚至可以去通過(guò)小數(shù)據(jù)訓(xùn)練風(fēng)格模型。
國(guó)內(nèi)的AI繪畫(huà)產(chǎn)品技術(shù)層面上,各個(gè)產(chǎn)品之間并不存在過(guò)多差異,無(wú)非就是功能層面的豐富度有所差別,但有些公司會(huì)在開(kāi)源模型上自研模型有一些小的差異,例如像6pen art 訓(xùn)練的南瓜模型。
效果上Midjourney整體上效果更驚艷畫(huà)質(zhì)更細(xì)膩,Stable Diffusion類就要看模型的選擇,通用模型生成的圖片質(zhì)量就一般。
生成圖片的質(zhì)量主要取決于模型的質(zhì)量,而模型的質(zhì)量又主要取決于訓(xùn)練集的質(zhì)量。Midjourney的審美傾向是背后團(tuán)隊(duì)篩選出來(lái)的,產(chǎn)生內(nèi)容下限高平均審美在線以及閉源形成的數(shù)據(jù)閉環(huán)。Stable Diffusion開(kāi)源讓用戶自己訓(xùn)練符合自己個(gè)性化的風(fēng)格模型,效果取決用戶訓(xùn)練模型的水平。
Midjourney團(tuán)隊(duì)成員只有11人,卻成為AI繪畫(huà)領(lǐng)域的“當(dāng)紅明星”,在國(guó)內(nèi)是否能成功復(fù)制?
目前國(guó)內(nèi)還沒(méi)有照抄MJ的,MJ那么難模仿的關(guān)鍵因素有哪些?
- 公司的愿景和創(chuàng)始人的人格魅力
- 技術(shù)頂流,出圖效果出色,操作簡(jiǎn)單
- 開(kāi)發(fā)社區(qū),激發(fā)創(chuàng)意之泉
- 火爆出圈,吸引大批高質(zhì)量創(chuàng)造者
- ..……
可見(jiàn)MJ的成功因素非常多尤其是在模型能力快速的優(yōu)化和高質(zhì)量的數(shù)據(jù)積累構(gòu)建了核心的壁壘,短期是很難去超越MJ。
如何評(píng)價(jià)AI繪畫(huà)產(chǎn)品的圖像生成能力的差異?
圖像生成模型的關(guān)鍵能力包括圖像質(zhì)量、圖像多樣性,以及圖像穩(wěn)定性和可控性,這些能力決定了模型在應(yīng)用表現(xiàn)上的差異。
不同行業(yè)不同場(chǎng)景下的使用者對(duì)圖像生成能力的要求會(huì)存在一定的差別,例如藝術(shù)創(chuàng)作者與設(shè)計(jì)者,藝術(shù)創(chuàng)作者更注重圖片的美感,設(shè)計(jì)者更傾向圖片的合理性是否接近可落地效果;普通用戶對(duì)可控性的要求相對(duì)比設(shè)計(jì)從業(yè)者低。
1)圖像質(zhì)量
什么是好的圖像質(zhì)量?
黑格爾在《美學(xué)》里總結(jié)道“美是感性理念的顯現(xiàn)”,美的規(guī)律一般是”和諧的、對(duì)稱的、有規(guī)律的”,美并非是絕對(duì)的感性,而是理性的理性。
那么衡量圖片的理性維度可以是,構(gòu)圖合理,構(gòu)圖的合理是一張圖畫(huà)最基本的美學(xué)要求。符合邏輯,生成的圖像的整體表達(dá)能夠符合現(xiàn)實(shí)世界的基本邏輯,以及輪廓清晰、精細(xì)細(xì)節(jié)、驚艷的色彩搭配。
2)圖像多樣性
視覺(jué)元素、內(nèi)容風(fēng)格、創(chuàng)造性具有多樣的表現(xiàn)。
用同相同的關(guān)鍵詞,生成不同的圖像視覺(jué)內(nèi)容的形狀、顏色、外觀呈現(xiàn)多樣性,如果生成的圖像相似性較高,缺乏多樣性,那么模型的多樣性較低。
可生成不同的主題、場(chǎng)景、對(duì)象的風(fēng)格,只能生成特定類型的圖像,那么模型的多樣性較低。
模型生成的圖像是否具有創(chuàng)造性,能夠產(chǎn)生獨(dú)特且令人驚喜的圖像。模型生成的圖像在創(chuàng)造性和新穎性方面欠缺,那么模型的多樣性同樣受限。
3)圖像穩(wěn)定性
避免出現(xiàn)模糊、偽影、重復(fù)、不自然等問(wèn)題,不過(guò)現(xiàn)在生成圖像模型基本都是Diffusion模型,穩(wěn)定性上有較好的表現(xiàn),能夠在存在干擾的情況下仍然生成高質(zhì)量的圖像。
4)圖像可控性
圖像可控性是使用者能夠?qū)ι蓤D像進(jìn)行細(xì)節(jié)控制和后續(xù)調(diào)整,例如圖像的顏色、形狀、紋理以及生成的物體數(shù)量等??煽匦允菆D像生成產(chǎn)品實(shí)現(xiàn)成熟商業(yè)化的前提。
普通者是否能通過(guò)文字描述來(lái)控制修改局部細(xì)節(jié),設(shè)計(jì)者對(duì)圖像可控性的要求更高,包括能否進(jìn)行全景控制、精確區(qū)域控制、任意細(xì)節(jié)控制等。
AI繪畫(huà)產(chǎn)品當(dāng)下有哪些變現(xiàn)手段?
大多數(shù)AI繪畫(huà)產(chǎn)品要么是充值、按月、按數(shù)量或定制模型收費(fèi),變現(xiàn)模式相對(duì)比較簡(jiǎn)單和容易理解,也是現(xiàn)有商業(yè)化軟件常用見(jiàn)得變現(xiàn)手段。
5)充值消耗積分
充值多少送多少積分,根據(jù)生成圖片數(shù)量、選擇模式、生成速度來(lái)扣去積分。新用戶首次使用會(huì)贈(zèng)送一定的積分?jǐn)?shù),想持續(xù)使用或有更高階需求就要再額外充值。
6)軟件按月收費(fèi)
每個(gè)月的價(jià)格不同,功能權(quán)限范圍不同,典型代表就是Midjourney,10/30/60美元每個(gè)月生成的數(shù)量和權(quán)益有所不同,以有1億美元的收入。
7)按照輸出圖像數(shù)量收費(fèi)
不同價(jià)格輸出的圖像數(shù)量不同,例如國(guó)外avatar AI 、Lensa 、國(guó)內(nèi)的美圖,支付多少錢后生成十到幾十張頭像圖片,供用戶選擇和使用。
8)模型訓(xùn)練費(fèi)
這種模式主要是面向B端客戶,AI繪畫(huà)產(chǎn)品公司為有定制化模型需求的客戶提供模型訓(xùn)練,從而收取模型訓(xùn)練費(fèi)。Stable Diffusion 一項(xiàng)收益就是為客戶提供模型訓(xùn)練服務(wù),國(guó)內(nèi)的Tiamat的主要收益還是B端,據(jù)采訪信息去年Q4,有幾百萬(wàn)元的合同訂單。
對(duì)于變現(xiàn)能力來(lái)說(shuō)大多數(shù)產(chǎn)品目前是無(wú)法盈利的。
根據(jù)6Pen的調(diào)查,60% 的用戶并沒(méi)有在使用AI繪圖產(chǎn)品上有過(guò)付費(fèi)行為,也就是完全免費(fèi)在使用,剩下40% 的付費(fèi)用戶中,16% 付費(fèi)在 10 元以內(nèi),14% 在100元以內(nèi),付費(fèi)超過(guò) 100 元的不到 10%,我自己也只是購(gòu)買了Midjourney賬號(hào),其他產(chǎn)品還沒(méi)有讓我產(chǎn)生購(gòu)買的理由。
主要的原因:
1)使用群體有限,還不是真正的“平民化”產(chǎn)品
雖然AI繪畫(huà)產(chǎn)品只需要輸入一句話就能生成圖像,但對(duì)于用戶來(lái)說(shuō)需要有明確目的和技巧才能生成好的圖像,目前還不是人人都是設(shè)計(jì)創(chuàng)作者。
現(xiàn)在大部分還是設(shè)計(jì)師、內(nèi)容創(chuàng)作者、繪畫(huà)人員使用較多,普通用戶最多是體驗(yàn)下新鮮感,大多也就是免費(fèi)嘗試。
2)產(chǎn)品能力還有待提高,用戶認(rèn)知還處于嘗鮮階段,無(wú)法直接帶來(lái)商業(yè)轉(zhuǎn)化
根據(jù)6Pen問(wèn)卷調(diào)查顯示,42% 的用戶認(rèn)為 AI 繪畫(huà)單純只能滿足娛樂(lè)需求,38% 的用戶認(rèn)為AI繪畫(huà)可以部分運(yùn)用到工作之中,9.17% 的用戶認(rèn)為AI繪畫(huà)具有顛覆性,與此同時(shí),也有 7% 的用戶認(rèn)為這根本不值一提。
3)Midjourney的效果出眾和Stable Diffusion的開(kāi)源
Midjourney吸引大量國(guó)內(nèi)優(yōu)質(zhì)用戶使用,會(huì)進(jìn)一步分享傳播,國(guó)內(nèi)產(chǎn)品只能搶占哪些無(wú)法科學(xué)上網(wǎng)的用戶,同時(shí)Stable Diffusion的免費(fèi)和開(kāi)源,進(jìn)一步將模型訓(xùn)練的成本降低,用戶額外花錢的意愿降低。
三、AI繪畫(huà)的商業(yè)機(jī)會(huì)有哪些和制約因素?
現(xiàn)有的內(nèi)容創(chuàng)作關(guān)鍵因素和之間關(guān)系
從第一性原理視角去思考內(nèi)容創(chuàng)作的關(guān)鍵要素有哪些?基本要素為創(chuàng)作者、作品、消費(fèi)者,創(chuàng)作者通過(guò)創(chuàng)作工具生產(chǎn)內(nèi)容作品。
創(chuàng)作工具從最早的從原始的紙筆調(diào)色盤到數(shù)字化時(shí)代的數(shù)位板、繪圖軟件再到現(xiàn)在的AI。
有了作品就要通過(guò)傳播媒介給到消費(fèi)者進(jìn)行消費(fèi)才能產(chǎn)生價(jià)值,傳播媒介從線下到線上,到更加精準(zhǔn)和高效發(fā)展。
消費(fèi)者對(duì)作品滿意有價(jià)值會(huì)成為創(chuàng)作者的粉絲,對(duì)創(chuàng)作者持續(xù)關(guān)注,從而產(chǎn)生更多內(nèi)容作品。
每個(gè)鏈接點(diǎn)都可以產(chǎn)生商業(yè)化價(jià)值。
以消費(fèi)者為核心,以作品的數(shù)字化為基礎(chǔ)的消費(fèi)互聯(lián)網(wǎng)的大公司,在“傳播媒介”和“占有成本”上面做變革的起點(diǎn),比如搜索、短視頻、網(wǎng)購(gòu)等,再往“創(chuàng)作工具”和“名人/粉絲效應(yīng)”上延展,比如抖音做的“剪映”視頻工具,培育網(wǎng)紅、直播帶貨等。
以創(chuàng)作者為核心的為創(chuàng)作者提供軟件工具的企業(yè)服務(wù)公司,在“創(chuàng)作工具”上面做深做透,幫助創(chuàng)作者提升“生產(chǎn)效率”(降本)或者提升“作品效果天花板”(增效),幫助創(chuàng)作者掙更多錢,從而使得創(chuàng)作者愿意花錢來(lái)購(gòu)買相關(guān)的2B產(chǎn)品和服務(wù)。
新技術(shù)對(duì)關(guān)鍵因素帶來(lái)哪些改變?
以上是現(xiàn)有內(nèi)容創(chuàng)作產(chǎn)業(yè)結(jié)構(gòu),那新的技術(shù)出現(xiàn)上面的結(jié)構(gòu)會(huì)發(fā)展怎樣的變化。
圖像生成技術(shù)突破了只有人類才能生產(chǎn)內(nèi)容的特權(quán)。
創(chuàng)作者可以借助AI進(jìn)一步提升生產(chǎn)效率,這種效率的提升至指數(shù)級(jí)的,是從無(wú)到有。
消費(fèi)者也能使用Ai較輕松就能生產(chǎn)高水平的作品,不用完全依賴專業(yè)人士,自己創(chuàng)作自己消費(fèi)。
對(duì)于為B端創(chuàng)作者提供軟件工具的企業(yè)服務(wù)將會(huì)迎來(lái)新的變革,上一輪“云端協(xié)作”給軟件帶了新的機(jī)會(huì),誕生了一批新的在線軟件公司,例如藍(lán)湖、墨刀、Figma、Airtable,從傳統(tǒng)大牌軟件公司中分一杯羹。
以Ai為主的2B軟件工具將會(huì)再一次迎來(lái)爆發(fā),會(huì)有很多針對(duì)垂直領(lǐng)域的Ai軟件,面對(duì)不同設(shè)計(jì)領(lǐng)域。但要成功突圍成品爆品難度也是相當(dāng)?shù)拇螅荒苤皇呛?jiǎn)單的單業(yè)務(wù)圖像生成能力,需要融入到整個(gè)創(chuàng)作的過(guò)程中,從前期調(diào)研、需求溝通、方案設(shè)計(jì)、方案展示、方案落地、協(xié)調(diào)溝通,以及二維到三維,否則很容易被Midjourney和Stable Diffusion給擊垮。
需要考驗(yàn)玩家的場(chǎng)景結(jié)合能力、高質(zhì)量的數(shù)據(jù)和行業(yè)專業(yè)知識(shí)的理解能力,給垂直行業(yè)找到AI的最佳實(shí)踐方式才可能成功。
現(xiàn)有的軟件也將會(huì)擁抱AI,將AI能力接入到現(xiàn)有的功能中,Adobe 發(fā)布 AI工具 Firefly,計(jì)劃將AICG完整融入到現(xiàn)有的軟件中,包括 Photoshop、Illustrator、 Adobe Express等工具。
短期內(nèi)AI結(jié)合軟件工具能提供較大價(jià)值,但長(zhǎng)期來(lái)看會(huì)很殘酷,只有少數(shù)玩家能幸存。
當(dāng)AI的生產(chǎn)能力都能讓消費(fèi)者生產(chǎn)符合自己的設(shè)計(jì)作品,那么會(huì)對(duì)擠壓創(chuàng)作者的生存空間,不需要那么多軟件工具了。
那么直接面向消費(fèi)者的AI生產(chǎn)應(yīng)用將會(huì)有更廣闊的市場(chǎng)空間。
對(duì)于以C端為核心的視角去結(jié)合圖像生成技術(shù),可以從兩個(gè)方面挖掘應(yīng)用場(chǎng)景,效率工具和創(chuàng)作工具
以效率工具切入需要生成的內(nèi)容可以轉(zhuǎn)成個(gè)人經(jīng)濟(jì)的收益。
效率工具相對(duì)相對(duì)創(chuàng)作工具來(lái)說(shuō),需求和生成的要求會(huì)比較明確,與個(gè)人的經(jīng)濟(jì)收益有關(guān)的,Ai可以作為一個(gè)很好的生產(chǎn)力工具,例如在logo設(shè)計(jì)、商品圖片設(shè)計(jì)等,并且是可以為用戶帶來(lái)直接商業(yè)化轉(zhuǎn)化的價(jià)值。
現(xiàn)在大量的AI繪畫(huà)產(chǎn)品用戶還處于嘗鮮階段,只是為了獲取簡(jiǎn)單、直接的感官體驗(yàn),未能融合到用戶的工作和生活中,更重要的原因未能構(gòu)建好的應(yīng)用場(chǎng)景。
有一個(gè)非常有價(jià)值的案例:PhotoRoom。
服務(wù)于二手電商賣家,去掉圖片背景,并增加各種細(xì)分電商應(yīng)用場(chǎng)景所需的背景和效果,不僅節(jié)省時(shí)間,更重要是能提升商品的轉(zhuǎn)化率。
PhotoRoom 提供的背景都是各種具體的商業(yè)應(yīng)用場(chǎng)景,不同的社交媒體和電商平臺(tái)都會(huì)有不同的銷售文案的圖片以及各類風(fēng)格類型模版,目前各種模版已經(jīng)超過(guò)了 1000,基本上你只要找到自己平臺(tái)場(chǎng)景的背景圖片就可以直接掛上去賣了,整個(gè)優(yōu)化生成的圖片非常的有專業(yè)設(shè)計(jì)感,并且操作真的是非常簡(jiǎn)單。
目前 PhotoRoom 已經(jīng)被下載了 4000 萬(wàn)次,月活用戶 MAU 達(dá)到了 700 萬(wàn),訂閱用戶則達(dá)到了幾十萬(wàn),每天處理的圖片達(dá)到了 300 多萬(wàn)張。
另一種是以創(chuàng)作工具切入應(yīng)用場(chǎng)景,激發(fā)用戶個(gè)人創(chuàng)意、滿足娛樂(lè)化、個(gè)性化的情感需求,提供一種全新的“內(nèi)容創(chuàng)作體驗(yàn)”。
相對(duì)效率工具,對(duì)生產(chǎn)的圖片要求相對(duì)比較開(kāi)放一些,追求的是感知效果。
Midjourney定義為人類創(chuàng)意引擎,擴(kuò)展人類的想象力,產(chǎn)品形態(tài)上簡(jiǎn)單易上手,只需要輸入命令提示符,就可以生成對(duì)應(yīng)的高品質(zhì)圖形,讓人感覺(jué)不可思議的力量,激發(fā)人類創(chuàng)新想象的動(dòng)力。
但對(duì)于普通用戶來(lái)講,要?jiǎng)?chuàng)作一張高質(zhì)量的圖片還是有一定門檻,首先需要有明確的使用場(chǎng)景需求,不然無(wú)從下手,其次你需要具備一定審美能力,知道不同風(fēng)格,什么是一張好的有創(chuàng)意圖,最后你要會(huì)精準(zhǔn)的表達(dá),讓計(jì)算機(jī)理解你的需求。
以具體場(chǎng)景化來(lái)去驅(qū)動(dòng)用戶的創(chuàng)作動(dòng)力,會(huì)形成一定優(yōu)勢(shì)和機(jī)會(huì)點(diǎn)。
舉個(gè)案例,頭像風(fēng)格化生成——Lensa AI。
用戶上傳10-20張自拍照,能生成50~200張不同風(fēng)格的AI自畫(huà)像或頭像,切中頭像生成細(xì)分場(chǎng)景,契合不同的方式表達(dá)自我的需求,對(duì)用戶心理的洞察和深入挖掘,讓已經(jīng)厭倦發(fā)普通自拍的用戶獲得一種新的表達(dá)方式。
在去年12月份的時(shí)候在一眾面向C端的AIGC產(chǎn)品中尤為突出,5年內(nèi)創(chuàng)造了預(yù)估820萬(wàn)美元的收入。
同樣以頭像生成的有AvatarAI、國(guó)內(nèi)的美圖的頭像生成。
雖然大家會(huì)擔(dān)心像昔日的臉萌,只是短期的賺錢工具,但并不影響我們?nèi)シ治鋈绾巫プ∮脩艏?xì)分場(chǎng)景需求和興趣,通過(guò)新的技術(shù)方式為用戶提供更新奇、更能激發(fā)自我表達(dá)和傳播的方式,滿足滿足娛樂(lè)化、個(gè)性化的情感需求。
總的來(lái)說(shuō),對(duì)于toC場(chǎng)景,要切細(xì)化場(chǎng)景和用戶,激發(fā)用戶創(chuàng)作的動(dòng)力,動(dòng)力的來(lái)源要么是帶來(lái)提升收益的轉(zhuǎn)化,要么是滿足的用戶的某種情感的需求,得到了新的體驗(yàn)價(jià)值。同時(shí)要求在產(chǎn)品上需要足夠簡(jiǎn)單,可以基于細(xì)分場(chǎng)景提供豐富的選擇和聯(lián)想能力,把創(chuàng)作門檻變得足夠低。
四、圖像生成商業(yè)化落地挑戰(zhàn)?
1. 技術(shù)壁壘的挑戰(zhàn)
開(kāi)源使AI繪畫(huà)產(chǎn)品的技術(shù)壁壘越來(lái)越低,投機(jī)者可以用很低的成本來(lái)追逐風(fēng)口,在一定程度上造成商業(yè)上的混亂,這也是圖像生成領(lǐng)域當(dāng)前不被那么VC看好的原因,在國(guó)內(nèi)能拿到融資的局指可數(shù)。
想通過(guò)單點(diǎn)工具在該領(lǐng)域有獨(dú)立的生存空間并產(chǎn)生持續(xù)的現(xiàn)金流,就需要在某領(lǐng)域有自己的獨(dú)特?cái)?shù)據(jù),另外,提供的產(chǎn)品或者服務(wù)是巨頭不具備的API。
2. 數(shù)據(jù)能力的挑戰(zhàn)
圖像生成的效果很大程度依賴于訓(xùn)練數(shù)據(jù)的規(guī)模和數(shù)據(jù)質(zhì)量,圖像生成產(chǎn)品在向細(xì)分行業(yè)和場(chǎng)景深入時(shí),需要考慮存在的數(shù)據(jù)壁壘、數(shù)據(jù)量不足、數(shù)據(jù)質(zhì)量不高等問(wèn)題。
在模型訓(xùn)練階段,可以通過(guò)數(shù)據(jù)增強(qiáng)策略、利用合成數(shù)據(jù)預(yù)訓(xùn)練等方式進(jìn)行優(yōu)化,提升下游任務(wù)的性能。
在應(yīng)用階段,結(jié)合用戶所輸入的提示詞(prompt)、生成圖像選擇等進(jìn)行交互行為和偏好分析,利用數(shù)據(jù)沉淀數(shù)據(jù)資產(chǎn),有針對(duì)性的進(jìn)行模型迭代。
3. 產(chǎn)品化能力的挑戰(zhàn)
現(xiàn)在想要生成一張符合預(yù)期的圖片目前還是有一定門檻和時(shí)間成本,可能需要不斷嘗試不同的prompt和大量挑選過(guò)程。
除了要去優(yōu)化模型本身的性能外,可以從產(chǎn)品場(chǎng)景引導(dǎo)和交互層面去降低門檻、更高效生成符合預(yù)期的圖像。
對(duì)于用戶不是很知道要什么情況下或者說(shuō)生成后有什么作用,那么可以通過(guò)細(xì)分具體場(chǎng)景來(lái)引導(dǎo)用戶,例如兒童繪本場(chǎng)景,可制作關(guān)于自己孩子的一些繪本故事,那這個(gè)場(chǎng)景下可以教用戶如何去構(gòu)建故事腳本,具體如何生成,可瀏覽其他優(yōu)質(zhì)繪本作品,也可進(jìn)行二次生成等一系列的引導(dǎo),只有讓用戶知道具體價(jià)值才會(huì)去使用。
模型對(duì)于prompt的理解和運(yùn)用非常關(guān)鍵,輸入簡(jiǎn)單的prompt可進(jìn)一步給用戶完善更豐富和精準(zhǔn),在此基礎(chǔ)上,在用戶意圖的基礎(chǔ)上進(jìn)行擴(kuò)展,生成超越預(yù)期的高質(zhì)量圖像。
4. 版權(quán)方面的挑戰(zhàn)
AI在模型使用的訓(xùn)練數(shù)據(jù)包含明顯受到版權(quán)保護(hù)的視覺(jué)素材。Stable Diffusion訓(xùn)練數(shù)據(jù)集來(lái)自LAION-58,而LAION-58包含50多億圖片以及匹配的文本標(biāo)注,其中涉及大量受版權(quán)保護(hù)的內(nèi)容。
同時(shí),用戶在使用AI繪畫(huà)的工程也會(huì)大量參照現(xiàn)實(shí)藝術(shù)家或創(chuàng)作者的作品,直接加入藝術(shù)家的名字,這種行為容易造成內(nèi)容版權(quán)風(fēng)險(xiǎn)。
涉及的版權(quán)問(wèn)題同樣可以通過(guò)數(shù)字技術(shù)來(lái)解決,可以嘗試將畫(huà)家的作品上傳到區(qū)塊鏈中,從而加強(qiáng)技術(shù)溯源能力。
5. 理論與安全風(fēng)的挑戰(zhàn)
由于AI本身還不具備價(jià)值判斷能力,為此一些平臺(tái)進(jìn)行理論方面的限制和干預(yù),禁止用戶輸入敏感關(guān)鍵詞語(yǔ)。對(duì)于輸出的數(shù)據(jù)進(jìn)行篩選,移除包含明顯暴力、色黃犯法惡劣的內(nèi)容圖片,還采用人工審查員檢測(cè)被標(biāo)記為可能有問(wèn)題的圖像。
以上內(nèi)容是我個(gè)人對(duì)圖像生成領(lǐng)域商業(yè)化部分的學(xué)習(xí)梳理和淺顯的思考,接下來(lái)還會(huì)持續(xù)輸出一些圖像領(lǐng)域相關(guān)的文章內(nèi)容。
作者:Rzhiyi,8年產(chǎn)品經(jīng)理經(jīng)驗(yàn),做過(guò)AI皮膚檢測(cè)系統(tǒng)和SaaS類產(chǎn)品
本文由@Rzhiyi 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!