Midjourney:AIGC現(xiàn)象級應用,一年實現(xiàn)1000萬用戶和1億美元營收
去年9月23日,美國紅杉在官網(wǎng)上發(fā)布了一篇報告《生成式AI:一個創(chuàng)造性的新世界》,文章插圖全部在Midjourney上生成。同月,在美國科羅拉多州博覽會藝術(shù)比賽上,一名沒有任何繪畫基礎(chǔ)的參賽者通過Midjourney生成的《太空歌劇院》斬獲一等獎,這也將人工智能創(chuàng)造內(nèi)容(即AIGC)成為了傳媒領(lǐng)域的新熱點。Midjourney,這款AIGC現(xiàn)象級應用,你對它了解多少,歡迎閱讀。
文生圖賽道是 AIGC 概念下商業(yè)模式較成熟的領(lǐng)域,而 Midjourney 是其中最具競爭力的選手,是將 AIGC 技術(shù)成功產(chǎn)品化的代表。Midjourney 創(chuàng)始人堅持 AI 不是現(xiàn)實世界的復刻,而是人類想象力的延伸,塑造了充滿科幻色彩的產(chǎn)品定位。因最早開放公眾測試,能通過簡單的 prompt 生成獨具藝術(shù)感的圖片而收獲大量用戶。Midjourney 用戶數(shù)量飛速增長,并具有很強的盈利能力。其產(chǎn)品搭載在 Discord 上,擁有了超 1000 萬社區(qū)成員,是目前用戶最多的服務(wù)器,年營收約為 1 億美元。
但 AI 技術(shù)發(fā)展日新月異,如近期出現(xiàn)的 ControlNet,將推動文生圖進一步深入設(shè)計工作流;而未來多模態(tài)模型的出現(xiàn)勢必會進一步顛覆目前的產(chǎn)品形態(tài)。雖通過差異化產(chǎn)品定位擁有了早期數(shù)據(jù)積累及活躍社區(qū),但作為上層應用,Midjourney 并沒有建立起穩(wěn)固的護城河,時刻面臨著挑戰(zhàn)。
雖然無法確定該行業(yè)的終局,但我們認為 Midjourney 憑借著驚艷的圖片生成效果、活躍的 Discord 社群、通過數(shù)據(jù)飛輪建立的早期壁壘以及逐步的設(shè)計工作流滲透,在一定時間內(nèi)能夠保持較強的盈利能力;其團隊的快速迭代能力也使其能夠緊跟技術(shù)的進步,保持產(chǎn)品的競爭優(yōu)勢。
01 Thesis
1. Midjourney 圖片生成效果驚艷,藝術(shù)風格在市場上具有差異化優(yōu)勢。
Midjourney 的 prompt 簡短,具有明顯的科幻性,因圖片精美而具有更強的商業(yè)可行性,鎖定基數(shù)大、付費意愿強的創(chuàng)意設(shè)計用戶群,被大量實踐證明能顯著提高工作效率。相比之下,DALL-E2 偏寫實風格,Stable Diffusion 無風格偏向,但需要更長的 prompt 和更多的嘗試才能獲得好的圖片效果。
2. Midjourney 巧妙地通過 Discord 社區(qū)搭建產(chǎn)品,具有社區(qū)優(yōu)勢。
社區(qū)共創(chuàng)是藝術(shù)創(chuàng)作中不可缺少的要素,Discord 的交互形式也是吸引、留存用戶的一大要素。目前 Midjourney 已成為 Discord 用戶最多的服務(wù)器,擁有了超 1000 萬名社區(qū)成員。
3. Midjourney 已形成數(shù)據(jù)飛輪,有利于建立競爭壁壘。
Midjourney 最早開放 Openbeta 版本,通過龐大用戶量積累了獨有的數(shù)據(jù)集,形成數(shù)據(jù)飛輪,根據(jù)用戶需求針對性地訓練模型并快速迭代產(chǎn)品,長期來看更有利于建立競爭壁壘。
4. 目前商業(yè)化仍在早期,潛在市場空間巨大。
- 目前采取 SaaS 訂閱制模式,價格為 10 – 60 美元/月。雖未公布具體付費用戶數(shù)量,但根據(jù)客戶訪談可知用戶付費意愿較強。以目前用戶數(shù)量保守估計,年營收能到達約 1 億美元。
- 付費用戶主要為創(chuàng)意設(shè)計人群和個人愛好者,若對標 Canva 的用戶群,以 Midjourney 目前訂閱價格計算,未來收入能達到約 23 億美元。
- 技術(shù)的不斷迭代會改變目前的產(chǎn)品形態(tài)。如 ControlNet 的發(fā)布增強了生成圖片的可控性,進一步深入設(shè)計工作流;多模態(tài)模型會改變目前的單點產(chǎn)品現(xiàn)狀。未來 Midjourney 計劃開發(fā)多功能產(chǎn)品,創(chuàng)造更豐富的應用場景,進一步擴大市場想象空間。
5. Midjourney 團隊技術(shù)和產(chǎn)品并重,具有“創(chuàng)業(yè)基因”。
創(chuàng)始人 David Holz 為連續(xù)創(chuàng)業(yè)者,曾是 Leap Motion 創(chuàng)始人之一,團隊成員及顧問擁有 AI 技術(shù)及產(chǎn)品創(chuàng)業(yè)的復合背景;團隊成員僅 11 人,人效極高。由于技術(shù)發(fā)展迅速,Midjourney 必須緊跟技術(shù)發(fā)展,不斷迭代產(chǎn)品。目前來看,Midjourney 團隊在產(chǎn)品研發(fā)能力、開發(fā)速度方面都有較好的表現(xiàn)。
02 文生圖應用的爆發(fā)
2015 年,Google 研究員 Alexander Mordvintsev 創(chuàng)建了首個用于藝術(shù)創(chuàng)作的機器學習應用 DeepDream,這一應用被谷歌開源,首批藝術(shù)家通過算法生成藝術(shù)圖像。從那時起,AI 藝術(shù)生成開始走進大眾的視野中。
2021 到 2022 年, 文生圖應用出現(xiàn)了突破性的進展,生成的圖像質(zhì)量得到了迅速提高。2022 年初,用 Disco Diffusion 僅可以生成一些很有氛圍感的草圖;2 個月后,DALL-E2 相比 DALL-E 分辨率提高了 400%,已經(jīng)可以刻畫細節(jié),生成準確的五官;如今,Stable Diffusion 和 Midjourney 創(chuàng)作的圖像更加精致且具有藝術(shù)感,并且將作畫速度縮短到 30s 。
從技術(shù)視角來看,這是一場底層模型的飛躍式進步:從 GAN 轉(zhuǎn)變至 Diffusion 模型。2022 年前,文生圖的模型以生成性對抗網(wǎng)絡(luò)(GANs)為主。但因為在實踐中存在明顯不足,還不如用 Photoshop 等工具直接創(chuàng)作,無法用于商業(yè)化。
目前文本生成圖像領(lǐng)域的核心方法是 Diffusion 模型,OpenAI 2020 年發(fā)布的 CLIP 使其更為實用。工作原理為通過反復地向訓練數(shù)據(jù)添加噪聲來破壞原有數(shù)據(jù)結(jié)構(gòu),然后通過“反向擴展”來恢復被破壞的數(shù)據(jù)。Diffusion 模型交互簡單、生成速度快,極大的降低了使用門檻。
伴隨著 Disco Diffusion、Stable Diffusion、DALL-E2、Midjourney 等通用文生圖軟件開放公眾測試,引發(fā)了指數(shù)級的社交媒體討論及作品展示,成功實現(xiàn)了文生圖應用向 C 端落地。除了Midjourney 等通用型文生圖軟件,垂直類應用也層出不窮。
不同行業(yè)對生成圖片有著不同的要求,需要使用特定數(shù)據(jù)集訓練,這給垂類賽道的創(chuàng)業(yè)企業(yè)提供了機會。如專注于 Logo 與網(wǎng)站設(shè)計的 looka,專注二次元形象生成的 NovelAI,專注游戲資產(chǎn)生成的 Scenario,以及專注頭像生成的 Lensa。這些垂類應用目前來看很難成長為大體量公司,但盈利能力強,如 Lensa 在發(fā)售后的短短幾周就賺了 4000 – 5000 萬美元。
03 What is Midjourney?
Midjourney 是自籌資金的獨立研究室,目前開發(fā)了同名文生圖模型及應用,產(chǎn)品搭載在 Discord 中,用戶通過與 Midjourney bot 進行對話式交互,提交 Prompt(文本提示詞)來快速獲得想要的圖片。
Midjourney bot
Midjourney 采取 SaaS 訂閱制模式。最初使用時,用戶可以免費生成 25 張照片。之后按照訂閱制收費。月付制為 10、30、60 美元,或者使用年付制,價格為 8、24、48 美元/月。值得注意的是,用戶只有在訂閱之后,才能擁有使用 midjourney 創(chuàng)作的圖片的版權(quán)。
Midjourney CEO David Holz 曾說過:“人們在紙上繪畫只需要幾秒,但在電腦前卻需要幾分鐘到幾小時;這不是因為電腦不夠智能,也不是因為人們不知道自己想要什么,而是因為人類和計算機之間存在的某些障礙阻止了我們進行最基本的交換?!?/strong> Midjourney 想要加強人類與計算機的連接,將 “探索思想的新載體,擴展人類想象力” 作為目標。
Midjourney 在 AI 公司 Value Chain 上占據(jù)了多個位置,擁有數(shù)據(jù)層、模型層、應用層整個技術(shù)棧。它參考 CLIP 及 Diffusion 構(gòu)建了自己的閉源模型,抓取公開數(shù)據(jù)進行訓練,并構(gòu)建了 Discord 中的 Midjourney bot 應用。作為應用層公司,Midjourney 收集用戶反饋數(shù)據(jù),迭加技術(shù)的進步,不斷迭代模型。
AI’s next frontier:building and investing in Large Language Models
2022 年 3 月,Midjourney 啟動邀請制 Beta 版本。因為文生圖本身具有極強的吸引力,且 Midjourney 創(chuàng)作的圖片質(zhì)量很高,所以很快就吸引了大量用戶。
從圖中可以看出,AI 生成藝術(shù)的興趣浪潮由 6 月初的 DALL-E2 引發(fā)。2022 年 7 月,Midjourney 開放 Openbeta 版本;2022 年 8 月,使用 Midjourney 創(chuàng)作的畫作 Théatre D’opéra Spatial(太空歌劇院)獲得了美術(shù)競賽數(shù)字藝術(shù)類別的一等獎,人們對于 Midjourney 的關(guān)注達到高峰。雖然文生圖領(lǐng)域應用層出不窮,但 Midjourney 保持住了在人們心目中的地位,目前仍是使用最廣泛、最受用戶喜愛的文生圖應用。截止 2023 年 2 月 12 日,Discord 頻道的用戶數(shù)達到 1081 萬,早已實現(xiàn)盈利。
04 Who is the Customer?
Midjourney 用戶群體廣闊,主要包括創(chuàng)意設(shè)計人群、工業(yè)設(shè)計人群、Web3 & NFT 從業(yè)者以及個人愛好者。
創(chuàng)意設(shè)計人群
創(chuàng)意設(shè)計從業(yè)者是一個很大的群體,滲透各行各業(yè)。小 b 端,包括產(chǎn)品設(shè)計師(如玩具、墻紙等);圖片設(shè)計師(網(wǎng)站、廣告、PPT、Logo、插圖等);游戲設(shè)計師(游戲場景、角色、道具)以及自媒體創(chuàng)作者等等。企業(yè)端,Midjourney 可服務(wù)廣告公司、影視公司、品牌的廣告創(chuàng)意部門等對于藝術(shù)效果圖有大量需求的客戶。
Midjourney 生成的圖片可以顯著地提高創(chuàng)意設(shè)計人群的工作效率。目前 Discord 的用戶中專業(yè)設(shè)計師占比達 30% – 40%,包括 Nike、Adidas、New Balance 等公司的設(shè)計師。根據(jù)客戶訪談,Midjourney 主要被應用于設(shè)計工作早期,幫助設(shè)計師激發(fā)靈感,快速測試想法,并迭代圖片。用戶表示,設(shè)計品牌始終在尋找設(shè)計新方法和新工具以提高工作效率,對于 Midjourney 的付費意愿非常強。Midjourney 的風格包括很多科幻元素,擅長創(chuàng)造環(huán)境圖,同時針對人像做了優(yōu)化,風格較為細膩,非常適合游戲、電影、音樂和出版等創(chuàng)意行業(yè)。
工業(yè)設(shè)計行業(yè)
Midjourney 也進入了工業(yè)設(shè)計等精細化要求較高的領(lǐng)域,如建筑設(shè)計。目前 Instagram 上有許多建筑師分享文生圖作品,有超過 72,000 個帖子被標記為 #midjourneyarchitecture。
An image of a house for a pianist,designed by Tim Fu using Midjourney.
Source: Tim Fu
Created by Jon Henning
在工作中,建筑師使用 Midjourney 在項目的最初階段創(chuàng)建情緒版 (mood board)。目前 Midjourney 生成的圖像僅能作為草圖,用來激發(fā)靈感。建筑師將這些草圖翻譯成圖紙,并建模和進行結(jié)構(gòu)分析,開發(fā)出 3D 模型后,建筑師會再將圖像反饋給 Midjourney,進一步迭代建筑圖紙。不過近期發(fā)布的 ControlNet 將會進一步深入設(shè)計工作流。
*情緒版 (mood board) 是指一系列圖像、文字或樣品的拼貼組合物,用來展現(xiàn)設(shè)計師對一個項目的想法或感覺。
NFT 從業(yè)者
NFT 無疑也是文生圖的一大應用場景。Midjourney 目前被廣泛應用在 NFT 創(chuàng)作上,因此公司發(fā)布規(guī)定,如果在 “與區(qū)塊鏈相關(guān)的事物” 中使用 Midjourney 生成圖像,需要對每月超過 20,000 美元的收入部分支付 20% 的版稅。
NFTs Created by Midjourney
個人愛好者
Midjourney 用戶群體中不乏個人愛好者,如自媒體群體。文生圖大大降低了藝術(shù)創(chuàng)作門檻,使得普通用戶也可以成為藝術(shù)家和設(shè)計師,并通過 AI 創(chuàng)作獲取收入。
05 Why Midjourney?
Midjourney 是一款 AI 軟件,也是一個垂類 SaaS 產(chǎn)品,引用 Point Nine Capital 的創(chuàng)始合伙人 Christoph Janz 的觀點,垂直 SaaS 產(chǎn)品的成功離不開以下基本原則:對所在行業(yè)的客戶有更深入的了解;以最好的方式解決他們的具體問題;專門向目標的群體進行營銷/銷售;隨著時間的推移增加更多的功能層,增加 ACV( 平均客戶價值)和粘性。我們在 Midjourney 的產(chǎn)品中看到了以上特點,也在其未來發(fā)展規(guī)劃中看到了對增加 ACV 和用戶粘性的努力。
驚艷的產(chǎn)品效果
Midjourney 產(chǎn)品定位具體,“了解用戶到底需要什么”,商業(yè)可行性強,能在更大程度上提高創(chuàng)意設(shè)計的效率。正如 Discord 中的用戶評價:“ Midjourney 超過其競爭對手是因為它生成的圖片都是可以商業(yè)化的?!?具體而言,Midjourney 的 prompt 簡短,具有科幻色彩。相比之下,DALL-E2 更偏寫實風格,Stable Diffusion 無風格偏向,但需要更長的 prompt 和更多的嘗試來獲得好的圖片效果。
Book covers
Mobile App UIs, created by midjourney
Prompt 包括圖片內(nèi)容描述、藝術(shù)風格描述、藝術(shù)媒介&手段、光線描述、圖片細節(jié)描述等等,使用不同的 prompt 可以實現(xiàn)圖片的精細化調(diào)節(jié)。利用 Midjourney 獲得美術(shù)競賽數(shù)字藝術(shù)類別一等獎的 Théatre D’opéra Spatial (太空歌劇院),創(chuàng)作者 Jason Allen 經(jīng)過了 80 個小時的創(chuàng)作、大約 900 次嘗試才完成了這個作品。
但這也反映了目前的圖片生成無法控制,也無法修改。對于用戶是一個黑盒,一方面不知道輸入什么樣的 prompt 會突然產(chǎn)生好的效果,另一方面即使每次都輸入同樣的詞,每次出來的東西也不一樣。但產(chǎn)品如果要商用化,每一個步驟都應該是有跡可循的。對于 Midjourney 獨特的藝術(shù)風格,Holz 表示,Midjourney 在優(yōu)化模型的過程中是期待制作美好的圖片,激發(fā)人類的想象力,而不是復刻現(xiàn)實。Midjourney 不會成為假照片的制造機器。
同時,Midjourney 在質(zhì)量和速度之間做了“黃金區(qū)域”的選擇。最初有 20 分鐘生成高畫質(zhì)圖片和 15 秒能生成低畫質(zhì)的圖片兩種算法。經(jīng)過測試發(fā)現(xiàn),相較于質(zhì)量,人們更關(guān)心速度,但太快也不會帶來更多體驗上的加成。所以最終選擇了 60 秒的版本,比 10 秒生成的質(zhì)量更高,速度也在人們舒適的范圍內(nèi)。
以 Discord 為載體的社區(qū)交互設(shè)計
Discord 為 Midjourney 的啟動提供了絕佳的社交體驗平臺,成功將其帶入了大眾市場。
一方面 Discord bot 降低了用戶使用門檻;另一方面,圖片創(chuàng)作是一個在討論中不斷迭代的過程,欣賞其他用戶的作品有也助于激發(fā)靈感。Holz 在訪談中也提到,不直接做一個 iOS App 的原因是因為人們喜歡藝術(shù)共創(chuàng)。Midjourney 迅速成為 Discord 上用戶最多的服務(wù)器,擁有了超 1000 萬名社區(qū)成員。Midjourney 近期擴大了產(chǎn)品的可用范圍,任何人都可以將 Midjourney bot 引入自己的 Discord 服務(wù)器,這將進一步擴大 Midjourney 的使用容量。
Midjourney Discord 社群界面
Midjourney bot
通過數(shù)據(jù)飛輪和快速迭代建立護城河
迭代速度對于文生圖軟件非常重要。SaaS 訂閱制的產(chǎn)品模式使其盈利能力取決于圖片效果及成本。而底層技術(shù)的飛速進步,必須不斷地迭代模型以緊跟行業(yè)發(fā)展。其實數(shù)據(jù)質(zhì)量及數(shù)據(jù)標注質(zhì)量的重要性遠遠超過模型本身。Midjourney 以 PLG 的模式獲得龐大用戶量,形成數(shù)據(jù)飛輪,能夠根據(jù)用戶需求針對性地訓練模型并快速迭代產(chǎn)品,長期來看更有利于建立競爭壁壘。
Midjourney 自發(fā)布以來迭代速度非???。2022 年 3 月 V1 發(fā)布時仍參考了很多的開源模型;4 月、7 月和 11 月分別發(fā)布了V2、V3 和 V4,迭代出了自己的模型優(yōu)勢。V4 補充了生物、地點等信息;增強了對細節(jié)的識別能力及多物體/多人物的場景塑造能力??傊?,每次迭代都是產(chǎn)品功能的飛躍。
Four generations of Midjourney AI modelsreleased in 2022
Midjourney 也在擴展地理版圖。目前已經(jīng)登錄中國市場,使用微信內(nèi)測群的方式提供服務(wù)。用戶在內(nèi)測群中艾特 Bot,并輸入關(guān)鍵詞,就可以生成 AI 圖片。
逐漸深入設(shè)計工作流
Midjourney 替代了 Google Images、Shutterstock、Getty Images、Pinterest、Unsplash 等傳統(tǒng)圖庫平臺,用戶不再需要花費數(shù)小時搜索他人的作品激發(fā)靈感,而是直接生成,據(jù)稱可以將一個月的工作量降低至一星期。ToB 端,Midjourney 目前還主要在設(shè)計工作流初期。因為自定義能力有限,無法調(diào)整樣式;也無法與其他平臺集成,要生成滿意的圖片需要反復的嘗試;所以只能用于靈感激發(fā)和提高工作效率,對于工作流的滲透并不深入。
近期發(fā)布的 ControlNet 使得 Diffusion 模型更好地受控生成圖片,提高了圖片生成的速度和精準度,并可以調(diào)整圖片細節(jié),將會進一步深入工作流,改變專業(yè)設(shè)計行業(yè)的生產(chǎn)模式。Midjourney 若要進一步深入工作流需盡快集成 ControlNet。
Twitter: @RamAnanth29
ToC 端,會極大的簡化工作流,比如代替設(shè)計師或外包商完成公眾號等自媒體團隊的圖片設(shè)計等等。不可忽視的是,Midjourney 在發(fā)展過程中還面臨著潛在風險,如版權(quán)問題。David Holz 承認 Midjourney 使用的公開數(shù)據(jù)集包含了數(shù)百萬張未經(jīng)作者同意的作品;2023 年 1 月,三位藝術(shù)家對 Stability AI、Midjourney 以及 DeviantArt 提起了侵犯版權(quán)的訴訟。AI 生成作品中還存在著種族歧視及成年內(nèi)容。雖然 Midjourney 進行了關(guān)鍵詞限制,但仍無法完全避免相關(guān)內(nèi)容出現(xiàn)。
Prompt 生態(tài)
社區(qū)用戶對于 Midjourney 的能力探索熱情極高,目前已經(jīng)出現(xiàn)了 prompt 的學習交流網(wǎng)站如 promptoMANIA,社群中也流傳著很多 prompt 數(shù)據(jù)集的公開 Google 文檔及文章教程。
Style groups in midjourney— Image by Lars Nielsen
由于用不同的 prompt 獲得的圖片效果差異很大,甚至出現(xiàn)了 prompt 交易平臺。PromptBase 就是一個包含 Midjourney、DALL-E2、GPT-3 等不同平臺 prompt 的交易平臺,產(chǎn)品定價為 1.99 – 5.99 美元不等,平臺抽傭 20%。目前為止,PromptBase 已有 1 萬多名用戶,最受歡迎的內(nèi)容為 Logo、網(wǎng)站、服裝等商業(yè)化設(shè)計場景,能夠賣出幾百到幾千次。
Prompt 交易市場之所以能存在,一方面是因為人們表達能力的不同;另一方面是模型內(nèi)部邏輯的原因,一些看似不合常理的詞語組合卻能獲得意想不到的效果。OpenAI 創(chuàng)始人 Sam Altman 在采訪中表示,未來的 AI 系統(tǒng)不會因為增補特定詞就產(chǎn)生截然不同的輸出,而是能更好地理解自然語言。所以未來,該平臺的價值會被表達能力更強的人捕獲。
06 團隊背景
Midjourney 正式團隊成員十分精簡,共 11 人。除了 CEO 之外,有 8 位研究與工程師,2 位財務(wù)與法務(wù)。除此之外,還有 4 位編外顧問,以及 60 位兼職 Discord 運營。CEO David Holz 高中時便嘗試創(chuàng)意領(lǐng)域的創(chuàng)業(yè),大學主修數(shù)學物理學,在攻讀流體力學博士的同時為 NASA 和 Max Planck 工作。之后創(chuàng)立了 Leap Motion,獲得來自 a16z、Founders Fund、Intel Capital 和 JP Morgan 的超 1.2 億美元投資。Leap Motion 的核心技術(shù)是手部追蹤技術(shù),想要成為 Metaverse 中的“鼠標和鍵盤”,但因為 VR&AR 一直難以突破瓶頸,所以“鼠標和鍵盤”自然也缺乏應用場景。
雖然 Holz 離開了 Leap Motion,但從未放棄 Metaverse 的藍圖,他創(chuàng)立了 Midjourney,或許也期待成為 Metaverse 中的生產(chǎn)力和 “大腦”。Midjourney 團隊的多個核心成員來自 Leap Motion,如 CFO Nadia Ali 和高級研發(fā)工程師 Johnathon Selstad。團隊成員及顧問擁有 AI 技術(shù)及產(chǎn)品創(chuàng)業(yè)的復合背景。這使得 Midjourney 不僅擅長模型優(yōu)化,也能夠理解用戶,打造優(yōu)秀的產(chǎn)品。
David Holz 認為 AI 不應該被限制,而是人類應該去適應。他將 AI 比作水,既危險,又是文明的驅(qū)動力。懂得如何與水一起生活和工作的人類,將有能力在水中游泳、做船、筑壩發(fā)電,從而更好的生活。同時,他認為文生圖的核心并不是藝術(shù)或深度偽造(deepfakes),而是人類想象力的引擎。正是團隊的思維方式使得 Midjourney 的風格充滿了科幻色彩,也使其選擇了 Discord,以最開放的方式面向用戶。
在 2022 年 8 月的采訪中,Holz 表示 Midjourney 目前不以財務(wù)回報為動機,也沒有成為上市公司的計劃。只是期待未來十年能夠做對個人和世界有意義的事情,并且從中享受樂趣。
07 競爭格局
競爭對手
Midjourney 主要的競爭對手為以下幾家使用了 Diffusion 模型的文生圖軟件公司:
科技大廠也在文生圖領(lǐng)域積極布局,但速度較慢,目前僅僅發(fā)布了理論模型。Apple 若未來將 Stable Diffusion 嵌入 Iphone 中,可能會對行業(yè)格局產(chǎn)生較大影響。
傳統(tǒng)設(shè)計軟件也積極進入該領(lǐng)域,如 Photoshop 推出 Alpaca 插件,集成 Stable Diffusion,在 Twitter 上引發(fā)轟動,用戶將它描述為“a game changer”,流暢的同工作流結(jié)合。傳統(tǒng)設(shè)計軟件占據(jù)了用戶熟悉的使用場景,且作為產(chǎn)品功能的一部分擁有組合價格優(yōu)勢,對 Midjourney 構(gòu)成挑戰(zhàn)。
Midjourney vs. Stable Diffusion
Midjourney 最有力的競爭對手是 Stability.AI,與 Midjourney 的閉源不同,其模型 Stable Diffusion 因開源模式受到了廣泛關(guān)注。Stable Diffusion 于 2022 年 8 月推出, 以開源底層代碼的形式在 HuggingFace/Github 公開發(fā)布。“將 AIGC 交到數(shù)十億人手中,實現(xiàn)技術(shù)民主化”,用戶可以在其代碼的基礎(chǔ)上運行或修改,制作自己的應用程序,向終端用戶提供服務(wù)。作為稀缺的開源模型,同時有著良好的性能,公測后就受到了廣泛的關(guān)注和好評,積累了大量用戶。截止 2022 年 10 月,Stable Diffusion 已經(jīng)有超過 20 萬開發(fā)者下載和獲得授權(quán),各渠道累計日活用戶超過 1000 萬。團隊開發(fā)的付費在線平臺 DreamStudio 目前獲得了超過 150 萬用戶,生成超過 1.7 億圖片。
Stable Diffusion 的開源優(yōu)勢在于能夠吸引大量的開發(fā)者,最大程度的把模型用起來。開源社區(qū)會齊心協(xié)力地完善模型文檔,共同推進 prompt engineering,解決技術(shù)難題。這使得代碼的迭代速度非常快,優(yōu)化效率遠遠高于閉源系統(tǒng),使得文生圖行業(yè)快速成長和普及。同時社區(qū)成員會創(chuàng)建新的 UI,通過擴展現(xiàn)有的功能創(chuàng)造新的用例,因此 Stable Diffusion 模型上長出了繁榮的應用。缺點在于商業(yè)化不夠直接,可能為別人“做了嫁衣”。
同時,Midjourney 與 Stable Diffusion 因使用的數(shù)據(jù)集及模型微調(diào)方式不同,在產(chǎn)品層面存在較大差異。
(1)產(chǎn)品定位上,Midjourney 是給創(chuàng)意設(shè)計群體開發(fā)的靈感激發(fā)及效率工具。
而 Stable Diffusion 更為開放,在風格變化的多樣性上具有優(yōu)勢,但獲得想要的圖片效果需要更長的 prompt 和更多的嘗試,同時在特定領(lǐng)域都不如該領(lǐng)域的專業(yè)化產(chǎn)品。
(2)商業(yè)化維度,對比 Midjourney 的閉源與 Stable Diffusion 的開源,Midjourney 商業(yè)化層面更為占優(yōu)。
因為模型閉源,并通過龐大的用戶量積累了獨有的數(shù)據(jù)集,可以根據(jù)用戶需求不斷地針對性訓練模型,長期來看更有利于建立競爭壁壘。在與 Stable Diffusion 的競爭中,因為其模型的開源,Midjourney 可以隨時集成其模型優(yōu)勢。
(3)用戶獲取層面,Midjourney 最早開放了 Openbeta 版本,短時間獲得大量用戶。
但 Stable Diffusion 的商業(yè)化版本 DreamStudio 需要等待 Wait list,而開源模型的本地部署有較高的門檻。Midjourney 獲得大量用戶后,養(yǎng)成了用戶使用習慣,且在開啟付費訂閱后就進一步加強了用戶粘性。
08 收入估算及未來發(fā)展
收入估算
雖然團隊一直表示不在意財務(wù)回報,但 Midjourney 具有極強的盈利能力。2022 年 8 月份,創(chuàng)始人 Holz 就聲稱 Midjourney 已經(jīng)實現(xiàn)盈利。A16Z 也在《Who Owns the Generative AI Platform?》文章中提到 Midjourney 年收入已超過 1 億美金。因為沒有公開收入情況,我們在這里對它進行一個簡單的估算。假設(shè) Discord server 用戶(約 1081 萬) 的 5% 是付費會員,共 54.05 萬人。若付費用戶的 70% (約 37.84 萬)訂閱每月 10 美元的基本計劃,25% (約 13.51 萬)訂閱每月 30 美元的標準計劃,5% (約 2.7 萬) 是每月支付 60 美元左右的公司用戶。則 Midjourney 目前的收入能達到每月約 945.9 萬美元,年收入 1.14 億美元。
*因為 Midjourney bot 可以在所有 server 中使用,所以 discord server 用戶數(shù)小于總用戶數(shù)。
目前來看,Midjourney 的毛利率約為 80%。Midjourney 搭建在 Discord 上,Discord 會收取約 10% 的手續(xù)費。雖不清楚 Midjourney 的模型訓練成本,但 Stable Diffusion 的訓練共使用了 256 張 Nvidia A100,耗時 15 萬小時,成本為 60 萬美元。每次生成圖像的推理在云端的 GPU 上完成,生成一張圖片的成本約 0.5 美分一張,且未來成本會不斷壓縮。相對于訂閱收入,生成圖片的成本可以逐漸忽略不計。
近期市場空間Midjourney 為付費訂閱的商業(yè)模式,廣泛滲透各個視覺場景。目前付費用戶主要為創(chuàng)意設(shè)計人群和個人愛好者兩大類。To smb 端,Midjourney 以 PLG 的模式成為專業(yè)設(shè)計從業(yè)者的辦公軟件。ToC 端,Midjourney 成為非專業(yè)設(shè)計師的工具,以及藝術(shù)愛好者的“玩具”。
我們根據(jù)客單價和付費用戶量建立了以下坐標軸,可以看到,Adobe 作為專業(yè)性極強的設(shè)計軟件擁有最高的客單價和最多的付費用戶,年訂閱收入遠超其他公司。Midjourney 因剛剛起步,付費用戶量少,但憑借著較高的客單價,有可觀的增長空間。
對比傳統(tǒng)設(shè)計工具,Midjourney 在使用門檻、客單價和目標客戶群的定位上都與 Canva 更為相近,面向更廣泛的 C 端和 smb 用戶。截止 2022 年底,Canva 用戶達到 1.1 億人,證明了全世界至少有 1.1 億人有設(shè)計需求。假設(shè)這 1.1 億設(shè)計人群中有 5% 會成為 Midjourney 的付費用戶,付費用戶的 70% 訂閱每月 10 美元的基本計劃,25% 訂閱每月 30 美元的標準計劃,5% 是每月支付 60 美元左右的公司用戶。則 Midjourney 的市場空間能達到 12*11000*0.05(0.7*10+0.25*30+0.05*60)= 11.6 億美元。
所以 ,Midjourney 能看到 10 億美元左右的年營收,成長為百億美金的公司。
未來產(chǎn)品形態(tài)
Midjourney 未來可能會有以下幾種發(fā)展前景:
1. Midjourney 將目前的圖庫功能做到極致。
目前 Midjourney 替代了 Google Images、Shutterstock、Getty Images、Pinterest、Unsplash 等傳統(tǒng)圖庫平臺,成為新的“視覺搜索引擎”。Pinterest 擁有超 4.5 億月活用戶,若其中的 1% 能成為 Midjourney 的付費用戶,則能達到約 10 億美元的營收;樂觀來看,若 5% 能成為付費用戶,則能達到約 47 億美元的營收。
2. Midjourney 不再局限于 Discord ,并且作為插件接入其他設(shè)計產(chǎn)品,仍扮演圖庫功能。如上文提到的 Canva、Adobe 等等,這將進一步增加其分銷渠道,觸達更多的付費用戶群。
3. Midjourney 自己開發(fā)了端到端的產(chǎn)品,和設(shè)計工作流緊密結(jié)合,進一步提高客單價。
功能方面,Midjourney 通過不斷集成最新的技術(shù),迭代產(chǎn)品功能,打造產(chǎn)品矩陣。如近期可以通過接入 ControlNet 深入設(shè)計工作流,Holz 也稱短期內(nèi)會在現(xiàn)有產(chǎn)品上增加 Text-to-3D,與 VR&AR 相結(jié)合。形態(tài)方面,搭建 Discord、網(wǎng)站、本地應用、插件等多維度產(chǎn)品組合,通過增加產(chǎn)品形態(tài)來為更廣闊的客戶群提供服務(wù)。
4. 未來多模態(tài)模型的發(fā)布改變目前的單點產(chǎn)品現(xiàn)狀,Midjourney 作為功能單一的上層應用,被技術(shù)的快速進步所顛覆。
Apple 計劃將 Stable Diffusion 嵌入 Mac 和 Iphone 中,作為用戶熟悉的平臺,且使用 Apple 終端推理成本更低、速度更快,也會對 Midjourney 構(gòu)成挑戰(zhàn)。Midjourney 可能會被集成,變成多功能產(chǎn)品的一個環(huán)節(jié),甚至完全被新產(chǎn)品取代。不過 Apple 終端也并非是完美的解決方案,API 的形式將無法對垂直領(lǐng)域的模型進行特定化訓練;將應用放在本地也面臨著用戶數(shù)據(jù)收集及進一步迭代模型的困難。
雖目前無法看清該行業(yè)的終局,但作為 ToC 屬性很強的產(chǎn)品,我們認為 Midjourney 憑借著獨特的圖片風格及藝術(shù)效果、活躍的 Discord 社群帶來的絕佳用戶體驗,在一定時間內(nèi)能夠保持用戶粘性和較強的盈利能力;團隊的快速迭代能力也讓我們看好其未來的發(fā)展前景。
Reference
https://digitalnative.substack.com/p/ai-in-2023-the-application-layer
https://stratechery.com/2023/ai-and-the-big-five/
https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the-creative-economy/?sh=3028d77e2d2b
https://www.forbes.com/sites/kenrickcai/2022/09/07/stability-ai-funding-round-1-billion-valuation-stable-diffusion-text-to-image/?sh=66afb3b424d6
https://www.bloomberg.com/news/features/2023-01-31/architects-embrace-ai-art-generator-midjourney?srnd=premium-europe
https://learn.g2.com/graphic-design-statistics
https://mp.weixin.qq.com/s/6Fh76q0K0AsyqvFFRrY9Dw
作者:haina;編輯:penny;排版:Lydia;公眾號:海外獨角獸
原文鏈接:https://mp.weixin.qq.com/s/HiRGY1U-NwKF8jNVL-qQOA
本文由 @海外獨角獸 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!