Midjourney 商業(yè)畫布深度分析
在人工智能技術(shù)的飛速發(fā)展下,AI圖像生成工具正成為創(chuàng)意產(chǎn)業(yè)的新寵。Midjourney,一個基于Stable Diffusion技術(shù)的AI圖像生成平臺,以其獨(dú)特的用戶界面和高質(zhì)量的圖像生成效果,迅速在廣告和藝術(shù)領(lǐng)域嶄露頭角。本文將深入分析Midjourney的商業(yè)模式、運(yùn)營策略、客戶群體以及它如何在競爭激烈的市場中實(shí)現(xiàn)“以小搏大”的成功。
Midjourney 是一個 AI 圖像生成工具,使用的底層技術(shù)是 Stable Diffusion,用戶可以在無需高級技術(shù)技能的情況下創(chuàng)建獨(dú)特且高質(zhì)量的圖像,生成圖片藝術(shù)效果非常出色,目前已被廣告商和藝術(shù)家應(yīng)用。
Midjourney 不是軟件,也不需要安裝,它是一個依托于 Discord(一款國外聊天社區(qū))之下的工具,只可在 Discord 中進(jìn)入,通過添加 Midjourney 工具機(jī)器人,輸入文字對話即可,目前已經(jīng)迭代至 V6 版本(2023年12月發(fā)布的 V6)。
一、公司基本信息
Midjourney 公司是在2021年8月成立的,由位于美國舊金山的獨(dú)立研究室 Midtrivey 開發(fā),在2022年7月開啟公測,公司在推出僅六個月后就實(shí)現(xiàn)了盈利。
這家公司成名之時(shí),團(tuán)隊(duì)僅有11名全職人員,并且其中8名都是還沒畢業(yè)的本科生,沒有投資者、沒有真正的經(jīng)濟(jì)動機(jī),沒有銷售什么產(chǎn)品或成為上市公司的壓力,他們只是想做一些酷的事情,卻在短短一年內(nèi)實(shí)現(xiàn)1億美元營收。
2023年底相關(guān)信息,團(tuán)隊(duì)成員已經(jīng)擴(kuò)大至40名。
其官網(wǎng)地址:https://docs.midjourney.com/ 。
其官網(wǎng)上的自我介紹:Midjourney 是一個獨(dú)立的研究實(shí)驗(yàn)室,探索新的思維媒介,拓展人類的想象力。我們是一個自籌資金的小團(tuán)隊(duì),專注于設(shè)計(jì)、人類基礎(chǔ)設(shè)施和人工智能。
可以看出這家公司的經(jīng)營理念:不融資,不追求團(tuán)隊(duì)規(guī)模,更關(guān)注公司盈利能力,保持小規(guī)模運(yùn)營,保持強(qiáng)獨(dú)立性。Midjourney 其實(shí)是一個實(shí)驗(yàn)室,不需要向任何人解釋業(yè)務(wù)是什么,就可以有足夠的錢來做研究。所以它沒有選擇風(fēng)投創(chuàng)業(yè),而是選擇針對一個問題,找到調(diào)研的目標(biāo)和方法,在一群人身上測試,最終并對提供的東西收費(fèi)。
二、創(chuàng)始人相關(guān)信息
Midjourney 的創(chuàng)始人兼 CEO 是 David Holz,其高中時(shí)期,曾從事設(shè)計(jì)業(yè)務(wù),大學(xué)時(shí),讀了物理和數(shù)學(xué)專業(yè),在 NASA 和 Max Planck 工作期間攻讀了流體力學(xué)博士學(xué)位,2011年,創(chuàng)辦VR領(lǐng)域的軟硬件公司 Leap Motion,2021年自籌資金創(chuàng)辦了獨(dú)立研究室 Midjourney。
David Holz 在其相關(guān)訪談中談到的一些個人觀念[1]:
Holz 認(rèn)為,技術(shù)的最大限制不是規(guī)模、成本或速度,而是我們?nèi)绾闻c之互動。不管我們有多聰明,技術(shù)有多好,我們?nèi)绾魏献鲝母旧蠜Q定了我們能做什么。這也是當(dāng)初 Leap Motion 的使命。
Holz 不喜歡用 AI 生成假照片的想法,因?yàn)楦杏X這個世界上并不缺這樣的東西,但更愿意讓其作為商業(yè)插圖?!督?jīng)濟(jì)學(xué)人》在去年六月份的雜志封面就用了 Midjourney 生成的圖片。
Holz 認(rèn)為,AI 工具可以讓藝術(shù)家在他們所做的事情上做得更好,而不是讓每個人都成為專業(yè)藝術(shù)家。Midjourney 其實(shí)并不是僅是為專業(yè)藝術(shù)家制作的,重要的是要強(qiáng)調(diào)這與藝術(shù)無關(guān)。這是關(guān)于想象力。想象力有時(shí)用于藝術(shù),但通常不僅用于藝術(shù)。
Holz 認(rèn)為 Midjourney 最大的挑戰(zhàn)是,雖然他們愿意制作多種產(chǎn)品,但挑戰(zhàn)在于產(chǎn)品不僅僅是一組功能,而且還是一個社區(qū)、一個品牌和一個愿景。因?yàn)楹茈y花一大筆錢從中購買六個未來愿景和六種不同類型的社區(qū)和產(chǎn)品。
但 Holz 也坦誠還沒有想出一種方法來擴(kuò)展它 —— 但他知道,每個產(chǎn)品公司基本上都不會嘗試一次生產(chǎn) 10 種產(chǎn)品,比如 Apple 的產(chǎn)品線就極其精簡。
當(dāng)計(jì)算機(jī)比 99% 的人類更善于視覺想象時(shí),這意味著什么?
這并不意味著我們將停止想象。
汽車比人類快,但這并不意味著我們停止步行。當(dāng)我們遠(yuǎn)距離運(yùn)輸大量物品時(shí),我們需要發(fā)動機(jī),無論是飛機(jī)、輪船還是汽車。我們將這項(xiàng)技術(shù)視為想象力的引擎。所以這是一個非常積極和人性化的事情。
關(guān)于 Midjourney 的愿景,他希望能以某種方式創(chuàng)造一個更有想象力的世界。因?yàn)榻裉焓澜缱畲蟮膯栴}是信仰崩潰,包括對自己的,對未來的信念。而造成這種問題的主要原因那就是缺乏想象力,缺乏自己可以成為什么人的想象力,缺乏對未來的想象力。所以想象力才是我們在世界上所需要的東西的重要支柱。所以我想通過 Midjourney 來將其變成一種可以「擴(kuò)展人類想象力的力量」將用戶置于充滿想象力的環(huán)境中,可以改變他們對自己和他們能做什么的信念。
我從 Leap 中吸取了很多經(jīng)驗(yàn)教訓(xùn),那就是不要試圖一上來就設(shè)計(jì)一個完整的體驗(yàn),假設(shè)你可以看到未來的10步,只做一堆東西,看看什么很酷,什么人們喜歡。然后就找到最酷的三件事,把他們放在一起,這樣就能發(fā)揮更大的協(xié)同效應(yīng)。
我們 logo 是一艘小帆船,我們是在乘船旅行中。Midjourney 的體驗(yàn)是一個聊天機(jī)器人在一個有多人的環(huán)境中,而不是試圖成為一個人。
水是危險(xiǎn)的,但它也是文明的驅(qū)動力,作為知道如何與水一起生活和共事的人,我們相處得更好。這是一個機(jī)會。它沒有意志,沒有惡意,是的,你可能淹死在里面,但這并不意味著我們應(yīng)該禁止水。當(dāng)你發(fā)現(xiàn)一個新的水源時(shí),這真的是一件好事。
三、Midjourney 的商業(yè)模式
1. 運(yùn)營模式
Midjourney 的組織結(jié)構(gòu)與很多創(chuàng)業(yè)企業(yè)模式有顯著差異。以最少的管理層和小型獨(dú)立團(tuán)隊(duì)為特征,這種結(jié)構(gòu)促進(jìn)了敏捷性和創(chuàng)新。簡化的方法使決策更快速,更能夠?qū)κ袌鲎兓陀脩舴答佔(zhàn)龀鲰憫?yīng)。這種組織模式還反映了對保持緊密協(xié)作環(huán)境的承諾,團(tuán)隊(duì)成員的每一項(xiàng)貢獻(xiàn)都直接關(guān)聯(lián)到公司的整體成功。這是一種支持自主權(quán)并鼓勵創(chuàng)造性解決問題的結(jié)構(gòu),在 AI 和技術(shù)快節(jié)奏的世界中至關(guān)重要。
外部顧問在 Midjourney 中的角色是其組織戰(zhàn)略的另一個關(guān)鍵方面。公司不依賴于傳統(tǒng)的董事會,而是依靠一群經(jīng)驗(yàn)豐富的顧問網(wǎng)絡(luò)。這包括提供戰(zhàn)略指導(dǎo)的人工智能投資者和行業(yè)資深人士,沒有傳統(tǒng)公司董事會的形式和約束。這種咨詢模式使 Midjourney 能夠從多元化的觀點(diǎn)和專業(yè)知識中受益,同時(shí)保持其獨(dú)立性和敏捷性。
2. 其與 Discord 的合作關(guān)系
最初創(chuàng)始團(tuán)隊(duì)使用 Discord 是因?yàn)橛闷溥h(yuǎn)程協(xié)作辦公,當(dāng)時(shí)構(gòu)建引入一個機(jī)器人幫助調(diào)試系統(tǒng),在調(diào)試過程中大家做了 AI 生成圖片,覺得很有趣,然后就開放給用戶,每個人都很喜歡,也看到人們實(shí)時(shí)交流想法,創(chuàng)造了富有想象力的環(huán)境。于是他們選擇直接搭載在 Discord 社區(qū)中,這使 Midjourney 具有了社交屬性。
Midjourney 已經(jīng)成為了有史以來最大的聊天機(jī)器人程序。Holz 說,許多聊天機(jī)器人都有一個誤區(qū),就是想成為人。我們設(shè)計(jì) bot 的時(shí)候想的是,這是一輛車,所有人都應(yīng)該坐在這輛車上,這樣的大家就能看到所有的風(fēng)景了 —— 沒有人和機(jī)器的對話,只有人和人的對話。所以從這個視角來看,Midjourney 的機(jī)器人只是某種協(xié)作的命令行、搜索或者空間而已。
這種設(shè)計(jì)思路,始終能讓房間內(nèi)有一個主題,而不會演變成某種肆意閑聊,大家的注意力都會隔一陣被生成的圖片所吸引。同時(shí)也能讓新來的人更好地了解產(chǎn)品。因?yàn)樗恍枰獑枴肝以撛趺醋觥?,他只需要像所有人類具有的學(xué)習(xí)能力一樣,坐下來靜靜觀察一下,然后動手嘗試,就能慢慢地掌握相關(guān)的技巧。這就像單純讓一個人生成一張「狗」的圖片,并不興奮,但是讓一群人待在一起,不斷生成「太空狗」「激光狗」等等,就能相互激發(fā)創(chuàng)造力,這樣也就構(gòu)建了一個富有想象力的環(huán)境,也能增強(qiáng)人們的想象力。
Midjourney 的 Discord 服務(wù)器中,45 歲的人和 18 歲的人一樣多,年長的人由于有更多的經(jīng)驗(yàn)和詞匯,更傾向于文字描述,而年輕人更喜歡用圖生成圖。所以最重要的是有想法,然后去測試想法, 但不帶有強(qiáng)烈的觀點(diǎn),否則你將看不到事情的本質(zhì)。事實(shí)上,構(gòu)建產(chǎn)品最重要的部分,就是對想要發(fā)現(xiàn)的事物本質(zhì),保持開放的態(tài)度。
3. 收費(fèi)模式
其收費(fèi)模式很簡單,就是采用訂閱使用的模式,分四種,價(jià)格10-120美元/月。以下為官網(wǎng)價(jià)格截圖。
4. 成本分析
盡管 Midjourney 是一家使用云服務(wù)的軟件公司,但由于需要大量投資于基礎(chǔ)設(shè)施以支持?jǐn)?shù)百萬人使用的積極訓(xùn)練的AI服務(wù),它仍然依賴資產(chǎn)密集型模式。
除了支持其小團(tuán)隊(duì)外,Midjourney 最大的開支可能主要分為三類:數(shù)據(jù)收集、數(shù)據(jù)清洗和訓(xùn)練,以及服務(wù)器成本[2]。
1. 數(shù)據(jù)收集(網(wǎng)絡(luò)爬?。?/strong>:構(gòu)建和運(yùn)行高效的網(wǎng)絡(luò)爬蟲可能很昂貴,有些服務(wù)每小時(shí)收費(fèi)約3.33美元。假設(shè) Midjourney 只爬取了一周的互聯(lián)網(wǎng)照片,大約20億張照片,每張照片只需要10毫秒來爬取。這將導(dǎo)致約55,000小時(shí)的爬取,以每小時(shí)3.33美元計(jì)算,僅為收集一周的照片可能需要花費(fèi)大約185,000美元。這還不包括支付代理以防止 IP 阻止,因?yàn)樵S多網(wǎng)站會自動阻止大規(guī)模網(wǎng)絡(luò)爬取,也不包括專門用于運(yùn)行數(shù)據(jù)收集過程的服務(wù)器成本。
2. 數(shù)據(jù)清洗與訓(xùn)練神經(jīng)網(wǎng)絡(luò):一旦數(shù)據(jù)收集完畢,仍需進(jìn)行清洗。還需考慮使用大型數(shù)據(jù)集訓(xùn)練擴(kuò)散模型的服務(wù)器成本。例如,在 Google Cloud 上訓(xùn)練小規(guī)模的生成對抗網(wǎng)絡(luò)(General Adversarial Network)或舊方法生成式人工智能圖像,每月成本可在2.5K至3.1K之間。Stable Diffusion 本身是通過在 Amazon Web Services 上使用256塊 Nvidia A100 GPU 進(jìn)行訓(xùn)練,總計(jì)150K GPU 小時(shí),成本為60萬美元。
3. 服務(wù)器成本:2022年8月接受 Verge 采訪時(shí),Holz 描述了生成此類圖像所需的計(jì)算能力?!懊繌垐D片都需要進(jìn)行 petaops 運(yùn)算。因此,成千上萬的操作。我不確定具體是五個、十個還是五十個。但生成一張圖片需要成千上萬次的操作。這可能是最昂貴的…你可以稱其為一種服務(wù)或產(chǎn)品 – 毫無疑問,以前從未有過這樣的服務(wù),普通人使用這么多的計(jì)算量?!?/p>
四、客戶群體
目前 Midjourney 有超過2000萬用戶,MJ 的主要客戶群體包括:藝術(shù)家、創(chuàng)意從業(yè)者、設(shè)計(jì)師、廣告公司等需要進(jìn)行圖像創(chuàng)作和編輯的企業(yè)和群體,以及一些體驗(yàn)圖形生成的普通用戶。根據(jù)相關(guān)創(chuàng)始人 David Holz的訪談,大約有 30%-50% 是專業(yè)人士,用來增強(qiáng)他們的創(chuàng)意和溝通過程。大多數(shù)人是普通用戶,體驗(yàn)和綻放自己的想象力。
雖然該 Midjourney 公司沒有公布最新客戶群信息,但根據(jù)相關(guān)資料,Midjourney 的客戶可能分為兩類:廣告商和藝術(shù)家。[2]
廣告商:廣告商可以求助于 Midjourney 來生成定制的圖片,無需支付圖片庫許可證或攝影師的費(fèi)用,就能輕松修改圖片。Midjourney 的長寬比混搭選項(xiàng)可能對那些希望通過修改或編輯在不同社交平臺和設(shè)備上重復(fù)使用內(nèi)容的團(tuán)隊(duì)特別有幫助。
藝術(shù)家:雖然有些人認(rèn)為人工智能藝術(shù)是與藝術(shù)家競爭的產(chǎn)物,但 Holz 說,藝術(shù)家使用 Midjourney 時(shí) “一開始會更具探索性,在很短的時(shí)間內(nèi)就能想出很多點(diǎn)子”。游戲設(shè)計(jì)師和概念藝術(shù)家也可以使用 Midjourney 作品作為基礎(chǔ),然后再進(jìn)行建模和裝配。
除了幫助藝術(shù)家在花費(fèi)數(shù)小時(shí)繪圖、建?;蚺恼罩按_定一個想法之外,其他人也將 Midjourney 用作他們工作的輸入。平面設(shè)計(jì)師可以生成背景紋理,而攝影師則可以生成新的天空。
Midjourney 這樣的生成式人工智能工具出現(xiàn)之前,藝術(shù)家們主要依靠 Pinterest、Dribble 或圖片庫等網(wǎng)站來獲取靈感。雖然這些方法可以為藝術(shù)家提供所有的素材,但只有生成式人工智能才有可能幫助藝術(shù)家在靈感階段將素材組合起來。藝術(shù)家對人工智能藝術(shù)的接受程度因創(chuàng)作者而異。
五、Midjourney 成功“以小搏大”的原因:
訓(xùn)練成本低:垂類 AI 繪畫模型的搭建和訓(xùn)練門檻相對較低,算法參考開源的Diffusion 和 CLIP 模型,同類模型 Stable Diffusion 的訓(xùn)練成本不到60 萬美元,訓(xùn)練數(shù)據(jù)集來自網(wǎng)上爬取的億級數(shù)據(jù)。
Discord 平臺優(yōu)勢:Midjourney 搭建在 Discord 平臺上,Discord 成熟的使用設(shè)施、龐大的用戶基數(shù)及社區(qū)生態(tài)賦能 Midjourney。通過先發(fā)優(yōu)勢和社區(qū)互動積累了海量用戶標(biāo)注的“文字-圖片”一致性效果數(shù)據(jù),再通過監(jiān)督學(xué)習(xí)機(jī)制不斷優(yōu)化AI 模型的生成效果,約一年時(shí)間快速迭代更新了五個版本。
獨(dú)特的藝術(shù)風(fēng)格圖像生成效果優(yōu)勢:Midjourney 形成獨(dú)特的藝術(shù)風(fēng)格、差異化競爭,用戶可以在提示詞中選擇 Midjourney 默認(rèn)藝術(shù)風(fēng)格的應(yīng)用強(qiáng)度。Version5 已率先完善手指生成畸形的難點(diǎn),大幅提升圖像的寫實(shí)細(xì)節(jié)、自然語言提示的理解能力等[3]。
六、競爭對手
1. DALL- E 2
OpenAI 的圖像生成模型 DALL-E 2 本身就是一款功能強(qiáng)大的人工智能圖像生成器,或許也是 Midjourney 最大的競爭對手。與 Midjourney 相比,DALL-E 2 完整的網(wǎng)絡(luò)應(yīng)用程序用戶界面對于尚未使用 Discord 的消費(fèi)者來說可能更容易接受。
雖然與 Midjourney 的 v5 相比,DALL-E 2 的提示質(zhì)量不太可靠,但與 Midjourney 不同的是,DALL-E 2 可以通過 API 訪問。OpenAI 的大量資金、其他人工智能模型的關(guān)注度以及非平臺使用使其成為一個強(qiáng)大的競爭對手。
2. Runway
Runway 成立于 2018 年,提供協(xié)作式視頻和圖像編輯軟件。除了實(shí)時(shí)編輯,Runway Research 的人工智能工具還提供強(qiáng)大的提示、編輯和圖像到視頻軟件。
截至 2023 年 10 月,Runway 已融資 2.365 億美元。Runway 提供功能有限的免費(fèi)試用版,其最便宜的訂閱計(jì)劃起價(jià)為每個用戶每月 15 美元。
盡管 Midjourney 用戶可以通過 Discord 進(jìn)行協(xié)作,但 Runway 的實(shí)時(shí)協(xié)作可以貫穿整個設(shè)計(jì)過程。Runway 主要面向?qū)I(yè)和企業(yè)用戶,而 Midjourney 則更多面向個人用戶。
盡管 Runway 提供了自己的人工智能圖像生成功能,但一些用戶仍然使用 Midjourney 生成圖像,例如將這兩個工具結(jié)合起來制作電影預(yù)告片。
3. Stable Diffusion
于2022年8月公開發(fā)布;據(jù)報(bào)道,其開發(fā)資金來自2019年成立的初創(chuàng)公司 Stability AI。截至 2023 年 10 月,Stability AI 已累計(jì)融資 1.238 億美元,其最新一輪融資 2500 萬美元是在 2023 年 6 月通過可轉(zhuǎn)換票據(jù)籌集的。
盡管自2015年以來就存在基于擴(kuò)散的圖像模型,但 Stable Diffusion 仍然是 DALL-E 2 和 Midjourney 的受歡迎替代方案。
Stable Diffusion 是一個開源模型,這意味著任何人都可以免費(fèi)下載和使用它。它還比 Midjourney 更具可定制性,具有更廣泛的功能和設(shè)置。
不過,Midjourney被設(shè)計(jì)為更易于普通人使用。
4. Adobe
1982年成立的 Adobe 開發(fā)了60多個軟件應(yīng)用程序,包括其創(chuàng)意和 Acrobat 套件,以支持藝術(shù)家和企業(yè)客戶的日常工作流程。截至2023年10月,Adobe 的市值達(dá)到2373億美元。
雖然自2019年以來AI已經(jīng)為 Adobe 工具如內(nèi)容感知填充提供動力,但 Adobe 在2023年3月發(fā)布 Firefly 后正式加入了AI競賽。
Firefly 是一款生成式 AI工具,被加入到創(chuàng)意云套件中,使用戶能夠生成圖像、矢量、視頻甚至3D。Adobe ?的 Firefly 旨在將人工智能融入已習(xí)慣使用 Adobe 產(chǎn)品套件的用戶的工作流程中。這意味著 Adobe 用戶可以借助熟悉的工具,如 Photoshop 中的“畫筆”工具,使用 Firefly,從而使用戶可以定義 AI 驅(qū)動編輯的特定區(qū)域。
與 Firefly 跨越各種 Adobe 應(yīng)用程序進(jìn)行集成不同,Midjourney 的主要目的是生成新圖像,而不是精確編輯或修改現(xiàn)有圖像。
5. Shutterstock
成立于2003年的 Shutterstock 是一個庫存媒體網(wǎng)站,提供照片、視頻、音頻、平面設(shè)計(jì)模板和3D素材,還有一些圖片編輯和媒體規(guī)劃工具。2023年5月,Shutterstock 發(fā)布了自己的AI圖像生成器,并公布了一個智能設(shè)計(jì)助手的候補(bǔ)名單。
與 Midjourney 相比,Shutterstock 提供了更多類型的媒體,Midjourney 只提供圖像。
盡管 Midjourney在用戶控制和靈活性方面對庫存圖像具有一般優(yōu)勢,但Shutterstock 的新生成式 AI 工具和 AI 設(shè)計(jì)助手可能會滿足現(xiàn)有的 Shutterstock 用戶;它甚至可能利用其廣泛的 SEO 覆蓋率來實(shí)現(xiàn)分銷優(yōu)勢。通過快速的谷歌搜索很容易找到 Shutterstock 圖像,而相比之下,Midjourney 缺乏平臺外訪問的能力也可能使其在與 Shutterstock 的基于 Web 的生成器相比處于劣勢[2]。
六、商業(yè)畫布
參考資料:
[1]https://www.aixinzhijie.com/article/6815438
[2]https://research.contrary.com/company/midjourney
[3]https://stock.hexun.com/2023-04-07/209428047.html
編輯:Agcl 校對:Jie
本文由人人都是產(chǎn)品經(jīng)理作者【圈圈】,微信公眾號:【lovepm】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Midjourney官網(wǎng)截圖
- 目前還沒評論,等你發(fā)揮!