ComfyUI,AIGC工作流的啟示
今年,ChatGPT的火熱和Midjourney、Stable Diffusion等產(chǎn)品的火熱,讓AIGC這個概念影響了大多數(shù)人。大家在擔憂AI工具將自己替代的同時,也在考慮如何將AIGC產(chǎn)品融入到我們的工作流程中;而ComfyUI,就是這么一款工具。
在我過去的文章里有說過,產(chǎn)品經(jīng)理是“幫助團隊交付正確產(chǎn)品給用戶的人”。從客戶需求挖掘到最后產(chǎn)品使用體驗,產(chǎn)品經(jīng)理要確保產(chǎn)品價值能夠端到端地傳遞給用戶,產(chǎn)品經(jīng)理需打破團隊成員的分工壁壘,這考驗著產(chǎn)品經(jīng)理綜合能力和素質(zhì),這也是產(chǎn)品經(jīng)理的領導力的體現(xiàn)。
如今,隨著ChatGPT、Midjourney、StableDiffusion等生成模型帶動起來的熱潮,AI大模型正逐漸滲透到各種產(chǎn)品和服務中,越來越多的產(chǎn)品經(jīng)理也在考慮將AIGC(AI生成內(nèi)容)能力融入到自己的產(chǎn)品中,然而這并非易事,在項目實踐的過程中產(chǎn)品經(jīng)理面臨著諸多的挑戰(zhàn)和困惑……
一、AIGC的產(chǎn)品管理挑戰(zhàn)
在傳統(tǒng)的互聯(lián)網(wǎng)產(chǎn)品的開發(fā)流程中,產(chǎn)品原型圖是不可或缺的工具。產(chǎn)品經(jīng)理或交互設計師通常會使用Axure、Sketch或Figma等工具,投入主要的時間繪制線框圖,并通過頁面流程圖來闡釋產(chǎn)品的交互邏輯。通過這種方法,團隊成員能直觀地理解產(chǎn)品的最終呈現(xiàn)效果,方便地討論問題并形成共識,從而保證最終交付的產(chǎn)品體驗與預期保持一致。這是過去十幾年來,互聯(lián)網(wǎng)和軟件行業(yè)一直奉行的最佳實踐。
然而在AIGC產(chǎn)品中,用戶更關心的是AIGC的數(shù)據(jù)體驗,而不是界面的交互體驗,傳統(tǒng)的體驗設計范式已經(jīng)不再適用。例如,著名圖片生成工具Midjourney以對話機器人的形式呈現(xiàn),用戶只要在Discord中和它對話就能獲得高質(zhì)量的圖片,因為Midjourney很清楚地知道:用戶更關心的是我們能不能根據(jù)提示詞生成優(yōu)質(zhì)的圖片,而不是別的什么東西。
題外話:“知道自己應該做什么,并把它做到極致”——正因如此才讓這只有十幾人的小團隊能完成1億美元的年營收。這是我們每一個創(chuàng)業(yè)者和產(chǎn)品經(jīng)理都需要學習的能力。
因為AIGC產(chǎn)品體驗的重心已從界面轉(zhuǎn)向了數(shù)據(jù)。由于許多產(chǎn)品經(jīng)理對數(shù)據(jù)和AI算法了解不足,讓他們在技術溝通上遇到了極大的挫敗感,而且傳統(tǒng)的原型設計工具在應對AI產(chǎn)品時也顯得力不從心,無法保證最終的交付效果和預期的一致性。對于一些想應用AIGC能力的產(chǎn)品經(jīng)理而言,不僅AI模型是個不可解釋的黑盒,連AI產(chǎn)品的研發(fā)過程也變成了一個不可知的黑盒。
正所謂“拿著舊地圖無法抵達新大陸”,在新時代,我們應該放棄舊的思維方式擁抱新的工具和新方法。
二、AIGC工作流(Workflow)
ComfyUI,作為一款廣受歡迎的圖片生成的開源項目,為AIGC內(nèi)容創(chuàng)作者提供了強大的助力。ComfyUI進一步拓寬了Stable Diffusion的創(chuàng)作可能性。ComfyUI通過節(jié)點流程的界面設計,讓用戶可以輕松拖拽、連接不同的模型、模塊和參數(shù),形成高度定制和可復用的Workflow(AIGC工作流),而用戶無需編寫任何代碼。它可以幫助我們實現(xiàn)更加豐富和定制化的數(shù)據(jù)體驗。
另外,ComfyUI還有以下優(yōu)勢:
- 易于共享與協(xié)作:支持工作流的導出和分享,不僅加速了項目開發(fā),也為團隊間的學習和交流創(chuàng)造了條件。
- 良好的性能優(yōu)化:其內(nèi)存管理和按需加載機制確保在資源受限的環(huán)境下,仍能加載大模型生成高質(zhì)量圖像。
- 可擴展性:用戶可以輕松添加自定義節(jié)點、插件和模型,社區(qū)已貢獻了200多個自定義節(jié)點,為工作流的設計和優(yōu)化提供了豐富的選擇。
ComfyUI本質(zhì)上是AIGC的Pipeline(數(shù)據(jù)處理管道)的可視化構建工具,它將Stable Diffusion的運行機制顯性化的展示在我們面前。在圖形生成的過程中,ComfyUI能夠?qū)崟r為我們呈現(xiàn)數(shù)據(jù)處理的過程。讓我們在設計和調(diào)試的時候,可以快速定位和解決問題。
ComfyUI不僅僅是讓AIGC創(chuàng)作者可以更自由地創(chuàng)作,它的流程邏輯的可視化、可復用以及數(shù)據(jù)的實時可驗證,不就等同于產(chǎn)品原型構建工具么?
在產(chǎn)品融圖、營銷海報和視頻素材等應用場景中,AIGC正在發(fā)揮極大的價值。目前,一些前沿的團隊已經(jīng)在使用ComfyUI改進他們的工作方式,產(chǎn)品經(jīng)理將ComfyUI作為產(chǎn)品原型設計工具,深度參與到模型訓練和AIGC工作流的構建中,然后再交由開發(fā)人員和算法工程師進一步優(yōu)化,最后轉(zhuǎn)化成可穩(wěn)定運行的Pipeline部署到正式環(huán)境中。
通過ComfyUI的可視化節(jié)點式工作流,產(chǎn)品經(jīng)理和開發(fā)團隊的溝通與協(xié)作得到了促進,使項目團隊能在早期快速搭建和驗證項目原型,縮短開發(fā)周期,降低試錯成本,確保產(chǎn)品需求和體驗目標的一致性,從而更好地實現(xiàn)端到端的產(chǎn)品體驗目標。
三、UE藍圖系統(tǒng)的啟示
拖拽式的節(jié)點編程并不是ComfyUI的獨創(chuàng),例如,Blender、Maya和Unreal Engine(虛幻引擎)也提供了類似的功能。
虛幻引擎的藍圖系統(tǒng)通過提供豐富的節(jié)點庫和強大的可視化編程環(huán)境,使用戶能夠在無需編寫代碼的情況下構建復雜的游戲邏輯。
藍圖系統(tǒng)的高度可定制性和擴展性,允許用戶創(chuàng)建自定義節(jié)點,甚至可以與傳統(tǒng)的編程代碼無縫集成,直接打包成跨平臺的游戲,不僅為游戲開發(fā)提供了強大而靈活的解決方案,也縮短了從概念到可交付產(chǎn)品的時間周期。這種方式使游戲設計師、藝術家和小型工作室能快速地制作出可運行的游戲產(chǎn)品,極大地豐富了游戲創(chuàng)意的表達。
得益于虛幻引擎的強大表現(xiàn)力和無需編程的創(chuàng)作方式,使得其他行業(yè)的專家也可以使用虛幻引擎來實現(xiàn)想法。這也讓其成為一款貫通各行各業(yè)的三維擬真創(chuàng)作工具,從游戲行業(yè)跨足至建筑設計、工業(yè)設計、城市規(guī)劃和廠房規(guī)劃等眾多領域。
可視化的節(jié)點編程和模塊化設計極大地降低了編程門檻,促進了不同背景的團隊間的協(xié)作和交流,吸引了來自更多不同領域的創(chuàng)作者共同豐富產(chǎn)品應用場景和生態(tài)。
這也為ComfyUI提供了啟示:強大的可視化和模塊化能力不僅降低了產(chǎn)品開發(fā)和發(fā)布的門檻,還拓寬了創(chuàng)意和協(xié)作的空間,使得想法可以快速轉(zhuǎn)化為實際可交付的產(chǎn)品成為可能,從而更好地滿足不同用戶和市場的需求。這就是“引擎”的魅力。
四、展望未來
目前,得益于ComfyUI的自定義節(jié)點的可擴展性,已有開發(fā)者創(chuàng)建了ChatGPT節(jié)點,為圖像生成工作流賦予了大語言模型的思考能力,能快速生成提示詞,可以方便快速創(chuàng)作大量的內(nèi)容。如下圖所示:
展望未來,隨著ComfyUI自定義節(jié)點的豐富化,它將不僅局限于Stable Diffusion的圖像生成能力,而會整合更多領域的AI模型,逐漸成為一個多模態(tài)的AIGC產(chǎn)品構建工具。未來也可能會出現(xiàn)類似虛幻引擎的多模態(tài)AI引擎平臺,能直接將AIGC工作流打包成高可用和可交付的產(chǎn)品。
另外,由于企業(yè)級項目對硬件資源有較高要求,ComfyUI主要部署在團隊的云端服務器上,這也將催生團隊在線協(xié)同的需求,為創(chuàng)業(yè)者提供新的機會。我相信未來的ComfyUI在線版本可能會借鑒Figma的在線協(xié)同功能,讓團隊成員能共同參與AIGC工作流的搭建,為AIGC產(chǎn)品開發(fā)帶來前所未有的在線協(xié)作體驗。
結(jié)語
十年前,許多產(chǎn)品經(jīng)理通過學習《網(wǎng)站藍圖:Axure RP高保真網(wǎng)頁原型制作》這本書,步入了互聯(lián)網(wǎng)產(chǎn)品領域。然而,在AIGC產(chǎn)品領域,Axure已無法滿足現(xiàn)今的需求。
正如“拿著舊地圖無法抵達新大陸”一樣,當我們拿著舊“藍圖”時也難以創(chuàng)造新產(chǎn)品?,F(xiàn)在,AIGC工作流已成為我們需要學習和掌握的新“藍圖”的能力。
通過學習和應用ComfyUI,產(chǎn)品經(jīng)理和創(chuàng)業(yè)者能更深入地理解AI原理和工作方式,獲得更為順暢技術溝通能力。同時,通過快速構建和驗證AI模型,我們可以確保產(chǎn)品需求與體驗的一致性,大幅縮短產(chǎn)品開發(fā)周期。
掌握ComfyUI的AIGC工作流,產(chǎn)品經(jīng)理和創(chuàng)業(yè)者不僅能自信應對AI產(chǎn)品開發(fā)的挑戰(zhàn),還能探索和實現(xiàn)創(chuàng)新的產(chǎn)品設計,樹立在AIGC領域的領導力。
AIGC掀起的熱潮也僅僅只有半年多的時間,技術正飛速發(fā)展和迭代,新事物層出不窮,在這個行業(yè)沒有多年經(jīng)驗的老師傅。不管你是創(chuàng)業(yè)者還是產(chǎn)品經(jīng)理,如果想轉(zhuǎn)行到AIGC領域,現(xiàn)在是學習的最佳時機,只要學習的速度夠快,你就可能成為該領域的專家。通過掌握ComfyUI,你能為未來的職業(yè)發(fā)展和團隊協(xié)作打下堅實的基礎,更好地適應這個行業(yè)的發(fā)展和需求。
專欄作家
PM熊叔,微信公眾號:PM熊叔,人人都是產(chǎn)品經(jīng)理專欄作家。教育類產(chǎn)品產(chǎn)品經(jīng)理出身,學過設計,做過開發(fā),做過運營的產(chǎn)品經(jīng)理。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
寫得太好了!干貨滿滿的同時也很有啟發(fā)性!