對(duì)話西喬:關(guān)于AI繪畫人們關(guān)心的幾件事
編輯導(dǎo)語(yǔ):2022年,以DD為代表的最新一批AI繪畫工具出圈了,原因不止是技術(shù)層面的突破,更在于其生成圖,給人們帶來(lái)了視覺(jué)沖擊。那么,AI繪畫正在給人們帶來(lái)哪些變化?人們?cè)谧兓杏秩绾涡袆?dòng)呢?本文作者帶著這些疑問(wèn)與設(shè)計(jì)師西喬進(jìn)行探討后,總結(jié)出了這篇文章,一起來(lái)學(xué)習(xí)一下吧。
上個(gè)月,當(dāng)我在文章中提及AI繪畫工具Disco Diffusion(下稱DD)時(shí),它還僅被我當(dāng)做一個(gè)例證,用來(lái)證明AI從事創(chuàng)意性內(nèi)容的局限,因?yàn)樗苯佑脕?lái)生成人臉、動(dòng)物還存在缺陷,需要人力加工。但AI繪畫工具的迭代和升級(jí),遠(yuǎn)超我的想象。DDv5.6新更新的portrait generator模組,就大幅提升人臉生成效果。雖然某些角度還是會(huì)有變形,或者看上去帶有“玻尿酸感”,但是越來(lái)越像“人”了。
(文章配圖均來(lái)自西喬的生成圖,有額外標(biāo)注和水印除外)
雖然在AI發(fā)展的時(shí)間線上,調(diào)教AI畫畫并不是一件新鮮事,早在2015年谷歌就推出過(guò)DeepDream,初試AI的“藝術(shù)創(chuàng)作能力”。但在2022年,以DD為代表的最新一批AI繪畫工具的出圈,不僅源于技術(shù)層面的突破,更在于其生成圖,所帶來(lái)的視覺(jué)沖擊。
人們愈發(fā)認(rèn)真地,討論AI繪畫是否會(huì)對(duì)美術(shù)行業(yè)產(chǎn)生影響——即使它可能無(wú)法真正替代人類藝術(shù)家,但它目前所展現(xiàn)的生產(chǎn)力,已經(jīng)足以有效地輔助人類創(chuàng)作,成為底稿、成為素材、成為靈感。
除了成為設(shè)計(jì)師、插畫師的工具,AI繪畫也向普通人鋪開(kāi)畫布,無(wú)需美術(shù)基礎(chǔ),通過(guò)對(duì)照教程,編寫描述詞、調(diào)節(jié)參數(shù),就能夠用文字的想象交換圖像成果。并且擁有一些“平易近人”的應(yīng)用,比如和菜頭拿它來(lái)畫公眾號(hào)的封面,兩個(gè)月里封圖來(lái)源已經(jīng)從某某圖庫(kù)/版權(quán),變成了“和菜頭的小肉手”。
鑒于行業(yè)里已經(jīng)有專業(yè)對(duì)口的文章科普技術(shù)原理,介紹各類AI繪畫工具及使用教程。我更好奇的,是AI繪畫正在給人們帶來(lái)哪些變化,以及人們?cè)谧兓腥绾涡袆?dòng)。
帶著這些疑問(wèn)我找到了西喬。她是一名設(shè)計(jì)師、漫畫《神秘的程序員》的主創(chuàng)。今年5月起,她幾乎全身心投入AI繪畫的嘗試中,除了每天跑圖,也看論文、寫科普。她對(duì)AI繪畫抱以極大的期待,相信“AI對(duì)藝術(shù)及插畫的沖擊,等同另一次‘相機(jī)的發(fā)明’,藝術(shù)史又可以分冊(cè)了?!?/p>
如果你想找到“AI繪畫工具是什么”的答案,建議閱讀更專業(yè)系統(tǒng)的文章,比如西喬公眾號(hào)里的教程(神秘的程序員們:coderstory)。但如果你好奇AI繪畫“和我有什么關(guān)系” “我能用它做什么” “它會(huì)帶來(lái)什么”,不妨接著往下讀。
01 AI繪畫怎么突然出圈了
中文網(wǎng)絡(luò)中關(guān)于AI繪畫的討論,集中出現(xiàn)在今年4月。隨美術(shù)圈、程序圈從業(yè)者的使用和交流,AI繪畫工具DD逐漸被更多人知曉。這是一個(gè)GitHub開(kāi)源項(xiàng)目,尚未封裝,在谷歌Colab中以代碼的形式呈現(xiàn),其繪制過(guò)程,可以簡(jiǎn)單概括為輸入關(guān)鍵詞就能生成圖像。相較于早前AI繪畫的刻板風(fēng)格,缺少整體美感以及完成度欠佳,DD在構(gòu)圖、色彩、氛圍感等方面,都呈現(xiàn)很大突破。
與此同時(shí),OpenAI結(jié)合擴(kuò)散模型和CLIP在今年4月提出的DALL·E 2,DD作者Somnai所在公司推出的Midjourney等工具也開(kāi)始進(jìn)入人們的討論和使用。設(shè)計(jì)師、插畫師開(kāi)始制作“從0開(kāi)始學(xué)習(xí)AI繪畫”教程,例如@JZ_打個(gè)比方在B站發(fā)布教學(xué)視頻,@Simon_阿文在微博持續(xù)更新AI繪畫資料,又或者人們?cè)谥跤懻摗跋馾isco diffusion這類ai繪畫會(huì)對(duì)美術(shù)行業(yè)產(chǎn)生什么樣的影響?”
和大多數(shù)專業(yè)畫師一樣,西喬被AI繪畫擊中的原因,是因?yàn)椤翱赡苄浴?/strong>。這種“可能性”既可以像PS、3D輔助軟件等工具帶來(lái)的創(chuàng)作流程的變革,也能夠在內(nèi)容上帶來(lái)的解放,“它能夠幫助我去創(chuàng)造一些我之前不會(huì),甚至不敢去創(chuàng)造的風(fēng)格?!?/p>
但比起將AI視為“創(chuàng)作者”,西喬認(rèn)為更合適的表述是,AI是她畫布上的另一只手。有時(shí)可以“放手”,交給AI自己去跑,會(huì)帶來(lái)很多意想不到的驚喜。例如在她《西藏往事》的系列作品中,AI在雪山頂上放了一個(gè)塔吊。 在Prompt (提詞)設(shè)計(jì)和無(wú)盡頭的參數(shù)分析機(jī)調(diào)整之外,還有另一種具有高可控性的玩法。當(dāng)畫師對(duì)于生成圖的結(jié)果有預(yù)期目標(biāo)時(shí),可以通過(guò)設(shè)計(jì)底圖、設(shè)置底圖跳過(guò)步數(shù)(跳過(guò)步數(shù)越多,AI生成圖越接近底圖)進(jìn)行人工引導(dǎo)?;蛉〉蒙蛇^(guò)程中的中間步驟,對(duì)中間步驟進(jìn)行修改后放回AI里繼續(xù)生成。還可以根據(jù)同一提詞,調(diào)整參數(shù)輸出多組結(jié)果,在后期中人工選擇更符合創(chuàng)作者預(yù)期的局部進(jìn)行合成甚至重繪等形式進(jìn)行二次創(chuàng)作。 兩只手畫畫,正帶給她創(chuàng)作的解放,探索學(xué)習(xí)新知識(shí)的樂(lè)趣、以及一種近乎于開(kāi)盲盒的快樂(lè),“晚上寫好隊(duì)列,等早上起來(lái)?yè)靾D,只是費(fèi)點(diǎn)電,獲得的快樂(lè)是一樣的。”而且比起盲盒有限的選擇,AI繪畫能夠完成的組合,理論上是無(wú)限大的。 有賴于專業(yè)的愛(ài)好者編譯的中文資料、保姆式教程、封裝的程序、支持中文描述詞的AI繪畫工具,AI繪畫逐漸出現(xiàn)“出圈”的苗頭,進(jìn)入大眾討論語(yǔ)境。比如和菜頭自今年5月以來(lái),多次推文介紹AI繪畫。 技術(shù)的向下兼容,讓AI繪畫為更多普通人打開(kāi)繪畫的可能性。畢竟繪畫對(duì)于大多數(shù)人來(lái)說(shuō),要么是一扇從沒(méi)有打開(kāi)過(guò)的門,要么就是有著很高門檻。但通過(guò)AI,卻能讓一部分從沒(méi)有試過(guò)畫畫的人,不需要依賴多年學(xué)習(xí)和經(jīng)驗(yàn)積累,就能夠去創(chuàng)造圖像。 “人們創(chuàng)造圖像的直覺(jué)是與生俱來(lái)的。你會(huì)發(fā)現(xiàn)很多人畫畫的巔峰其實(shí)是在小時(shí)候,隨著他逐漸長(zhǎng)大,接受越來(lái)越多已有的視覺(jué)繪制模式,后天的輸入就把這種直覺(jué)覆蓋了?!?/p>
當(dāng)先天的圖像創(chuàng)作直覺(jué)被現(xiàn)實(shí)規(guī)訓(xùn)后,“多數(shù)人試圖去創(chuàng)作的,不是憑借直覺(jué)把腦子里的東西畫出來(lái),而是盡可能讓自己畫的東西符合現(xiàn)有的繪畫,比如模仿照片、模仿別人的畫,涂填色書(shū),等慢慢發(fā)現(xiàn)自己在模仿上差距太遠(yuǎn),就放棄畫畫這件事了。” 當(dāng)“繪畫”可以像“自拍”一樣,能夠用于分享,滿足成就感時(shí),AI繪畫工具或許能幫助普通人找到被偷走的自由,享受到創(chuàng)作帶來(lái)的快樂(lè)。為此,一些AI繪畫平臺(tái)也正在利用這一價(jià)值實(shí)現(xiàn)商業(yè)回報(bào),例如提供將AI生成畫印刷成掛畫的服務(wù),以供用戶購(gòu)買實(shí)物。 DD這類通過(guò)文字生成圖像的AI繪畫工具,繞不來(lái)一個(gè)叫“CLIP”的模型,它是AI如何“理解”人類語(yǔ)義這一問(wèn)題的關(guān)鍵。CLIP (Contrastive Language–Image Pre-training),是一種基于對(duì)比的圖片-文本學(xué)習(xí)的跨模態(tài)預(yù)訓(xùn)練模型,由OpenAI于去年1月發(fā)布。同一時(shí)間發(fā)布的,還有初代DALL·E圖片生成模型。 DD正是運(yùn)用CLIP來(lái)“理解”用戶輸入的文本,再使用擴(kuò)散模型來(lái)生成圖像。這一過(guò)程可以理解為:給AI輸入文本關(guān)鍵詞,它基于訓(xùn)練數(shù)據(jù)集的學(xué)習(xí),從一堆噪點(diǎn)中把這個(gè)圖像反推出來(lái),通過(guò)不斷進(jìn)行文本與圖像的匹配,檢查搜索結(jié)果是否符合文字描述,進(jìn)而逐步消除噪聲,添加細(xì)節(jié),最終生成圖像。 “宇航員騎馬”和“馬騎宇航員”是解釋AI理解語(yǔ)義的一個(gè)常用例子,AI有能力描繪前者,但由于后者的“反經(jīng)驗(yàn)”,就不那么容易實(shí)現(xiàn)。 AI得以生成帶有風(fēng)格化的圖像,也源自于數(shù)量龐大的訓(xùn)練數(shù)據(jù)集灌輸?shù)漠嫾绎L(fēng)格。以DD為例,prompt是影響生成圖中一個(gè)重要的構(gòu)成因素,包含作品媒介、描繪對(duì)象或主題、各種風(fēng)格和質(zhì)感的修飾詞、參考藝術(shù)家等。 根據(jù)西喬的實(shí)驗(yàn)和理解,AI會(huì)提煉一個(gè)藝術(shù)家畫作中特征,比如整體創(chuàng)作的主題和對(duì)象、筆觸、肌理、明暗度、調(diào)色板等。其學(xué)習(xí)成果也受到畫家部分作品知名度和主題多樣性的影響,像是AI所理解的塞尚、雷諾阿這樣的畫家,其特征可能源于所有的作品,但如果一些畫家有特別出名的作品,那么該幅畫的特征權(quán)重也會(huì)相對(duì)較高。 例如,西喬使用DD生成一幅藍(lán)色海洋風(fēng)景畫,將畫家設(shè)定為卡斯帕·大衛(wèi)·弗里德里希(Caspar David Friedrich),發(fā)現(xiàn)生成的多幅的作品都帶有黑衣背影。她推斷這一元素出自弗里德里希的《霧海旅人》。 (左為西喬的AI生成畫,右為《霧海旅人》) 除了學(xué)習(xí)藝術(shù)作品、畫家的國(guó)籍、文化背景也會(huì)影響AI的理解。例如使用中國(guó)藝術(shù)家畫建筑,就會(huì)看起來(lái)很像中國(guó)風(fēng),使用畫日漫的藝術(shù)家輸出肖像畫,人物大概率能是錐子臉,眼睛也比正常的大。 上圖是基于同一張底圖生成的肖像實(shí)驗(yàn)。除了參考藝術(shù)家之外,題詞和參數(shù)都相同。左圖參考藝術(shù)家為anime girl,右圖參考藝術(shù)家是陳逸飛。 理解AI如何“思考”,從而調(diào)節(jié)描述詞的編寫方式和技巧,也是為了讓AI更好地“理解”創(chuàng)作者意圖。 (如何編寫描述詞,是教程的一大內(nèi)容) 從目前行業(yè)已有的應(yīng)用來(lái)看,AI繪畫工具對(duì)于“繪畫”的改變將會(huì)是系統(tǒng)性的——在創(chuàng)作過(guò)程中,作為生產(chǎn)工具提供新的技能點(diǎn);成為藝術(shù)品的新變量,影響作品創(chuàng)作風(fēng)格和價(jià)值;以NFT、拍賣畫等形式,直接參與藝術(shù)品市場(chǎng)交易。 在AI繪畫工具輔助創(chuàng)作的維度上,它可以被用于生成底圖,畫師以其為底稿,進(jìn)行二次創(chuàng)作,或者直接用作遠(yuǎn)景貼圖。 畫師也可以通過(guò)簡(jiǎn)單的色塊勾出底稿,交給AI生成“幻想生物”,作為靈感素材。 在AI繪畫工具的介入下,工具鏈將可能面臨重新整合,從AI生成的十幾張結(jié)果中挑選,用作插畫創(chuàng)作中的局部素材,再利用PS或其他的鼠繪工具進(jìn)行調(diào)光、調(diào)色、邊緣處理、紋理整合等。 另一方面,AI也正在成為影響藝術(shù)評(píng)價(jià)的新變量。 “藝術(shù)品的價(jià)值評(píng)判標(biāo)準(zhǔn)就是很主觀的,而且這個(gè)評(píng)價(jià)也不是一成不變的。一個(gè)新的流派、新的媒介誕生之初,肯定是存在一個(gè)接受和過(guò)渡的時(shí)期?!比藗儗?duì)于AI繪畫的評(píng)判,在當(dāng)下必然是需要面臨不少爭(zhēng)議的。 但隨著AI繪畫的普及,人們是沿用已有的評(píng)價(jià)體系去看AI繪畫,還是說(shuō)會(huì)出現(xiàn)一套適用于AI畫的評(píng)論標(biāo)準(zhǔn),目前還難說(shuō)。西喬認(rèn)為,這可能會(huì)成為接下來(lái)幾年里藝術(shù)史研究、藝術(shù)評(píng)論家的選題,學(xué)者會(huì)尋找到一套他的評(píng)價(jià)體系,大眾也會(huì)選擇自己的標(biāo)準(zhǔn)。 (對(duì)于AI生成圖的兩極化評(píng)價(jià)) 在她看來(lái),盡管AI繪畫工具正展現(xiàn)出不錯(cuò)的生產(chǎn)力,但就實(shí)際應(yīng)用的場(chǎng)景,還是存在較大差異的。比如AI特別擅長(zhǎng)產(chǎn)出場(chǎng)景概念圖,這一特點(diǎn)會(huì)使它在游戲、動(dòng)漫、設(shè)計(jì)等領(lǐng)域里有著不錯(cuò)的表現(xiàn),用于輔助創(chuàng)作。但如果拿去做工業(yè)設(shè)計(jì),生成產(chǎn)品或者設(shè)計(jì)服裝,尚未展現(xiàn)出足夠的應(yīng)用能力。 此外,影響一項(xiàng)技術(shù)是否投入于商用,有兩個(gè)需要考慮的內(nèi)容,第一是否滿足需求,第二衡量投入產(chǎn)出比。就目前而言,AI輸出圖片的尺寸還比較小,由于切片算法和模型的局限D(zhuǎn)D在生成寬邊超過(guò)1280的圖時(shí),布局會(huì)很不理想。MidJourney最大為(1664,1664)、DALL·E 2(1024,1024)。如果要做出一個(gè)能夠被打印的尺寸,需要經(jīng)過(guò)后期放大或者再生成。 至于AI生成畫直接被用于售賣,已經(jīng)有過(guò)行業(yè)先例。2018年一幅由巴黎藝術(shù)團(tuán)體Obvious使用GAN(生成對(duì)抗網(wǎng)絡(luò))完成的肖像畫拍出432500美元。 也有AI繪畫平臺(tái)及創(chuàng)作者將生成畫鑄造成NFT,但這筆買賣也面臨很大的不確定性,比起想通過(guò)NFT賺得盆滿缽滿,AI挑戰(zhàn)圖庫(kù)的生意,或許更為現(xiàn)實(shí)。 隨著AI繪畫工具的普及,部分功能也有著被挪用,造成負(fù)面影響的可能。例如通過(guò)添加“蒙版”可以對(duì)圖像的部分內(nèi)容進(jìn)行重新繪制,將一張大象的背影更改為大象的正面照,或者在空無(wú)一物的茶幾上,自然地放進(jìn)一個(gè)蘋果。 工具對(duì)所有人的想象開(kāi)放,意味著它既可以被用來(lái)進(jìn)行藝術(shù)創(chuàng)作和表達(dá),也可能在別有用心的人的使用下,成為偽造圖像,制造假新聞的“兇器”。 前車之鑒是能替換視頻中視覺(jué)和音頻內(nèi)容的“Deepfakes”,被用于偽造名人色情視頻、欺詐勒索、假新聞等內(nèi)容,而遭限制使用。2019年,在國(guó)內(nèi)一夜爆紅的AI換臉應(yīng)用“ZAO”,也受到用戶隱私、信息安全等問(wèn)題的質(zhì)疑。 除卻用戶使用上造成可見(jiàn)的“垃圾內(nèi)容”,在AI的圖像學(xué)習(xí)過(guò)程中,也不可避免地吸納了人類認(rèn)知中對(duì)于性別、職業(yè)、種族的刻板印象和偏見(jiàn),并潛移默化反映在AI繪畫的生成結(jié)果中。 為應(yīng)對(duì)上述可能存在的負(fù)面影響,AI繪畫工具的開(kāi)發(fā)者們所采取的,是以謹(jǐn)慎的開(kāi)放、更長(zhǎng)的內(nèi)測(cè)期、調(diào)試圖像描述詞的過(guò)濾器等方式,加之控制。 由國(guó)內(nèi)開(kāi)發(fā)者設(shè)計(jì)的AI繪畫工具Tiamat,向用戶解釋為什么內(nèi)測(cè)周期較長(zhǎng)時(shí)寫道,“AI生成藝術(shù)是一個(gè)比較敏感,也是全新的領(lǐng)域,里面的不可控性,合規(guī)性,以及用戶體驗(yàn)都需要我們多次迭代,包括其中的云端部署,模型調(diào)整等等,我們也很希望TIA盡早和大家相見(jiàn),但客觀上技術(shù)是不允許的?!?/p>
OpenAI的訂閱郵件顯示,DALL·E在近期的更新中,“減少了對(duì)于人種的偏見(jiàn),更準(zhǔn)確地反映世界人口的多樣性?!蔽磥?lái),還將根據(jù)用戶的反饋和標(biāo)記進(jìn)一步優(yōu)化。 至于開(kāi)發(fā)者們對(duì)過(guò)濾器的調(diào)試,目前仍處在摸索階段。從西喬的個(gè)人體驗(yàn)來(lái)看,她多次被過(guò)濾器“絆倒”。 (系統(tǒng)疑似把“懸崖邊祈禱”判定為“消極內(nèi)容”) AI繪畫另一大被詬病的問(wèn)題是“侵權(quán)的邊界”,就目前而言這是一個(gè)灰色地帶,且尚未有行業(yè)定論。 以DD為例,工具遵循MIT開(kāi)源協(xié)議,理論上生成圖可以免費(fèi)商用。但在實(shí)際使用中也會(huì)存在,因?yàn)槊枋鲈~使用造成的畫風(fēng)雷同,這就容易造成抄襲爭(zhēng)議。此外,“如果你用別人的作品‘墊’成底圖,再把skip開(kāi)得很高,最終出來(lái)的結(jié)果,也是很難定義是否構(gòu)成作品侵權(quán)?!?/p>
事實(shí)上,界定真人畫手是否抄襲,是否構(gòu)成侵權(quán)也存在種種復(fù)雜的爭(zhēng)議,放到AI繪畫的侵權(quán)問(wèn)題上,或許也需要足夠多的經(jīng)驗(yàn)和案例,形成行業(yè)認(rèn)知。 最后西喬也補(bǔ)充到,AI繪畫也有面臨“負(fù)反饋”的可能,即人們用AI繪畫工具生成的圖像,又進(jìn)一步作用于AI的優(yōu)化和訓(xùn)練中,“AI 模型可能會(huì)呈現(xiàn)類似放大器的效果,最后會(huì)是出現(xiàn)什么情況,大家現(xiàn)在是不知道的?!?/p>
西喬喜歡拿“相機(jī)”比喻AI繪畫,“相機(jī)剛誕生的時(shí)候成像非常慢,暗房沖洗也很麻煩,設(shè)備的攜帶及使用都不便,成像效果也不一定好?!碑?dāng)時(shí)的肖像畫畫家們,對(duì)于拿相機(jī)拍攝人像,有很多的批評(píng)和嘲諷。 “但我們知道在幾十年之后,畫家?guī)缀醵紩?huì)使用相機(jī)拍攝的照片作為繪畫時(shí)的參考。因?yàn)橐惶靸?nèi)光線的變化非??欤愕哪L匾膊惶敢庠谀莾鹤蠋讉€(gè)小時(shí)。” 不僅是肖像畫、風(fēng)景畫,以照片為基礎(chǔ)后期加工完成的數(shù)字繪畫創(chuàng)作等,或多或少都因?yàn)橄鄼C(jī)應(yīng)用,帶來(lái)藝術(shù)形式變革。 而在社會(huì)層面,“照相”也從一種背靠特定階級(jí)的特定生活方式,走進(jìn)市民階級(jí),記錄社會(huì)變遷和普通人的日常生活。這種技術(shù)力的解放和擴(kuò)散,隨今天智能手機(jī)發(fā)展尤盛,普通人以更低廉的成本,更便捷的使用,掌握相機(jī)的攝影攝像能力。 可以預(yù)見(jiàn)的是,AI繪畫工具的技術(shù)迭代用不了像“相機(jī)”發(fā)展所需的幾十上百年。除了上文提到的DD、DALL·E 2、Midjourney等工具,互聯(lián)網(wǎng)大廠們也相繼入局,谷歌的Imagen/Parti、Meta的Make a scene、微軟的NUWA等等。國(guó)內(nèi)的開(kāi)發(fā)者們也致力于接壤全球AI藝術(shù)的浪潮,例如正在舉辦“千人共創(chuàng)-AI藝術(shù)創(chuàng)作大賽”的Tiamat。 人們對(duì)于AI繪畫的使用和認(rèn)知,時(shí)間尚短,其影響力目前還是更多的存在于藝術(shù)圈和程序圈。但在未來(lái),AI繪畫是否能像“相機(jī)”那樣,跨越階級(jí)、圈層,浸潤(rùn)進(jìn)普通人生活,是一件引發(fā)足夠遐想的事情。 作者:雙橋君;編輯:枕溪;公眾號(hào):互聯(lián)網(wǎng)指北 本文由@ 互聯(lián)網(wǎng)指北 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。 題圖來(lái)自Unsplash,基于CC0協(xié)議02 AI繪畫工具如何“理解”
03 給繪畫行業(yè)帶來(lái)什么
04 可能存在的負(fù)面影響
05 結(jié)語(yǔ)
現(xiàn)在的AI繪圖做的都很好,也有一些以教為主的軟件
好震撼啊,感覺(jué)這些Al繪畫好逼真,做的好好啊,不管正面負(fù)面影響,感覺(jué)都有巨大意義