別慌,AI 繪畫殺不死藝術(shù)
AI 繪畫這件事兒在近一段時間以來已經(jīng)引起了業(yè)內(nèi)人士的廣泛討論,與此同時,與 AI 繪畫相關(guān)的作圖產(chǎn)品也漸漸涌上臺面,并接受用戶評判。那么就目前已經(jīng)出現(xiàn)的 AI 繪圖產(chǎn)品,以及人工智能藝術(shù)本身的特性來說,AI 繪畫的存在是否真的會取代人類繪畫?不如來看看作者的解讀。
AI 繪畫一日,人間一年。
上半年走紅的 Dall-E 2、Midjourney,下半年風(fēng)頭完全被 Stable Diffusion 蓋過。
近期火熱的繪圖產(chǎn)品,名字里都有「diffusion」,它們均得益于人工智能「擴(kuò)散」算法。該算法突破了 AI 繪畫的應(yīng)用臨界點(diǎn),更易上手,效果更好。
機(jī)器作畫已經(jīng)有半個世紀(jì)的歷史,而兩年之內(nèi),AI 繪畫忽然成了「進(jìn)擊的巨人」,不僅質(zhì)量肉眼可見的提升,生成圖片的速度也從年初的幾個小時縮短到十幾秒鐘。
AI 繪畫技術(shù)的大幅度進(jìn)步,激發(fā)了人們對「創(chuàng)意 AI」的興趣——從美術(shù)到詩歌,一系列 AI 工具正在模仿人類的創(chuàng)造力。但沒有什么人真正覺得惶恐。
前一陣子,有不少人猜測生物學(xué)家顏寧離美歸國,是因為 AlphaFold 人工智能系統(tǒng)能夠預(yù)測蛋白質(zhì)結(jié)構(gòu),被搶了飯碗。
實(shí)際上,能寫新聞資訊的軟件早就存在,并沒有記者為此失業(yè)。AI 連寫豆腐塊的人都無法替代,更不用說能替代頂尖科學(xué)家了。
一、擴(kuò)散算法是什么?
當(dāng)下的人工智能模型,使用的都是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。自學(xué)習(xí)模型,比如 GPT-3 是其中最著名的模型,它會在大約 45 TB 文本數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)上「學(xué)習(xí)」,生成和人類產(chǎn)出相差無幾的作品。
Stable Diffusion 是深度學(xué)習(xí)家族的一部分。具體來說,Stable Diffusion 通過潛在的擴(kuò)散模型,學(xué)習(xí)圖像和文本之間的聯(lián)系。它的工作原理是,獲取圖像數(shù)據(jù),并對其添加「噪點(diǎn)」。
噪點(diǎn),也叫噪聲,是指數(shù)碼攝影器材拍攝的圖像中,存在的粗糙點(diǎn),一般受電子干擾產(chǎn)生。
一幅畫面被逐步加入噪點(diǎn),一直到整個畫面都變成白噪點(diǎn)。該模型記錄這一過程,進(jìn)行逆轉(zhuǎn),給 AI 學(xué)習(xí)。
從 AI 的角度,先看到的是一幅布滿噪點(diǎn)的畫面,再看到畫面一點(diǎn)點(diǎn)變清晰,最后成為畫作。AI 學(xué)的是整個去噪點(diǎn)的過程,特別是如何處理高斯噪聲,最后生成畫作。
高斯噪聲指的是概率密度函數(shù)服從高斯分布(即正態(tài)分布)的一類噪聲,擴(kuò)散算法添加高斯噪聲,一是為了驗證「實(shí)際」圖像的有效性,因為使用環(huán)境里的圖像都是帶噪點(diǎn)的;一是為了方便學(xué)習(xí),只要噪點(diǎn)不符合標(biāo)準(zhǔn)正態(tài)分布,就算失效。
Stable Diffusion 的基礎(chǔ)數(shù)據(jù)庫叫 LAION-Aesthetics,包含了帶圖說的圖像,還根據(jù)「審美風(fēng)格」進(jìn)行過濾。
其他經(jīng)訓(xùn)練的人工智能模型也對數(shù)據(jù)庫進(jìn)行「修正」,來預(yù)測人們?nèi)绾位卮稹改阌卸嘞矚g這幅畫」時的打分評級,以便消除一些黃暴內(nèi)容。
二、和「前輩」有何差別?
Stable Diffusion 和 Dall-E 2、Midjourney 類似,都要靠「文字描述」生成圖像。
不過,Stable Diffusion 是開源的,其基礎(chǔ)代碼也是公開的。而 Open AI 和 Google 都沒有開放自己的人工智能模型。
Stability AI 由 4000 多個英偉達(dá) A100 GPU 組成,在亞馬遜云(AWS)中運(yùn)行。據(jù)報道,Stability AI 公司的運(yùn)營和云支出成本,超過 5000 萬美元。
該公司聲稱可以提供「速度和質(zhì)量的突破」,內(nèi)存低于 10G 的 GPU 也能跑。他們還會提供運(yùn)行在 AMD、蘋果 M1/M2 芯片的版本——普通消費(fèi)者也玩得起。
目前,Stable Diffusion 的功能是,可以在幾秒內(nèi)將文本轉(zhuǎn)換為 512×512 像素的圖像;圖像可以轉(zhuǎn)換、放大、修改和替換;使用 GFP-GAN 建模,允許用戶上傳模糊的面部圖像,進(jìn)行放大或恢復(fù)原貌。
上個月,Stability AI 公司融資 1.01 億美元。首席執(zhí)行官 Emad Mostaque 畢業(yè)于牛津大學(xué),獲數(shù)學(xué)和計算機(jī)科學(xué)碩士學(xué)位,此前曾在多家對沖基金擔(dān)任分析師。
目前,該公司估值 10 億美元,除了 Stable Diffusion,還有 Dance Diffusion——可以進(jìn)行音樂剪輯。
Stability AI 的賺錢計劃是,為客戶訓(xùn)練「私有」模型和通用基礎(chǔ)設(shè)施平臺。它有一個平臺 DreamStudio,個人用戶也能訪問?,F(xiàn)在 DreamStudio 擁有超過 150 萬用戶,創(chuàng)建了 2 億張左右的圖像。算上所有渠道,Stable Diffusion 用戶超過 1000 萬。
該公司還高調(diào)聘請了 Google 科學(xué)家、未來學(xué)家 Daniel Jeffries。
三、這算藝術(shù)嗎?
隨著各種各樣的人工智能公布,相關(guān)的道德法律問題也在增多。Stable Diffusion 允許生成真人圖像,問題就愈發(fā)顯得「嚴(yán)重」。
Stable Diffusion 已經(jīng)被用戶拿來創(chuàng)作了不少敏感內(nèi)容,偽造的名人照片滿天飛。Getty Images 已經(jīng)禁止上傳 Stable Diffusion 生成的圖片,原因是擔(dān)心知識產(chǎn)權(quán)糾紛。
美國眾議院眾議員 Anna G. Eshooo 最近公開發(fā)信,敦促美國國家安全顧問和科學(xué)技術(shù)政策辦公室解決這些「不安全的模型」。
Stability AI 在公告中,公布了一份「允許商業(yè)和非商業(yè)用途的寬松許可證」,實(shí)際上就是和用戶之間的協(xié)議。它指望用戶自我規(guī)范行為,做「正確的事」,也沒什么效力處罰不遵守規(guī)則的用戶。
除了法律問題,人工智能生成作品的藝術(shù)性,也飽受懷疑。
反正美國版權(quán)局認(rèn)為這些圖像「不是藝術(shù)」。今年 2 月,版權(quán)局的審查委員會就駁回了由人工智能生成的圖片的索賠申請。
審查委員會強(qiáng)調(diào),「人類作者身份是版權(quán)保護(hù)的先決條件」,并且需要「人類思想與創(chuàng)造性表達(dá)之間的關(guān)系」。美國聯(lián)邦法院也在近期的判決中認(rèn)為人工智能不能算專利「發(fā)明人」。
人工智能藝術(shù)吸引力很大,雖然法律不承認(rèn),但市場承認(rèn)。2018 年,佳士得就以 43.5 萬美元的價格出售人工智能繪畫作品。而且,絕大多數(shù)消費(fèi)者,都分辨不出 AI 繪畫和人類畫家的作品。
最具爭議的是今年 9 月的科羅拉多州博覽會(Colorado State Fair)的美術(shù)比賽,人工智能的作品《空間歌劇院(Théatre D’opéra Spatial)》獲得頭獎,由 Midjourney 制作,操作者 Jason Allen 說「藝術(shù)已經(jīng)死了,人工智能贏了,人類輸了」。
其實(shí)倒不用一概而論,對人工智能的創(chuàng)作,既無需樂觀過頭,也不用夸大悲觀。
人工智能的藝術(shù)創(chuàng)作,是按人類的「邏輯」產(chǎn)生的,自然比不上人類精英,但超過其中的庸才,當(dāng)然是綽綽有余了。
作者:榮智慧
來源公眾號:愛范兒(ID:ifanr);連接熱愛,創(chuàng)造不同。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @愛范兒 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
AI繪畫更多的作用是提供靈感
AI繪畫可以滿足大眾的需求,如果要用再商業(yè)化應(yīng)該還是不太可能,