OpenAI一夜顛覆AI繪畫!DALL·E 3+ChatGPT強(qiáng)強(qiáng)聯(lián)合,畫面直接細(xì)節(jié)爆炸
可以看到,最新發(fā)布的DALL·E 3,不僅省去了提示詞工程,還把語言理解能力提升了一個(gè)檔次。具體DALL·E 3展示的效果體現(xiàn)出了哪些能力和細(xì)節(jié)?一起跟著作者來看看吧。
起猛了,OpenAI竟然把AI繪畫和ChatGPT合 并 了!
這不,最新發(fā)布的DALL·E 3,直接給AIGC帶來了兩大震撼——
- 提示詞門檻極大降低
- 理解語意的細(xì)微差異的細(xì)節(jié)描述,準(zhǔn)確到令人發(fā)指
沒錯(cuò),新版DALL·E 3,不僅省去了提示詞工程,還順帶把語言理解能力提升了一個(gè)檔次!
你只管隨意想象。詞,ChatGPT幫你拓展;畫,DALL·E 3給你精確到細(xì)節(jié)。
AI就能像拍電影一般,保證從背景到人物,細(xì)節(jié)一字不差地復(fù)刻出來:
滿月下的街道,熙熙攘攘的行人正在享受繁華夜生活。
街角攤位上,一位有著火紅頭發(fā)、穿著標(biāo)志性天鵝絨斗篷的年輕女子,正在和脾氣暴躁的老小販討價(jià)還價(jià)。
這個(gè)脾氣暴躁的小販身材高大,老道,身著一套整潔西裝,留著引人注目的小胡子,正在用他那部蒸汽朋克式的電話興致勃勃地交談。
除了基礎(chǔ)細(xì)節(jié),DALL·E 3甚至能將模糊的形容詞如繁華、討價(jià)還價(jià)、脾氣暴躁演繹得活靈活現(xiàn),和CLIP已經(jīng)不在一個(gè)檔次了。
同時(shí),相比上一代老模型,DALL·E 3自身的畫技也前進(jìn)了一大步:
這般操作,直接把網(wǎng)友看愣了。
有網(wǎng)友已經(jīng)決定取消Midjourney訂閱了?!叭绻鸐idjourney無法準(zhǔn)確理解文本,這甚至稱不上是同臺(tái)競(jìng)技?!?/p>
還有網(wǎng)友調(diào)侃,這簡(jiǎn)直就是給即將到來的谷歌Gemini上壓力。
更多細(xì)節(jié),我們從DALL·E 3展示的效果一一來看。
一、在ChatGPT里直接用
相比前兩代,DALL·E 3最大的優(yōu)勢(shì)在于原生構(gòu)建在ChatGPT之上。
不僅意味著語言理解能力大幅飛躍,甚至提示詞都可以讓ChatGPT自己來寫。
更多細(xì)節(jié)藏在奧特曼都忍不住自夸可愛的宣傳視頻里。
這是一個(gè)家長(zhǎng)把5歲小朋友腦海里的幻想變成現(xiàn)實(shí)的故事。
首先家長(zhǎng)詢問ChatGPT,“我家5歲寶寶一直在說一個(gè)’超級(jí)向日葵刺猬’,它該長(zhǎng)什么樣?”
可以看到ChatGPT同時(shí)寫了四段不同風(fēng)格的提示詞,并給出對(duì)應(yīng)圖像。
家長(zhǎng)選擇其中偏童話插圖風(fēng)格的一張后,故事的主角小刺猬形象似乎就能固定下來了,可以繼續(xù)請(qǐng)ChatGPT畫出更多。
順便給小刺猬一個(gè)名字Larry,后面的對(duì)話中就不用每次都說“超級(jí)向日葵刺猬”了。
主角定好了,接下來再添加更多元素,讓整個(gè)童話故事更豐富,比如給Larry畫個(gè)房子。
這里既展示出了DALL·E 3創(chuàng)作一致形象的能力,也展示出郵箱上正確寫上了LARRY的名字,解決了之前版本DALL·E不會(huì)寫字的問題。
反正都用上ChatGPT了,不如把故事情節(jié)也完善一下?
剛編好的情節(jié)立馬就可以有配套的插畫了。
保持角色形象,遷移到完全不同的貼紙畫風(fēng)也沒問題,可以直接打印出來。
注意了,最絕的地方來了,直接讓ChatGPT總結(jié)前面對(duì)話中所有內(nèi)容,寫成一個(gè)完整的睡前故事。
雖然演示到此結(jié)束,但完全可以想象配合ChatGPT插件功能,還可以直接生成一本電子書出來。
就讓人想起之前網(wǎng)友提議,確保AI安全的最佳方法是讓OpenAI、Anthropic等公司的員工都有孩子。
這樣他們就有動(dòng)力確保AGI到來時(shí)世界是安全的。(手動(dòng)狗頭)
雖然DALL·E 3現(xiàn)在還不能馬上玩到,一次放出的大量樣張也可以先看個(gè)飽了。
每一張點(diǎn)開還可以看到提示詞,都是直接用人話描述,沒怎么加復(fù)雜咒語的那種。
復(fù)雜場(chǎng)景與不存在的概念組合,效果很驚艷。
搞室內(nèi)設(shè)計(jì)概念圖,光影明暗關(guān)系乍看也挑不出毛病。
配合正確寫字能力,直出海報(bào)也是生產(chǎn)力拉滿(沒指定文字的小字部分還有些問題)。
剛加入OpenAI不久的德?lián)銩I之父Noam Brown也曬出了他試玩的機(jī)器人打牌圖。
CEO奧特曼最喜歡的則是這張“牛油果看醫(yī)生”。
有網(wǎng)友去試了同樣的提示詞用在DALL·E 2的效果,只能說字也不對(duì)、牛油果中間的洞沒話出來,治療是更是沒有……
還記得2021年1月DALL·E 1剛出的時(shí)候嗎?夢(mèng)開始的地方就是一組“牛油果做的沙發(fā)”。
也難怪網(wǎng)友感嘆:看看它走了多遠(yuǎn)!
二、“如有侵權(quán),請(qǐng)來刪圖”
當(dāng)然,除了上述特性以外,OpenAI也預(yù)告了一些神奇的新功能。
例如,DALL·E 3即將配套推出一個(gè)圖像鑒別器。
這個(gè)分類器可以幫助識(shí)別圖像是否由DALL·E 3生成,不僅能避免誤傷(手動(dòng)狗頭),也能在DALL·E創(chuàng)作出好作品時(shí)快速將它認(rèn)領(lǐng)成自己的。
至于在生成圖像上,OpenAI自述也做了大量工作,防止其生成暴力、色情或其他有害圖片,或是帶有公眾人物(明星、名人等)姓名的圖像生成。
關(guān)于隱私方面,之前紐約時(shí)報(bào)就曾爆料稱,OpenAI正在通過某些技術(shù),模糊掉上傳到ChatGPT的圖像中的人臉。
這也是為了避免ChatGPT變成一個(gè)徹底的“人臉識(shí)別工具”,尤其是已經(jīng)有不少照片流傳到互聯(lián)網(wǎng)上的名人明星們。
如今這個(gè)技術(shù)可能也被用到了DALL·E 3中,防止生成侵權(quán)圖像。
同時(shí),OpenAI也與安全紅隊(duì)合作,提高了圖像風(fēng)險(xiǎn)評(píng)估的能力。
除此之外,在訓(xùn)練數(shù)據(jù)上,有了Midjourney的“前車之鑒”,OpenAI這次也學(xué)會(huì)了保護(hù)自己。
相比于直接和畫手打官司、或者等著被起訴,OpenAI在官網(wǎng)放出了一則訓(xùn)練數(shù)據(jù)“免責(zé)聲明”:
您可以填寫表格,禁止我們的網(wǎng)絡(luò)爬蟲GPTBot訪問您的網(wǎng)站。或者,您也可以發(fā)送您想要保護(hù)隱私的圖像,我們會(huì)把它從訓(xùn)練數(shù)據(jù)中刪掉。
不過也有網(wǎng)友對(duì)DALL·E 3演示效果不滿意,認(rèn)為比不上MidJourney資深玩家出的圖,OpenAI的資金可是充裕n多倍啊。
還有網(wǎng)友開啟列文虎克模式,開始挨個(gè)挑演示圖中漏掉的提示詞細(xì)節(jié)。
比如這張杯子里缺少微型閃電。
這張散落在海底的只有大炮殘骸,沒有寶藏。
具體這些問題能不能通過調(diào)整提示詞改善,就要等實(shí)際上手玩過才知道了。
那么DALL·E 3具體什么時(shí)候上線呢?劃重點(diǎn)了:
- ChatGPT Pro會(huì)員(20美元/月)和企業(yè)版在10月可用。
- 獨(dú)立版在今年秋天晚些時(shí)候提供(目前價(jià)格15美元可以玩115次)。
參考鏈接:
[1]https://openai.com/dall-e-3
[2]https://www.nytimes.com/2023/07/18/technology/openai-chatgpt-facial-recognition.html
[3]https://twitter.com/sama/status/1704547625482203560
作者:夢(mèng)晨,蕭簫
來源公眾號(hào):量子位(ID:QbitAI),追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
未來國(guó)內(nèi)大模型也會(huì)收費(fèi)嘛
會(huì)員太貴