“離譜的AI擴(kuò)圖”火了!張張那叫一個(gè)出其不意

量子位
0 評(píng)論 1768 瀏覽 2 收藏 10 分鐘

最近,AI擴(kuò)圖這個(gè)話題在抖音上火了起來,從評(píng)論區(qū)可以看到,AI擴(kuò)圖的產(chǎn)出物,主打一個(gè)“出其不意”、“意想不到”。這篇文章里,作者就講述了現(xiàn)在出現(xiàn)的AI擴(kuò)圖,以及其對(duì)應(yīng)原理,一起來看看吧。

家人們,真的是要被抖音AI擴(kuò)圖給笑死了——

主打一個(gè)看完讓人“意想不到”、“一肚子氣”~

例如一對(duì)恩愛情侶的照片在AI擴(kuò)圖前是非常有信仰感的:

△素材來源:抖音@快樂野人

但在AI擴(kuò)圖一通“神操作”之下,畫風(fēng)簡直是180度大反轉(zhuǎn):

素材來源:抖音@快樂野人

網(wǎng)友們在看過之后哭笑不得,打趣稱“更虔誠”、“太勵(lì)志”了??。

原本許多小伙伴們是想著用它來擴(kuò)大原照片,但AI擴(kuò)圖給出的結(jié)果卻主打一個(gè)離譜

于是乎,陸陸續(xù)續(xù)便有更多網(wǎng)友開始po出他們手中AI擴(kuò)圖的神作,我們再來欣賞幾組“出其不意”。

AI擴(kuò)圖神作一,愿賜其名《牽住她的腳》

素材來源:抖音@心碎的跳一跳

AI擴(kuò)圖神作二,《十年樹木,百年樹人》

素材來源:網(wǎng)絡(luò)

AI擴(kuò)圖神作三,封神級(jí)別的《祝你幸福》

素材來源:網(wǎng)絡(luò)
……

有一說一,是有種活脫脫一部大型紀(jì)錄片《AI擴(kuò)圖傳奇》的既視感了。

然鵝,如此名場面又怎么少得了《甄嬛傳》的參與。

一、《甄嬛傳》也被擴(kuò)了一萬種可能

為了驗(yàn)證AI擴(kuò)圖是否真有這么奇葩,我們也進(jìn)行一波實(shí)測——

素材:《甄嬛傳》;軟件:剪映。

從操作角度上來說是比較簡單的,只需要打開剪映APP,上傳圖片,點(diǎn)擊“特效”、“圖片玩法”,再選擇“智能擴(kuò)圖”即可。

接下來,請(qǐng)繼續(xù)欣賞AI擴(kuò)圖的名場面……

《甄嬛頂爐西游記》:AI直接把甄嬛的背景擴(kuò)成了西方的宮廷??。

類似的還有這種……

喂一張胖橘(皇上)進(jìn)去,AI擴(kuò)圖能還給我們一張孕期照……

眾妃子們的合影,在AI擴(kuò)圖的大手筆之下,讓她們秒穿牛仔褲、運(yùn)動(dòng)鞋,穿梭在中西合璧的大街上。

還有更進(jìn)階的一種玩法——把被AI搞殘的圖片,繼續(xù)投喂給它來擴(kuò)圖。

例如我們剛才得到的胖橘孕期照,繼續(xù)AI擴(kuò)圖的結(jié)果更加“驚艷”:

對(duì),加了腿,加了行李箱,AI把照片傳遞的故事延伸到了“孕期離家出走”……

眾妃子們的故事也有了大膽的創(chuàng)新,從古裝宮廷戲碼搖身穿越到了現(xiàn)代。

不得不說,AI擴(kuò)圖,你是真給了《甄嬛傳》一萬種可能。

……

這時(shí)有小伙伴肯定問題,既然AI擴(kuò)圖這么“弱X”,為什么大家還要用它呢?

正所謂AI也有馬失前蹄的時(shí)候,剛才我們展示的也僅僅是它失敗或不合邏輯的案例。

其實(shí)在這個(gè)功能推出之后,大部分的擴(kuò)圖效果還是相當(dāng)?shù)媒o力的。

例如一對(duì)新人婚禮的局部照片,就可以擴(kuò)大場景范圍,而且是非常合理且溫馨的那種:

街拍后的照片想要擴(kuò)大背景范圍,也是可以有的。

那么接下來的一個(gè)問題便是:

二、怎么做到的?

說到AI擴(kuò)圖這事,之前Midjourney、Photoshop、DALL-E 2、Stable Diffusion等都有推出類似功能,其背后原理也有些相似之處。

像DALL-E、Stable Diffusion、Photoshop的Generative Fill等都用到了一種叫做Outpainting的技術(shù)。

Outpainting是一種圖像處理技術(shù),與Inpainting(圖像內(nèi)部填充)相反,可以根據(jù)現(xiàn)有圖像的內(nèi)容、風(fēng)格和上下文,合成與原始圖像相協(xié)調(diào)的新內(nèi)容,從而擴(kuò)展圖像的視覺范圍。

Outpainting通常依賴于深度學(xué)習(xí)模型,有基于內(nèi)容擴(kuò)散的、基于GAN的、基于語義理解的等。

此外,AI擴(kuò)圖不僅是增加像素的數(shù)量,更重要的是增加圖像分辨率的過程。

例如,CNN是AI擴(kuò)圖中常用的神經(jīng)網(wǎng)絡(luò),通過學(xué)習(xí)大量的低分辨率和高分辨率圖像對(duì),來理解圖像特征,學(xué)習(xí)如何從低分辨率重建高分辨率圖像。

超分辨率技術(shù)使得模型能夠填補(bǔ)低分辨率圖像中缺失的像素,從而生成更高分辨率的圖像。

在擴(kuò)圖過程中為了保證圖像細(xì)節(jié)還要注意細(xì)節(jié)增強(qiáng)、噪聲抑制等。

雖然目前AI擴(kuò)圖技術(shù)有了很大進(jìn)展,但實(shí)時(shí)處理能力還有待提升,通常來說更高質(zhì)量的圖像擴(kuò)展需要更多的計(jì)算時(shí)間。

現(xiàn)有的很多AI擴(kuò)圖工具生成速度已經(jīng)有了不小的提高,不過成品的質(zhì)量是否符合邏輯,這個(gè)概率還是比較隨機(jī)的。

即便AI擴(kuò)圖有時(shí)給出的結(jié)果很離譜,但這種“抽象風(fēng)”也給網(wǎng)友們帶來了不少的樂子??。

有網(wǎng)友表示,這幾天抖音最精彩的就是AI擴(kuò)圖評(píng)論區(qū)。

因?yàn)榇笮图o(jì)錄片《AI擴(kuò)圖傳奇》,還在持續(xù)更新中……

那么今天,你,AI擴(kuò)圖了嗎?

參考鏈接:

[1]https://weibo.com/6128329691/4974454526706532

[2]https://s.weibo.com/weibo?q=AI%E6%89%A9%E5%9B%BE

為我投票

我在參加人人都是產(chǎn)品經(jīng)理2023年度評(píng)選,希望喜歡我的文章的朋友都能來支持我一下~

點(diǎn)擊下方鏈接進(jìn)入我的個(gè)人參選頁面,點(diǎn)擊紅心即可為我投票。

每人每天最多可投30票,投票即可獲得抽獎(jiǎng)機(jī)會(huì),抽取書籍、人人都是產(chǎn)品經(jīng)理紀(jì)念周邊&起點(diǎn)課堂會(huì)員等好禮哦!

投票傳送門:https://996.pm/MndEQ

作者:金磊,西風(fēng)

來源公眾號(hào):量子位(ID:QbitAI),追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!
专题
19495人已学习13篇文章
本专题的文章分享了跨境支付的行业、发展、支付方式和商业等信息。
专题
12868人已学习14篇文章
在项目实际推进过程中,不加控制的需求变更往往给项目带来沉重的负担和无法预料的风险。本专题的文章分享了如何做好需求变更。
专题
18108人已学习15篇文章
语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。本专题的文章分享了语音交互的入门指南。
专题
12471人已学习15篇文章
互联网医疗是医疗行业与互联网的综合应用,其以互联网及相关技术为载体和支撑,开展线下传统或线上衍生的医疗健康服务。本专题的文章分享了对互联网医疗的分析和见解。
专题
16875人已学习12篇文章
如何搞懂财务和业务之间的关系,并推进业务系统财务模块的建设呢?本专题的文章分享了财务系统的设计指南。
专题
11845人已学习12篇文章
很多公司都在谈论数字化转型,而数字化的基础即是大量的、繁杂的、高度业务关联的基础数据。数字化运营是其中的一个分支。本专题的文章分享了如何做好数字化运营。