揭秘Midjourney的兩大功能碰撞
Midjourney這一產品,相信大多數(shù)人都不陌生了,這篇文章里,作者就介紹了Midjourney的兩個功能,分別為sref和cref,一起來看看它們的工作原理和功能應用吧。
Midjourney是一個強大的文本到圖像的人工智能模型,它允許用戶通過輸入文本提示來生成獨特的圖像。Midjourney使用兩種不同的參考方式來幫助用戶控制圖像的生成:sref和cref。
下面來分別介紹下–sref和 –cref的區(qū)別和使用方法(注意:–cref和–sref目前只適用于 niji 6 和 v6 模型。)
一、sref功能介紹
sref(style reference)是一種參考方式,它允許用戶指定一個或多個圖像作為風格參考。Midjourney將使用這些參考圖像來幫助生成具有類似風格的圖像。
sref風格介紹
sref可以用來控制圖像的整體外觀和感覺。例如,你可以使用sref來生成具有以下風格的圖像:現(xiàn)實主義、超現(xiàn)實主義、抽象主義、表現(xiàn)主義、印象派、野獸派、立體主義、達達主義、超現(xiàn)實主義、波普藝術。
二、cref功能介紹
cref(content reference)是一種參考方式,它允許用戶指定一個或多個圖像作為內容參考。Midjourney將使用這些參考圖像來幫助生成具有類似內容的圖像。
cref的工作原理與墊圖(image prompt)較為相似,都比較注重圖片特征,不過最大的區(qū)別是sref生成的是相同風格,墊圖是基礎創(chuàng)作。
cref風格介紹
MJ官方表示cref這個功能更適合用于動漫或游戲,相對來說人物不大適用與真實照片cref可以用來控制圖像中包含的內容。例如,你可以使用cref來生成包含以下內容的圖像:動漫及游戲人物、動物、植物、風景、建筑、交通工具、食物、物品。
三、cref基礎使用方法
首先我們點擊左上角?上傳一張或多張圖像,這里我們選擇的用人物圖像去生成,選圖需注意:選擇一張清晰、正臉或者側臉、光線較好、最好不遮擋五官的真人肖像照片作為角色參考,點擊發(fā)送,用imagine輸入提示詞和尺寸后加上–cref URL 并輸入圖片的地址,再使用 –cw 來調試參數(shù)配置,切記–cref 目前只適用于 niji 6 和 v6 模型。
默認的參數(shù)是100(–cw 100),如果追求與圖片相似度極高可將參數(shù)調(–cw 80到–cw 100),如想更加貼合關鍵詞描述生成,可拓展性更強些可將參數(shù)調(–cw 0到–cw 30),–cref對人物發(fā)飾和服飾還原度能更高些不過對于面部、五官并不能百分百的還原,不過辦法總比困難多,經(jīng)過反復測試我發(fā)現(xiàn)可以通過對該圖的面部特征進行詳細描述還是可以有效提升人物的面部相似度。
此外參考圖像的質量對生成圖像的質量有很大的影響。因此,在選擇參考圖像時,請務必選擇高質量的圖像。高質量的圖像應該具有以下特點:
- 高分辨率
- 清晰銳利
- 光線充足
- 沒有模糊或失真
cref實例
(–cw0)時
The girl wearing a denim suit tied a ponytail –ar 9:16 –cref https://s.mj.run/s9ahb_ilI0s –v 6.0 –cw 0
(–cw50)時
The girl wearing a denim suit tied a ponytail –ar 9:16 –cref https://s.mj.run/s9ahb_ilI0s –v 6.0 –cw 50
(–cw100)時
The girl wearing a denim suit tied a ponytail –ar 9:16 –crefhttps://s.mj.run/s9ahb_ilI0s–v 6.0 –cw 100
關鍵詞翻譯:穿牛仔套裝的女孩扎著馬尾辮
不難發(fā)現(xiàn)(–cw 0)時生成的圖像雖然還原度不是很高不過對關鍵詞的描述還是很精準的。(–cw 100)時生成的圖像還原度雖然很高不過對于關鍵詞的提煉不夠精準。(–cw 30到–cw 60)相對來說無論對圖像的還原度還是對關鍵詞的可控性能都能較穩(wěn)定些。
四、sref基礎使用方法
跟cref使用的方式相似首先我們點擊左上角?上傳一張或多張圖像,這里我們選擇自己喜歡風格的圖像去生成,比如賽博朋克風、波點風、像素風等,然后點擊發(fā)送,用imagine輸入提示詞和尺寸后加上–sref URL 并輸入圖片的地址,切記–sref 目前只適用于 niji 6 和 v6 模型。
1. Sref高階使用的方法
與cref步驟保持一致,只不過要在輸入圖片地址后面再使用 –sw 來調試參數(shù)配置,默認的參數(shù)是100(–sw 100),如果想關閉可將參數(shù)調至0(–sw 0),如果想將風格最大的強度還原可將參數(shù)調至1000(–sw 1000)。
2. Sref實例
(–sw100)時
Girl, wearing a beret, a windbreaker, cool boots, holding a baseball bat in hand –ar 9:16 –srefhttps://s.mj.run/KG-wdaBGNdo–v 6.0 –sw 100
(–sw500)時
Girl, wearing a beret, a windbreaker, cool boots, holding a baseball bat in hand –ar 9:16 –srefhttps://s.mj.run/KG-wdaBGNdo –v 6.0 –sw 500
(–sw0)時
Girl, wearing a beret, a windbreaker, cool boots, holding a baseball bat in hand –ar 9:16 –srefhttps://s.mj.run/KG-wdaBGNdo –v 6.0 –sw 0
關鍵詞翻譯:女孩子戴上貝雷帽身穿風衣,穿著炫酷的靴子手拿著棒球棒
(–sw 0)時生成的圖像風格還原度不是很高不過對關鍵詞的描述還是很精準的。(–sw 100)和(–sw 500)時生成的圖像不但風格還原度很高同時也能對于關鍵詞的提煉更加夠精準。
五、cref與sref結合實例
Cyberpunk style, girl, wearing beret, windbreaker, cool boots, holding baseball bat in hand –ar 9:16 –crefhttps://s.mj.run/s9ahb_ilI0s–v 6.0 –cw 20 –sw 500 –srefhttps://s.mj.run/KG-wdaBGNdo
關鍵詞翻譯:賽博朋克風格,女孩戴貝雷帽身穿風衣,酷靴,手里拿著棒球棍
首先我們點擊左上角?上傳一張或多張人物圖像然后再上傳一張參考風格的圖像點擊發(fā)送,用imagine輸入提示詞和尺寸后加上–cref URL 并輸入人物圖片的地址,再使用 –cw 來調試人物參數(shù)配置,再把參考風格的圖像鏈接放入,再加上–sw調節(jié)風格的參數(shù)即可。上圖是我測試的一個案例,整體效果還是非常不錯的。
今天的分享到這里就結束了,總的來說sref和cref功能還是很強大的,需要大家多去練習,才能靈活運用到自己的工作場景中~
作者:張俊楓
來源公眾號:58UXD(ID:i58UXD),58UXD,全稱58同城用戶體驗設計中心。
本文由人人都是產品經(jīng)理合作媒體 @58UXD 授權發(fā)布。未經(jīng)許可,禁止轉載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!