Midjourney重量級更新,V6版本問世!更新後最大看點是圖像更真實、細節處理更細膩:
和上一代對比來看更直觀。
就說一道馬鈴薯燉牛腩,右邊的圖不僅菜看起來更自然、更有食欲,就連木勺的細節也沒放過(左V5.2,右V6):
再來看對人物的刻畫,V6光影等細節拉滿。相比之下,V5.2根本不是一個等級(上V6,下V5.2):
風景圖的處理也是一眼就能區分哪個更真實自然(左V5.2,右V6):
另外,新版本還有一大看頭是可以對簡單的文字進行處理了,只需要把要繪製的文字加上「引號」,比如「Hello World!」:
終於不是亂碼了!
創始人David Holz在Discord發帖公佈了V6的問世,並且表示V6是團隊從頭開始訓練的第三個模型,開發過程已持續了9個月。
總結來說,V6共有5大升級:
- 更精確且更長的提示回應
- 改進了連貫性和模型知識
- 圖像生成和混合(remix)得到了最佳化
- 新增了基礎文字繪製功能
- upscale(放大器)功能得到增強,具有「subtle」和「creative」兩種模式,解析度提升兩倍
此外,David Holz表示目前V6處於「alpha test」階段,會隨時變化,之後會升級到完整版。
這也就意味著,接下來幾周內,V6的速度、圖像品質、連貫性、提示回應和文本準確性會再次提高。
而目前V6相比於V5來說速度更慢、成本更高(大約每次imagine消耗1gpu/min,每次upscale消耗2gpu/min),但昨天已對V6做了一次更新,速度已提高2.7倍:
V6的問世,讓網友們又有新東西玩了,各種測試對比都非常火爆:
不過,要想玩好V6,再用之前的提示策略恐怕是不行了。
David Holz明確表示「V6的提示與V5有很大不同,你需要重新學習如何提示」。
效果:寫真真真
先來看一波網友們的測試效果。
讓Midjourney V5.2(左)、V6(右)畫一個酒吧,需要用燈牌標注「open late」(營業到很晚),V6畫起來毫無難度:
再來體驗一下更新後的Upscale,正常圖片是這樣嬸兒的:
Subtle(上)、Creative(下)兩種不同模式,大家更中意哪張?
Creative連鏡子裡的細節都有處理。
這裡還有和其它AI繪圖工具的比較,比如說DALL·E 3、Adobe Firefly。
Midjourney V6在不同風格的圖片繪製上,都表現出眾:
是能夠以假亂真的那種了:
甚至,V6還通過了的香煙測試。不僅煙真實,手的歲月感也刻畫得淋漓盡致:
但正如上面提到的,Midjourney V6更新的不只是效果,還有提示詞。
好在David Holz給到了一些提示小妙招,其中就包括:
- 避免使用無關緊要的詞,如award winning、photorealistic、4k、8k;
- 明確表達你想要的內容,表達明確,模型理解得更好;
- 如果你想要更具攝影感、更中立、更直接的效果,可以預設使用—style raw;
- 較低的—stylize值(預設100)可能會有更好的提示理解,而較高的值(最高1000)可能會有更好的美學效果。
我們也來簡單上手體驗一下。
開盒Midjourney V6
召喚V6的方法有三種,可以選擇在Midjourney Discord伺服器中鍵入命令「/settings」,或者在給Midjourney bot的直接消息(DM)中鍵入,然後使用頂部的下拉式功能表選擇V6,又或是在提示詞後手動輸入「—v 6.0」。
我們讓Midjourney描繪一幅跨年夜的場景,要求要有漫天飛舞的大雪,還要有一個牌子上面寫著「新年快樂」:
Please depict a New Year’s Eve scene with heavy snow falling all around, and include a sign with the words ‘Happy New Year’ on it.
該說不說,雖然很有feel,但「字」的發揮還是不穩定。
完全相同的提示詞下,V5.2版本整體偏暖色調,但這麼一看V6畫字還是很有水準的:
緊接著,點擊任意一張圖Upscale:
就可以看到兩個新的模式Subtle、Creative:
參考資料:
- https://twitter.com/chaseleantj/status/1737750592314040438
- https://twitter.com/Iamtomblake/status/1737818644388643120
- https://twitter.com/Mr_AllenT/s