在這篇教學中,我們將瞭解在操作Stable Diffusion進行AI算圖時,需要輸入各式提示詞的使用方式。
提示詞概念與通用咒語
讀者可以把把Stable Diffusion的提示詞想像為搜尋引擎的關鍵字,在AI算圖過程中,Stable Diffusion會讓正面提示詞所描述的特徵出現於圖像中,並避免負面提示詞。由於提示詞的寫法會大幅影響算圖的內容與品質,因此也被許多使用者戲稱為「咒語」。
不過需要注意的是,目前Stable Diffusion僅能使用英文提示詞,尚不支援其他語言。
提示詞的基本就是要把「人時地事物」寫出來,舉例來說,比方我們想要產生「穿運動服在白天於山林跑步的少女」的圖片,就可以在正面提示詞寫「少女、陽光、山、森林、跑步、運動服」,並在負面提示詞寫「城市、建築物」。
另外,提示詞也可以寫一些提升畫面品質的詞彙,利如「傑作、高品質、最佳品質」等萬用提示詞,雖然這樣看來有點蠢,但是確實還蠻有用的。
如果讀者參考本系列教學後續的LoRA、Textual Inversion、Hypernetwork等小模型使用教學,也需要寫下對應的提示詞,詳細說明請參考後續章節。
而在撰寫過程建議分段撰寫提示詞,例如拆分為萬用提示詞、畫面特徵、小模型指示等段落,以提升閱讀與修改的方便性。可以參考下方範例
Stable Diffusion提示詞範例
正面提示詞:
(masterpiece), best quality, perfect antomy, 1 girl, solo
necklace, choker, black dress, short dress, labcoat, standing, indoors,
<lora:taeTakemiPersona5_v10:1>, Tae Takemi,
負面提示詞:
(worst quality, low quality:1.4), bad antomy,
EasyNegative , bad_prompt_version2
透過權重調整控制效果
如果算圖結果不如預期,除了可以調整提示詞之外,也可以調整各別提示詞的權重,來達到強調指定特徵的效果。
當圖片的某些特徵不夠明顯,可以在提示詞加上()提升為1.1倍權數,若是特徵太過明顯,則可加上[]降低為0.91倍權數。此外也能透過將提示詞加入冒號與權數,直接指定權數。
加權語法範例
sport suit ->運動服,1倍權數
(sport suit) ->運動服,1.1倍權數
((sport suit)) ->運動服,1.21倍權數(1.1相乘2次)
[sport suit] ->運動服,0.91倍權數
[[sport suit]] ->運動服,0.8281倍權數(0.91相乘2次)
sport suit:1.4 ->運動服,1.4倍權數
sport suit:0.6 ->運動服,0.6倍權數
此外,如果發現在使用小模型時圖像內容不太正常,則可嘗試降低權數,雖然可能會降低小模型的預期效果,但有很大的機會能讓圖像更加正常,詳細狀況筆者會在後續章節說明。
Stable Diffusion「咒語」的學問當然不只這麼簡單,筆者本人也還在摸索中,根據目前的心得,也只能說這是個玄學,且每組Checkpoint模型的特性都不一樣,沒有可以一體通用的提示詞,只能在算圖過程中不斷實驗、微調,不過這種試誤過程也成為Stable Diffusion的樂趣之一。
(回到系列文章目錄)
加入電腦王Facebook粉絲團