Stable Diffusionで画像を生成する際に、適切なプロンプトを入力できていない場合、望む人物を適切に描写することが出来ない場合があります。
プロンプトでは「long hair」のような単一の特徴しか記述しない場合、多くのプロンプトを入力しても反映されない、または矛盾が生じておかしな画像が出力されてしまう場合があります。
思い通りの人物を生成するためには、描写に関連するプロンプト(呪文)有効的に活用することが求められます。今回PROMPTYでは人物の髪の描写に関連するプロンプトをまとめました。
なお、今回使用したモデルは「Counterfeit-V2.5」です。
各種設定は以下の通りです。
Sampling method:DPM++ 2S a Karras
Sampling steps:20
Width:512
Height:512
Batch count:1
Batch size:1
CFG Scale:7
Seed:-1
Script:None
髪の長さに関するプロンプト
プロンプトテンプレート:
1girl, blue eyes,○○{髪の長さ}を埋める, frontal face, wallpaper,
ネガティブプロンプトテンプレート:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
髪の長さ(入力) | 髪の長さ(出力) |
very long hair | とても長い髪 |
absurdly long hair | とても長い髪 |
long hair | 長髪 |
medium hair | 肩くらいまでの髪 |
short hair | 短髪 |
pixie cut | 短髪 |
very short hair | とても短い短髪 |
bald | 坊主 |
比較画像
髪の長さをしっかりと反映した画像を生成することが出来ました。
ヘアスタイルに関するプロンプト
プロンプトテンプレート:
1girl, blue eyes,○○{髪型}を埋める, frontal face, wallpaper,
ネガティブプロンプトテンプレート:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
髪型(入力) | 髪型(出力) |
braid ponytail | 三つ編み&ポニーテール |
braid | 三つ編み |
long braid | 三つ編み |
french braid | 三つ編み |
single braid | 三つ編み |
twin braids | 三つ編み |
side braid | 三つ編み |
drill hair | ドリルヘア |
twin drills | ドリルヘア |
hime cut | 姫カット |
hair bun | お団子ヘア |
bowl cut hair | おかっぱ |
slicked back hair | オールバック |
forehead | 額の出た髪型 |
antenna hair | アホ毛のある髪型 |
sidelocks | もみあげの毛量が多いヘアスタイル |
messy hair | ぼさぼさの髪型 |
asymmetrical hair | 左右非対称の髪型 |
dreadlocks | ドレッドヘア |
twintails | ツインテール |
low twintails | 低い位置でのツインテール |
short twintails | 短めのツインテール |
ponytail | ポニーテール |
side ponytail | サイドポニーテール |
bob cut | ボブカット |
half updo | ハーフアップ |
比較画像(一部抜粋)
上の画像のように、髪型をプロンプトで指定することによって、思い通りの髪型の女性を生成することが出来ます。
前髪に関するプロンプト
プロンプトテンプレート:
1girl, blue eyes,○○{前髪}を埋める, frontal face, wallpaper,
ネガティブプロンプトテンプレート:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
前髪(入力) | 前髪(出力) |
blunt bangs | ぱっつん |
hair over one eye | 目を覆う前髪 |
diagonal bangs | 斜め前髪 |
ahoge | アホ毛 |
bangs pinned back | ピン留め |
hair between eyes | 両目の間まで伸びる前髪 |
比較画像
上の画像のように、様々な前髪の女性を生成することが出来ました。
髪質に関するプロンプト
プロンプト:
1girl, blue eyes,○○{髪質}を埋める, blue hair, frontal face, wallpaper,
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
髪質(入力) | 髪質(出力) |
bright | 明るい |
light | 薄い |
pale | 淡い |
deep | 深みのある |
glossy | 光沢のある |
straight hair | 直毛 |
flipped hair | 癖毛 |
spiked hair | トゲトゲ |
wavy hair | ウェーブがかかった髪 |
curly hair | カールがかかった髪 |
比較画像(一部抜粋)
髪質に関しては、若干分かりにくいところもありますが、色やヘアスタイルの指定とともにこのプロンプトを使用してあげるとよいでしょう。
髪色に関するプロンプト
プロンプト:
1girl, blue eyes,○○{髪質}を埋める, frontal face, wallpaper,
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
髪色(入力) | 髪色(出力) |
black hair | 黒髪 |
brown hair | 茶髪 |
purple hair | 紫髪 |
pink hair | ピンク |
red hair | 赤髪 |
orange hair | オレンジ |
yellow hair | 黄色 |
yellow green hair | 黄緑 |
green hair | 緑色 |
sky blue hair | 水色 |
blue hair | 青髪 |
blonde hair | ブロンド,金髪 |
copper hair | 銅 |
gray hair | グレー |
silver hair | 銀髪 |
white hair | 白髪 |
比較画像(一部抜粋)
プロンプトを用いて色指定をすることによって、理想の髪色の女性を生成することが出来ます。黄色と金髪の区別も問題なく行われております。
その他の髪に関する表現のプロンプト
髪の描写をより特徴的なものにする場合、ヘアアクセサリーなどの要素を追加することも有効です。ヘアアクセサリーは、キャラクターの個性を引き立てる上で効果的なプロンプトとなります。髪のプロンプトにヘアアクセサリーの使用を加えることで、魅力的な髪型を表現することができます。
プロンプト:
1girl, blue eyes,○○{その他の表現}を埋める, frontal face, wallpaper,
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
入力 | 出力 |
headphone | ヘッドホン |
cat ear | 猫耳 |
dog ear | 犬の耳 |
hair ornament | 髪飾り |
bridal hair accessory | 花嫁風髪飾り |
hair ribbon | ヘアリボン |
headband | カチューシャ |
比較画像
髪に関する複数のプロンプトを使用した画像例
上で紹介したプロンプトは、組み合わせて使用することで、より理想のイラストを生成することが出来ます。以下に、複数プロンプトを使用した画像の例をまとめました。
1.とても長い髪,金髪,片目が隠れた前髪
プロンプト:
1girl, blue eyes,very long hair, blonde, hair over one eye, frontal face, wallpaper,
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
生成画像
2.短髪,ピンク髪,癖毛,ヘッドフォン
プロンプト:
1girl, blue eyes, short hair, pink hair, (flipped hair:1.5), headphone , frontal face, wallpaper,
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
生成画像
~Stable Diffusionで素早く画像生成するには~
Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。
このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。
推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。
2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。
コスパを重視する方は、RTX 3060を選ぶと良いでしょう。
このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。