【プロンプト解説】Stable Diffusionで思い通りの髪型を設定する方法

Stable Diffusionで画像を生成する際に、適切なプロンプトを入力できていない場合、望む人物を適切に描写することが出来ない場合があります。

プロンプトでは「long hair」のような単一の特徴しか記述しない場合、多くのプロンプトを入力しても反映されない、または矛盾が生じておかしな画像が出力されてしまう場合があります。

思い通りの人物を生成するためには、描写に関連するプロンプト(呪文)有効的に活用することが求められます。今回PROMPTYでは人物の髪の描写に関連するプロンプトをまとめました。

なお、今回使用したモデルは「Counterfeit-V2.5」です。

各種設定は以下の通りです。

Sampling method:DPM++ 2S a Karras
Sampling steps:20
Width:512
Height:512
Batch count:1
Batch size:1
CFG Scale:7
Seed:-1
Script:None

髪の長さに関するプロンプト

プロンプトテンプレート:

1girl, blue eyes,○○{髪の長さ}を埋める, frontal face, wallpaper,

ネガティブプロンプトテンプレート:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,

髪の長さ(入力)髪の長さ(出力)
very long hair とても長い髪
absurdly long hairとても長い髪
long hair長髪
medium hair肩くらいまでの髪
short hair短髪
pixie cut短髪
very short hairとても短い短髪
bald坊主

比較画像

髪の長さをしっかりと反映した画像を生成することが出来ました。

ヘアスタイルに関するプロンプト

プロンプトテンプレート:

1girl, blue eyes,○○{髪型}を埋める, frontal face, wallpaper,

ネガティブプロンプトテンプレート:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
髪型(入力)髪型(出力)
braid ponytail三つ編み&ポニーテール
braid三つ編み
long braid三つ編み
french braid三つ編み
single braid三つ編み
twin braids三つ編み
side braid三つ編み
drill hairドリルヘア
twin drillsドリルヘア
hime cut姫カット
hair bunお団子ヘア
bowl cut hairおかっぱ
slicked back hairオールバック
forehead額の出た髪型
antenna hairアホ毛のある髪型
sidelocksもみあげの毛量が多いヘアスタイル
messy hairぼさぼさの髪型
asymmetrical hair左右非対称の髪型
dreadlocksドレッドヘア
twintailsツインテール
low twintails低い位置でのツインテール
short twintails短めのツインテール
ponytailポニーテール
side ponytailサイドポニーテール
bob cutボブカット
half updoハーフアップ

比較画像(一部抜粋)

上の画像のように、髪型をプロンプトで指定することによって、思い通りの髪型の女性を生成することが出来ます。

前髪に関するプロンプト

プロンプトテンプレート:

1girl, blue eyes,○○{前髪}を埋める, frontal face, wallpaper,

ネガティブプロンプトテンプレート:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
前髪(入力)前髪(出力)
blunt bangsぱっつん
hair over one eye目を覆う前髪
diagonal bangs斜め前髪
ahogeアホ毛
bangs pinned backピン留め
hair between eyes両目の間まで伸びる前髪

比較画像

上の画像のように、様々な前髪の女性を生成することが出来ました。

髪質に関するプロンプト

プロンプト:

1girl, blue eyes,○○{髪質}を埋める, blue hair, frontal face, wallpaper,

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
髪質(入力)髪質(出力)
bright明るい
light薄い
pale淡い
deep深みのある
glossy光沢のある
straight hair直毛
flipped hair癖毛
spiked hairトゲトゲ
wavy hairウェーブがかかった髪
curly hairカールがかかった髪

比較画像(一部抜粋)

髪質に関しては、若干分かりにくいところもありますが、色やヘアスタイルの指定とともにこのプロンプトを使用してあげるとよいでしょう。

髪色に関するプロンプト

プロンプト:

1girl, blue eyes,○○{髪質}を埋める, frontal face, wallpaper,

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
髪色(入力)髪色(出力)
black hair黒髪
brown hair茶髪
purple hair紫髪
pink hairピンク
red hair赤髪
orange hairオレンジ
yellow hair黄色
yellow green hair黄緑
green hair緑色
sky blue hair水色
blue hair青髪
blonde hairブロンド,金髪
copper hair
gray hairグレー
silver hair銀髪
white hair白髪

比較画像(一部抜粋)

プロンプトを用いて色指定をすることによって、理想の髪色の女性を生成することが出来ます。黄色と金髪の区別も問題なく行われております。

その他の髪に関する表現のプロンプト

髪の描写をより特徴的なものにする場合、ヘアアクセサリーなどの要素を追加することも有効です。ヘアアクセサリーは、キャラクターの個性を引き立てる上で効果的なプロンプトとなります。髪のプロンプトにヘアアクセサリーの使用を加えることで、魅力的な髪型を表現することができます。

プロンプト:

1girl, blue eyes,○○{その他の表現}を埋める, frontal face, wallpaper,

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,
入力出力
headphoneヘッドホン
cat ear猫耳
dog ear犬の耳
hair ornament髪飾り
bridal hair accessory花嫁風髪飾り
hair ribbonヘアリボン
headbandカチューシャ

比較画像

髪に関する複数のプロンプトを使用した画像例

上で紹介したプロンプトは、組み合わせて使用することで、より理想のイラストを生成することが出来ます。以下に、複数プロンプトを使用した画像の例をまとめました。

1.とても長い髪,金髪,片目が隠れた前髪

プロンプト:

1girl, blue eyes,very long hair, blonde, hair over one eye, frontal face, wallpaper,

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,

生成画像

2.短髪,ピンク髪,癖毛,ヘッドフォン

プロンプト:

1girl, blue eyes, short hair, pink hair, (flipped hair:1.5), headphone ,  frontal face, wallpaper,

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers, comic), nsfw,

生成画像

~Stable Diffusionで素早く画像生成するには~

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。

このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。

コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。