Stable Diffusionでは適切なプロンプトを組み込むことで思い通りの画像を生成することができます。今回は驚いた女性の画像を生成していきます。
今回は下記のプロンプトをもとに、モデルや表情を変更して驚いた表情の女性を生成していきます。
プロンプトテンプレート:
ネガティブプロンプト:
Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
Batch count:1
Batch size:1
CFG Scale:7
Seed:-1
Script:None
表情のプロンプトに重きを置く場合「(〇〇{表情を埋める}:〇〇{数字を埋める})」の形で強調します。
アニメ調の驚いた女性
まずは「Counterfeit-V2.5.vae.pt」を使い、アニメ調の驚いた顔の女性を生成していきます。
驚いた顔:surprised
プロンプト:
ネガティブプロンプト:
生成画像:

驚きつつ、少し困ったような表情の画像が出力されました。
驚愕した表情:flabbergasted
プロンプト:
ネガティブプロンプト:
生成画像:

驚愕し、少し怒っているように見える表情の画像が出力されました。
驚愕した表情:astonished
プロンプト:
ネガティブプロンプト:
生成画像:

同じく驚愕した表情ですが、こちらの画像は上で出力した画像に比べ表情が柔らかいように感じます。
呆気に取られた表情:stunned
プロンプト:
ネガティブプロンプト:
生成画像:

呆気に取られたような表情の画像が出力されました。
啞然とした表情:dumbfounded
プロンプト:
ネガティブプロンプト:
生成画像:

啞然とした表情の画像が出力されました。少し悲しそうな表情に見えます。
ショックを受けた表情:shocked
プロンプト:
ネガティブプロンプト:
生成画像:

ショックを受けたような表情の画像が出力されました。
リアルな驚いた女性
次にリアルな女性のさまざまな照れた顔をモデル「chilloutmix_NiPrunedFp32Fix」と「basil mix」を使用して生成していきます。
驚いた顔:surprised
プロンプト:
ネガティブプロンプト:

「chilloutmix_NiPrunedFp32Fix」使って出力しました。
驚いたような表情の画像が出力されました。
驚愕した表情:flabbergasted
プロンプト:
ネガティブプロンプト:
生成画像:

「basil mix」を使って出力しました。
驚愕した表情の画像が出力されました。少し怒っているようにも見えます。
驚愕した表情:astonished
プロンプト:
ネガティブプロンプト:
生成画像:

「basil mix」を使って出力しました。
こちらも同じく、驚愕した表情が出力されました。上の画像よりも驚いているように見えます。
呆気に取られた表情:stunned
プロンプト:
ネガティブプロンプト:
生成画像:

「basil mix」を使って出力しました。
呆然とし、呆気に取られた画像が出力されました。
啞然とした表情:dumbfounded
プロンプト:
ネガティブプロンプト:
生成画像:

「basil mix」を使って出力しました。
啞然とした表情が出力されました。
shocked:ショックを受けた表情
プロンプト:
ネガティブプロンプト:
生成画像:

「basil mix」を使って出力しました。
ショックを受けた表情の画像が出力されました。困っているようにも見えます。
~Stable Diffusionで素早く画像生成するには~
Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。
このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。
推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。
2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。
コスパを重視する方は、RTX 3060を選ぶと良いでしょう。
このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。