【プロンプト解説】Stable Diffusionで三面図を作成する方法

Stable Diffusionでは適切なプロンプトを入力することでキャラクターの三面図を作成することができます。

今回は「caulkinumv2ForAnime(HOG)」と拡張機能である「ADetailer」を使用して三面図を作成していきます。

三面図を作成するプロンプト

プロンプトテンプレート:

masterpiece,high quality,virtual youtuber, girl, ○○ hair,○○ eyes(好きな髪色と目の色), (concept art, official art,full body)(three sided view:1.3), simple background

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,username:1.2), nsfw

詳細設定は以下の通りです。

Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
Batch count:10
Batch size:1
CFG Scale:7
Seed:-1
Script:None

半分くらいの確率で二面図も出力されてしまうため、今回は複数画像を一気に出力し、その中から三面図を選んでいこうと思います。

生成画像

今回は9番が良さそうなので9番目の写真を保存しました。

問題なく三面図を出力することができました。

三面図のキャラの表情差分も作ってみた

次にキャラクターの立ち絵だけでなく、表情差分も作ってみましょう。

まずはシード値を任意の数に設定します。今回のシード値は”167890812235″です。

①三面図を作成

プロンプト:

masterpiece,high quality,virtual youtuber, girl,blue medium hair,blue eyes, (concept art, official art,full body)(three sided view:1.3), simple background

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,username:1.2), nsfw

生成画像:

この三面図を基に表情差分を作っていきましょう。

②表情差分を作る

今回は「ADetailer」を使って表情差分を出力します。

プロンプト:

masterpiece,high quality,(extreamly detailed face),virtual youtuber, girl, blue medium hair, blue eyes

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,username:1.5), nsfw

ADetailerのプロンプト:

○○(感情を表すプロンプト)

例えば以下の画像の通りです。

生成画像:

問題なく表情差分を出力することができました。

Stable Diffusionで素早く画像生成するには

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。