Stable Diffusionで画像生成を行う際に、思った通りの独自の構図やアングルの画像が出力されないことはないでしょうか。
Stable Diffusionで思い通りの画像を生成するためには、描写に関連するプロンプト(呪文)を有効的に活用することが求められます。
今回PROMPTYでは、Stable Diffusionで思い通りの構図・アングルで画像を生成できるプロンプトをまとめました。
今回の記事内で掲載している画像は「AnythingV5」を使用し、作成しています。
Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
Batch count:1
Batch size:1
CFG Scale:7
Seed:-1
Script:None
カメラアングルを指定するプロンプト
プロンプトテンプレート
プロンプト:
masterpiece,high quality,1 girl,black hair,({カメラアングル},1.4),detailed face
ネガティブプロンプト:
worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes
プロンプト | 出力される画像のカメラアングル |
from low | 下から |
from above | 上から |
from side | 横から |
from behind | 真後ろから |
dutch angle | 斜めから |
skewed shot | 斜めから |
比較画像
指定したカメラアングルを反映した画像を生成することが出来ました。
被写体の大きさを指定するプロンプト
プロンプトテンプレート
プロンプト:
masterpiece,high quality,1 girl,black hair,({被写体の大きさ},1.4),detailed face
ネガティブプロンプト:
worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes
プロンプト | 出力される画像の被写体の大きさ |
midium shot | 被写体への距離が中くらい |
long shot | 被写体への距離が遠い |
wide shot | 被写体への距離が遠い |
close up shot | 被写体を接写する |
比較画像
指定した被写体の大きさを反映して、画像を生成することが出来ました。
「midium shot」で生成される画像の大きさはモデルごとに異なると思いますが、「midium shot」に対して、「long shot」や「wide shot」は被写体が小さくなり、「close up」では被写体は大きく写ります。
体の一部にフォーカスする場合
先ほどのプロンプトで「close up」に続けて体の部位を入力することによって、指定した部位にフォーカスした画像を生成できます。
このように、指定した部位にフォーカスした画像を生成することができます。
被写体の向きを指定するプロンプト
プロンプト:
masterpiece,high quality,1 girl,black hair,({被写体の向き},1.4),detailed face
ネガティブプロンプト:
worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes
プロンプトテンプレート
プロンプト | 出力される被写体の向き |
head on | 正面 |
side view | 側面 |
back view | 背面 |
比較画像
指定した被写体の向きで画像を生成することができます。
まとめ
今回PROMPTYでは、Stable Diffusionで思い通りの構図で画像を生成する方法を紹介しました。
カメラアングルや被写体の向きや大きさを組み込むプロンプトを入力することで、生成される画像の構図を指定できました。
今回の例を参考に、皆さまも自分だけのStable Diffusionで構図を指定して、ハイクオリティな画像を作成してみていかがでしょうか。
~Stable Diffusionで素早く画像生成するには~
Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。
このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。
推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。
2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。
コスパを重視する方は、RTX 3060を選ぶと良いでしょう。
このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。