【プロンプト解説】Stable Diffusionで思い通りの構図・アングルで画像を生成する方法

Stable Diffusionで画像生成を行う際に、思った通りの独自の構図やアングルの画像が出力されないことはないでしょうか。

Stable Diffusionで思い通りの画像を生成するためには、描写に関連するプロンプト(呪文)を有効的に活用することが求められます。

今回PROMPTYでは、Stable Diffusionで思い通りの構図・アングルで画像を生成できるプロンプトをまとめました。

今回の記事内で掲載している画像は「AnythingV5」を使用し、作成しています。

Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
Batch count:1
Batch size:1
CFG Scale:7
Seed:-1
Script:None

カメラアングルを指定するプロンプト

プロンプトテンプレート

プロンプト:

masterpiece,high quality,1 girl,black hair,({カメラアングル},1.4),detailed face

ネガティブプロンプト:

worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes
プロンプト出力される画像のカメラアングル
from low下から
from above上から
from side横から
from behind真後ろから
dutch angle斜めから
skewed shot斜めから

比較画像

指定したカメラアングルを反映した画像を生成することが出来ました。

被写体の大きさを指定するプロンプト

プロンプトテンプレート

プロンプト:

masterpiece,high quality,1 girl,black hair,({被写体の大きさ},1.4),detailed face

ネガティブプロンプト:

worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes
プロンプト出力される画像の被写体の大きさ
midium shot被写体への距離が中くらい
long shot被写体への距離が遠い
wide shot被写体への距離が遠い
close up shot被写体を接写する

比較画像

指定した被写体の大きさを反映して、画像を生成することが出来ました。

「midium shot」で生成される画像の大きさはモデルごとに異なると思いますが、「midium shot」に対して、「long shot」や「wide shot」は被写体が小さくなり、「close up」では被写体は大きく写ります。

体の一部にフォーカスする場合

先ほどのプロンプトで「close up」に続けて体の部位を入力することによって、指定した部位にフォーカスした画像を生成できます。

このように、指定した部位にフォーカスした画像を生成することができます。

被写体の向きを指定するプロンプト

プロンプト:

masterpiece,high quality,1 girl,black hair,({被写体の向き},1.4),detailed face

ネガティブプロンプト:

worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes

プロンプトテンプレート

プロンプト出力される被写体の向き
head on正面
side view側面
back view背面

比較画像

指定した被写体の向きで画像を生成することができます。

まとめ

今回PROMPTYでは、Stable Diffusionで思い通りの構図で画像を生成する方法を紹介しました。

カメラアングルや被写体の向きや大きさを組み込むプロンプトを入力することで、生成される画像の構図を指定できました。

今回の例を参考に、皆さまも自分だけのStable Diffusionで構図を指定して、ハイクオリティな画像を作成してみていかがでしょうか。

~Stable Diffusionで素早く画像生成するには~

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。

このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。

コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。