【プロンプト解説】Stable Diffusionで思い通りの構図・アングルで画像を生成する方法

Stable Diffusionで画像生成を行う際に、思った通りの独自の構図やアングルの画像が出力されないことはないでしょうか。

Stable Diffusionで思い通りの画像を生成するためには、描写に関連するプロンプト（呪文）を有効的に活用することが求められます。

今回PROMPTYでは、Stable Diffusionで思い通りの構図・アングルで画像を生成できるプロンプトをまとめました。

今回の記事内で掲載している画像は「AnythingV5」を使用し、作成しています。

Sampling method：Euler a
Sampling steps：20
Width：512
Height：512
Batch count：1
Batch size：1
CFG Scale：7
Seed：-1
Script：None

リンク

カメラアングルを指定するプロンプト

プロンプト：

masterpiece,high quality,1 girl,black hair,({カメラアングル},1.4),detailed face

ネガティブプロンプト：

worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes

指定したカメラアングルを反映した画像を生成することが出来ました。

プロンプト：

masterpiece,high quality,1 girl,black hair,({被写体の大きさ},1.4),detailed face

ネガティブプロンプト：

worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes

指定した被写体の大きさを反映して、画像を生成することが出来ました。

「midium shot」で生成される画像の大きさはモデルごとに異なると思いますが、「midium shot」に対して、「long shot」や「wide shot」は被写体が小さくなり、「close up」では被写体は大きく写ります。

先ほどのプロンプトで「close up」に続けて体の部位を入力することによって、指定した部位にフォーカスした画像を生成できます。

このように、指定した部位にフォーカスした画像を生成することができます。

プロンプト：

masterpiece,high quality,1 girl,black hair,({被写体の向き},1.4),detailed face

ネガティブプロンプト：

worst quality,low quality,nsfw,flat color,flat shade,sketch,interlocked fingers,skin blemishes

指定した被写体の向きで画像を生成することができます。

今回PROMPTYでは、Stable Diffusionで思い通りの構図で画像を生成する方法を紹介しました。

カメラアングルや被写体の向きや大きさを組み込むプロンプトを入力することで、生成される画像の構図を指定できました。

今回の例を参考に、皆さまも自分だけのStable Diffusionで構図を指定して、ハイクオリティな画像を作成してみていかがでしょうか。

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード（GPU）の性能によって大きく変わります。

このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。

コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。

リンク