【プロンプト解説】Stable Diffusionで遠くからの構図で画像を生成する

「Stable Diffusionを使って思い通りの画像を生成したい…」「遠くからの構図での画像生成に苦戦している…」そう悩む方々も多いのではないでしょうか。

実は、Stable Diffusionのプロンプトを工夫することで、遠くからの構図で思い通りの画像を生成することができます。

今回PROMPTYでは、Stable Diffusionで遠くからの構図で画像を生成するプロンプトをご紹介します。

①構図を指定するプロンプト

遠くからの構図を表す単語

遠くからの構図を示すプロンプトとして次のような単語が挙げられます。

プロンプト意味
Distant view遠景
Wide shot広角
Long shot長いショット、遠景のショット
Panoramaパノラマ、全景
Aerial view空中写真、空からの眺め
Bird’s-eye view鳥瞰図、上からの眺め
Overlook高所からの眺め
Vast landscape広大な風景
Horizon地平線
Far-reaching広範囲にわたる
Expansive vista広大な景色

これらの単語をStable Diffusionのプロンプトに組み込むことで、遠くからの構図で思い通りの画像が生成される可能性が高くなります。

生成した画像

プロンプト:

masterpiece,high quality,1 girl,{構図に関するプロンプト},standing,blonde long hair,extremely detailed face,smile,forest,wallpaper

ネガティブプロンプト:

flat color, flat shading, nsfw,(worst quality, low quality:1.4), interlocked fingers, (zombie, sketch, comic)

モデル:Anythig
Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
CFG Scale:7
Batch count:1
Batch size:1
Seed:-1
Script:None

生成した画像:

全体として、構図を示すプロンプトを入れない場合に比べて、遠い画角の画像が生成されました。

「Distant view」や「Panorama」は「Long shot」や「Wide shot」よりも、遠くからの構図で女性の画像が生成できています。

「Aerial view」(航空写真)は極端な例ですが、今回のモデルでは、上からの構図で、少し遠くから写すことができました。

ただ、遠くからの構図で人物の画像を生成する場合、顔や手のクオリティが下がってしまうことが難点です。この場合、アップスケール・高画質化する拡張機能を使うことをお勧めします。

関連記事

「Stable Diffusionで画像を生成したけど拡大すると画質が悪い、、、」「大きいサイズの画像を生成しようとすると構図が崩れてしまう、、、」 このような悩みをお持ちの方は多いのではないでしょうか? 今回PROMPTYで[…]

②焦点距離を指定するプロンプト

焦点距離とは

カメラの焦点距離とは、カメラのレンズの性質を示す基本的な値の一つです。

具体的には、レンズ内部の光が交差する点(焦点)からレンズの光学的中心までの距離を指します。この値が長いほど、テレフォトレンズのように対象を拡大して撮影でき、短いほど広角レンズとして広い範囲をキャッチすることが可能です。

引用元:Nikon

焦点距離を理解することは、写真撮影における被写体との距離や背景のボケ具合など、写真の表現を豊かにするための鍵となります。

この焦点距離をStable Diffusionの画像生成にも活かすことができます。

焦点距離を変えて画像を生成する

今回はプロンプトにレンズに関する情報を組み込むことで、構図を設定します。メーカーは適当にSONYを選び、焦点距離、F値(絞り)の順に入力しています。

プロンプト:

masterpiece,high quality,1 girl,SONY {焦点距離} F/5.6,standing,blonde long hair,extremely detailed face,smile,forest,wallpaper

ネガティブプロンプト:

flat color, flat shading, nsfw,(worst quality, low quality:1.4), interlocked fingers, (zombie, sketch, comic)

モデル:Anythig
Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
CFG Scale:7
Batch count:4
Batch size:1
Seed:475890389
~475890392
Script:None

焦点距離=35mmとした生成画像

焦点距離=100mmとした生成画像

一貫性はありませんが、焦点距離100mmよりも、焦点距離35mmの方が遠くからの構図の画像が多く生成されることが分かりました。

このように、Stable Diffusionで生成する画像の構図を指定する場合、直接単語を入力する場合以外にも、焦点距離を指定することも有効です。

Stable Diffusionの構図に関するプロンプトは、こちらの記事でも詳しく解説しています。

関連記事

「Stable Diffusionのモデルは何を使えばいい?」「リアルな画像やアニメ風の画像を生成できるモデルを知りたい!」 このような疑問をお持ちの方は多いのではないでしょうか? Stable Diffusionのモデルとは[…]

まとめ

今回PROMPTYでは、Stable Diffusionを用いて遠くからの構図での画像生成するプロンプトを紹介しました。以下の2つの方法を取り上げました。

  • 「遠くから」を示す単語をプロンプトに組み込む。
  • レンズに関する情報を入力して焦点距離を調整する。

今回の例を参考に、Stable Diffusionでの画像生成にチャレンジしてみてはいかがでしょうか。

PROMPTYでは、他のStable Diffusionに関する記事も取り扱っているので、是非ご覧ください。

~Stable Diffusionで素早く画像生成するには~

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。

このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。

コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。