【プロンプト解説】Stable Diffusionで立ち絵の画像を生成する方法

PROMPTY

プロンプトエンジニアのための情報メディア…

「画像生成AIで立ち絵を生成する方法がわからない…」「Stable Diffusionを使ってハイクオリティな立ち絵を生成できるの?…」 そう思う方もいるのではないでしょうか。

実は、Stable Diffusionを利用すれば、ハイクオリティな立ち絵の生成することが可能です。

今回PROMPTYでは、Stable Diffusionで立ち絵を生成する方法と、ハイクオリティにする方法をご紹介します。

Stable Diffusion WebUIの利用方法を知りたい場合は、こちらの記事をご覧ください。

関連記事

「Stable Diffusionを使用したいが、どのように始めれば良いのだろう...」「低スペックPCでもStable Diffusionを使用できるの?...」 そう思う方もいるのではないでしょうか。 実は、高性能なPCを持っ[…]

立ち絵を生成するプロンプト

はじめに、立ち絵を生成するプロンプトをご紹介します。

立ち絵をイラストの素材を生成するにあたって、次のポイントを抑える必要があります。

  • キャラクターの頭からつま先までの全身が写っている
  • 立った状態のイラストである
  • 背景が単純で切り取り易くなっている

これ満たすような単語をプロンプトやネガティブプロンプトに組み込みます。

実際にこのような単語を入れて立ち絵を生成します。今回の記事では「Anything V5」のモデルを使用します。

プロンプトに使用できる単語の一覧

プロンプトの種類単語の例
キャラクターの全身が写るプロンプトwhole body
entire body
full body
total body
立った状態を表すプロンプトstanding
upright stance
erect posture
単純な背景を生成するプロンプトsimple background
plain background
basic background

「全身が写るプロンプト(full bodyなど)」と「立った状態を表すプロンプト(standingなど)」を組み合わせることで、頭からつま先までのイラストが生成されやすくなります(見切れてしまう場合も多いです。)

「simple background」「plain background」「basic background」の3つではどれを入力しても生成される画像に特に違いはありませんでした。

3つのポイントを踏まえてキャラクターの立ち絵を生成する

以上のポイントを抑えて、キャラクターの立ち絵を生成します。

プロンプト:

masterpiece,high quality,1 girl,full body,standing,blonde long hair,extremely detailed face,smile,simple background,wallpaper

ネガティブプロンプト:

flat color, flat shading, nsfw,(worst quality, low quality:1.4), interlocked fingers, (zombie, sketch, comic)

Sampling method:Euler a
Sampling steps:20
Width:512
Height:1024
Batch count:1
Batch size:1
CFG Scale:7
Seed:-1
Script:None

生成した立ち絵:

プロンプト通り、シンプルな背景で、ブロンドヘアーの女の子の全身画像が生成されました。

ハイクオリティな立ち絵を生成する方法

①「Rembg」で画像の背景を削除する

「Rembg」は生成した画像の背景を消去して透明画像を生成できる拡張機能です。イメージ編集ソフトウェアで全体を手動で切り取るより大幅に手間が省けます。

「Rembg」の導入方法

「Rembg」のインストールはwebUIのExtensionsメニューから行います。Install form URLタブのURL for extension’s git reposioryに「stable-diffusion-webui-rembg」のURLを貼り付けます。

https://github.com/AUTOMATIC1111/stable-diffusion-webui-rembg

InstalledのApply and restart UIをクリックしてWebUIが再起動されれば、導入完了です。

実際に「Rembg」を使って背景を削除する

「Rembg」は、Stable Diffusion WebUIの”Extra”の中のshingle imageからアクセスできます。

画像をドロップして、左下のRemove backgroundのドロップダウンリストから選択肢を選び、Generateボタンを押すだけで完了です。

選択出来る項目は

  • u2net
  • u2netp
  • u2net_human_seg
  • u2net_culoth_seg
  • silueta

の5つがあります。

今回は「u2net」を選択します。

u2netを選択して背景を削除した結果:

今回はシンプルな背景のため、キレイに切り抜くことができました。

②「ADetailer」で表情が崩れないようにする

Rembg」は生成した画像の背景を消去して透明画像を生成できる拡張機能です。

イメージ編集ソフトウェアで全体を手動で切り取るより大幅に手間が省けます。

「ADetailer」の導入方法

「ADetailer」のインストールは「Rembg」と同様、webUIのExtensionsメニューから行います。

Install form URLタブのURL for extension’s git reposioryに「adetailer」のURLを貼り付けます。

https://github.com/Bing-su/adetailer

InstalledのApply and restart UIをクリックしてWebUIが再起動されれば、導入完了です。

「ADetailer」の使い方

Stable Diffusion WebUIのトップ画面の左下にあるADetailerを開きます。

「ADetailer model」を設定し、プロンプトを入力してGenerateをクリックします。

ADetailer modelは、次の5つから選ぶことができます。

  • face_yolov8n.pt
  • face_yolov8s.pt
  • mediapipe_face_full
  • mediapipe_face_short
  • hand_yolov8n.pt

③「Hires.fix」で解像度を上げる

Hires.fixは、Stable Diffusionに組み込まれている補正機能の一部で、高解像度の画像を作りたい場合に役立つ機能です。Stable Diffusion用のモデルは、512×512ピクセルのイメージで学習されているため、高解像度の画像の生成が非常に難しくなっています。

そこで、Hires.fixの機能を使うことが効果的です。Hires.fixでは次のプロセスで高解像度の画像が生成されます。

  • STEP1:基本サイズで画像を作成する
  • STEP2:作成した画像を拡大する
  • STEP3:粗く拡大された画像をimg2imgできれいに補正する

Hires.fixの使用方法は非常に簡単で、画像を生成する前に「Sampling method」の下の「Hires.fix」をチェックを入れるだけです。

まとめ

今回PROMPTYでは、Stable Diffusionで立ち絵を生成し、ハイクオリティに仕上げる方法を紹介しました。

プロンプトに「立ち姿」「全身」を指定する単語と、「背景をシンプルにする」単語を組み込むことで立ち絵を生成することができます。また、「Rembg」や「ADetailer」「Hires.fix」のような機能を活用することで、クオリティの高い画像を生成することができます。

今回の情報を参考に、皆さまもStable Diffusionを用いて立ち絵の生成に挑戦してみてはいかがでしょうか。

~Stable Diffusionで素早く画像生成するには~

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。

このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。

コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。