Stable Diffusionの拡張機能「ADetailer」について解説!

Stable Diffusionを使っていて、「顔が崩れてしまった」「顔さえ良ければこの画像を使いたいのに」と言ったことはないでしょうか。

そんな時は「ADetailer」を使うことで、顔や表情のつくりを補正することができます。

今回はADetailerのダウンロード方法から実際の活用方法まで解説します。

ADetailerとは?

ADetailerとはStable Diffusionで使うことのできる拡張機能で、生成した人物の顔の作りや表情を修正、補正することができます。

Web UI上でインストールが完結するため、面倒な工程を経る必要なく使用することができるため、おすすめの拡張機能です。

ADetailerのダウンロード方法

①Extensionsの画面を表示する

まずは使いたいモデルのWeb UI画面を開き、Extensionsをクリックします

②ダウンロードURLを入力する

次にInstall from URLをクリックし、下記URLを”URL for extensions git repository”にコピペしてください。

https://github.com/Bing-su/adetailer

コピペできたらInstallをクリックします。

③ADetailerを適用する

インストールできたらinstalledをクリックしてください

赤枠部分をクリックしたら適用完了です。

一度再起動がかかりますが、仕様ですので心配せずにそのまま使用してください。

適用が完了したら、txt2imgの画面を表示します。

ADetailerの表記が増えているはずですので、赤枠部分の逆三角形をクリックし、青枠部分にチェックを入れたら使用できます。

ADetailerを実際に使用してみる

ADetailerを実際に使用してみましょう。

まずはキャラクターの顔がどの程度補正されるかを見てきます。

①ADetailerでの顔の補正

プロンプトテンプレート:

masterpiece,high quality,1 girl,blonde hair, green eyes,full body

ネガティブプロンプト:

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,username:1.2), nsfw

Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
Batch count:10
Batch size:1
CFG Scale:7
Seed:137658
Script:None

今回は生成画像を固定したいため、シード値を変更しています。

比較画像

ADetailerを使用していない画像が少しアンバランスな印象を受けてしまうのに対し、ADetailerを使用した画像はそこをしっかりと補正してくれています。

リアルな人物でもしっかり機能してくれています。

②ADetailerでの表情差分

次に表情の差分を作ってみましょう。

通常のプロンプト、ネガティブプロンプトに加えて、ADetailerではプロンプトとネガティブプロンプトを入力できます。

ただ、基本的にはモデル側のプロンプトとネガティブプロンプト使用して、ADetailer側で補正したい部分や表情に関する単語程度に留めるのがいいでしょう。

プロンプトテンプレート(モデル側):

masterpiece,high quality,1 girl,black hair,blue eyes,upper body

ネガティブプロンプト(モデル側):

(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,username:1.2), nsfw

プロンプトテンプレート(ADetailer側):

○○(表情に関するプロンプト)

生成画像

問題なく、表情の差分を作成することができました。

表情差分を作る場合、かなり修正力が強く、リアルな画像での補正はむしろ不自然になってしまいました。

表情差分作成を想定した場合、ADetailerはアニメキャラ(2次元画像)との相性がいい拡張機能と言えます。

~Stable Diffusionで素早く画像生成するには~
Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。
このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。
推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。
2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。
コスパを重視する方は、RTX 3060を選ぶと良いでしょう。
このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。