Stable Diffusion 1.5の特徴とWeb UIで使う方法を徹底解説!

「Stable Diffusion 1.5の特徴を詳しく知りたい…」「Web UIでの操作方法がよくわからない…」そう思う方もいるのではないでしょうか。

今回PROMPTYでは、Stable Diffusion 1.5とは何か?その特徴をご紹介します。また、Stabe Diffusion Web UIでの使い方について、準備から実際に画像を生成するところまで丁寧に解説していきます。

Stable Diffusion 1.5とは?

Stable Diffusion 1.5は2022年10月に公開された学習済みモデルです。

Stable Diffusionは2022年8月にオープンソースで公開されて注目を浴びましたが、それから1.1、1.2、1.3、1.4を経てアップデートされています。

Stable Diffusion 1.5のリンク(Hugging Face):

https://huggingface.co/runwayml/stable-diffusion-v1-5

提供元は「rumwayml」となっており、v1.4の提供元「CompVis」から変わっています。これらとStable Diffusionの開発元「Stability AI」との関係は、CompVisは大学や研究所のチームであり、CompVisに対してRumwayMLとStability AIが出資しています。当時は、RumwaMLが突然Stable Diffusion 1.5を公開し、それに対してStability AIが公開を差し止める要求をするなどのトラブルがありました。

Stable Diffusion 1.5の特徴

Stable Diffusion v1.5は、任意のテキスト入力から写真のようにリアルな画像を生成することが可能なモデルです。

下のグラフは、生成された画像が与えられたプロンプト(指示)にどれだけ適合しているかを評価する「CLIP Score」と生成された画像と実際の画像の差を評価する「FID Score」をプロットしたものです。CLIP Scoreが高く、FID Scoreが低いほど高品質な画像が生成できていることになります。

1.4と比較すると大幅な改善はないようです。

引用元:Hugging Face

また、Stable Diffusion 1.5の特徴として、NSFW(Not Safe For Work)の画像が生成されにくく、安全性が高くなっています。モデルの出力を既知のハードコーディングされたNSFW概念と比較し、NSFW画像が生成されないようになっています。具体的には、画像の生成後にCLIPTextModelの埋め込み空間で有害な概念のクラス確率を比較します。

Stable Diffusion 1.5をWebUIで利用する

① AUTOMATIC 1111版のStable Diffusion Web UIを起動する

Stable Diffusion Web UIとして代表的なものがAUTOMATIC 1111です。AUTOMATIC1111版のStable Diffusion Web UIを導入することで、Stable Diffusion 2.1を利用することができます。

https://github.com/AUTOMATIC1111/stable-diffusion-webui

Google Colabからを利用することで簡単にAUTOMATIC 1111を使うことができます。

Google Colabから Stable Diffusionを利用する手順についてはこちらの記事で詳しく解説しています。

関連記事

「Stable Diffusionを使用したいが、どのように始めれば良いのだろう...」「低スペックPCでもStable Diffusionを使用できるの?...」 そう思う方もいるのではないでしょうか。 実は、高性能なPCを持っ[…]

今回は、”maintained by TheLastBen”のノートブックでStable Diffusion 1.5を利用します。

ノートブックの画面はこのようになっています。左の三角のボタンをクリックして実行していきます。

はじめに「Connect Google Drive」クリックしてGoogle Driveへのアクセスを許可します。

実行が完了すると「Done」と表示されます。

「Install/Update AUTOMATIC1111 repo」「Requirements」も同様に実行します。

「Model Download/Load」で、「Model_Version」のプロダウンから1.5を選択します。

最後に「Start Stable-Diffusion」を実行します。実行すると下段に「Connected」と表示されます。表示されたURLをからStable Diffusion WebUIを起動できます。

Stable Diffusion WebUIの画面

② 実際に画像を生成する

実際にStable Diffusion 1.5を使って画像を生成していきます。

リアルな女性の画像

はじめに、リアルな女性の画像を生成します。クオリティに関する単語を最初に記載します。女性は一人で、顔全体が写るように指定しました。

プロンプト:

(masterpiece,best quality:1.4),(8k,raw photo,photo realistic:1.2),(shiny skin),1girl,whole face,detailed skin,detailed face,detailed eyes,extremely beautiful face,

ネガティブプロンプト:

(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples

Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
Batch count:6
Batch size:1
CFG Scale:7
Seed:-1
Script:None

生成した画像:

顔全体が写っていない画像もありますが、十分リアルな女性が生成されました。3枚目(右上)の画像は、手や構図に不整合な箇所がありますが、6枚目(右下)は中々ハイクオリティな画像を生成できています。

海の風景の画像

次に海・ビーチ・青い空と入力して風景の画像を生成します。

プロンプト:

beautiful, masterpiece,landscape,beautiful ocean,beach,blue sky,summer

ネガティブプロンプト:

peple,worst quality,low quality,painting,sketch,flat color,monochrome,grayscale

Sampling method:Euler a
Sampling steps:20
Width:512
Height:512
Batch count:6
Batch size:1
CFG Scale:7
Seed:-1

Script:None

生成した画像:

写真のようにリアルで鮮明な画像が生成されました。プロンプトではあまり細かい指示はしていないため、様々な構図で海の風景の画像が生成されています。先ほどの女性の画像のクオリティのと比較すると、このモデルは人物の画像よりも風景の画像の方が得意な印象を受けます。

まとめ

今回PROMPTYでは、Stable Diffusion 1.5の特徴とそのWeb UIでの操作法について解説しました。

このように、モデルに関して知識をインプットすることで、Stable Diffusionをより効果的に活用することができます。

今回の例を参考に、皆さまもStable Diffusion を使った画像生成を進めてみてはいかがでしょうか。

なお、Stable Diffusionは現在もアップデートされています。アップデートされたv2.1やStable Diffusionの最新情報はこちらの記事で詳しく解説しています。

関連記事

(function(b,c,f,g,a,d,e){b.MoshimoAffiliateObject=a; b[a]=b[a]||function(){arguments.currentScript=c.currentScript ||[…]

~Stable Diffusionで素早く画像生成するには~

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。

このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。

コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。