Stable Diffusionの最新情報をご紹介！最新モデルでハイクオリティな画像を生成する

2023年7月24日
Stable Diffusion活用術

玄人志向　グラフィックボード [12GB /GeForce RTXシリーズ]｢バルク品｣　GGRTX3060E12GBOCDF

1 Stability AIが最新モデル「Stable Diffusion XL」を正式公開
2 【2023年7月最新版】Stable Diffusionのおすすめモデル8選！
- 2.1 リアル・実写系の画像が生成できるモデル
- 2.2 アニメ・イラスト風の画像が生成できるモデル
3 ～Stable Diffusionで素早く画像生成するには～

Stability AIが最新モデル「Stable Diffusion XL」を正式公開

Stable Diffusion XL（SDXL）とは？

Stable Diffusion XL（SDXL）は、画像生成AI「Stable Diffusion」のモデルの一つで、Stability AI社が公開する公式のモデルです。

2023年6月23日に発表された最新バージョンSDXL 0.9は、35億のパラメータを持つ単一モデルと、58億のパラメータを持つ複合モデルから成り立っており、これによりオープンソースモデル中でもトップレベルのパラメータ数を有することになります。

引用元：arXiv

SDXLは単一のモデルではなく、二段階のモデルを採用しています。一つ目のモデルは「画像の大部分」を取得するように訓練され、二つ目のモデルは「一つ目のモデルの出力を改良し、テクスチャーや細部を修正するモデル」となっています。これらのモデルは別々に訓練可能であり、その結果学習効率が上がっています。

引用元：arXiv

次の画像は、Stable Diffusionの各モデルがユーザーにどの程度評価されたかを示したグラフです。縦軸の値が大きいほどユーザーが好みの画像を生成できたことになります。この結果を見ると、SDXLのパフォーマンスは既存のStable Diffusion 1.5や2.1を上回っており、ユーザーの好みに合致した画像を生成する能力が高いことがわかります。

引用元：arXiv

SDXLの詳しい技術は、現在公開されている技術レポートをご覧ください。

現在SDXL 0.9が使用できるPCスペックは、Windows 10／11またはLinux、RAM 16GB、最低8GB VRAMを搭載したNvidia GeForce RTX 20シリーズ（もしくはそれ以上）となっています。Linuxの場合、16GBのVRAMを有するAMD製のグラフィックボードを使用できます。

Stable Diffusionを利用する上でのPCスペックに関してはこちらの記事で詳しく解説しています。

SDXLの利用方法

SDXL 0.9のモデルを利用する

現在SDXL0.9のモデルは、研究者向けの早期アクセスが可能となっています。

Hugging Faceにアクセスして申請を行い、許可が下りたらWebUI等で利用することができます。

「ClipDrop」でデモ版を利用する

Stability AIの子会社であるInit ML社のWebサービス「ClipDrop」にアクセスすることでSDXLのデモ版を体験できます。

ClipDropにアクセスします。トップページに”STABLE DIFFUSION XL”と表示されています。

“Enter your prompt”に生成した画像のプロンプトを入力します。デモ版のため、ネガティブプロンプト等は指定できません。今回はコーヒーカップを持つ日本人女性の画像を生成します。

入力したプロンプト：

(masterpiece,best quality:1.4),(8k,raw photo,photo realistic:1.2),(shiny skin),detailed skin,detailed face,detailed eyes,1girl,looking at viewer,Japanese idol,extremely beautiful face, holding a coffee cup

“Generate”をクリックすると、数分ほど待つと画像が4枚生成されます。

様々なタッチで画像が生成されました。プロンプトの指示通り、4枚ともコーヒーを持っています。特に右上の画像は充分リアルな女性が描かれています。

画像をクリックしたあと、右上の”Download HD”から画像をダウンロードできます。

SDXL 1.0のリリースは延期に→2023年7月27日にリリース

SDXL1.0は7月中旬にリリースされる予定でしたが、リリースが延期されることが開発元のStability AIから発表されました。SDXL 1.0の公開は、1週間程度遅れるようです。この延期の理由として、Stability AIのJoe Penna氏は、「いくつかの”遅咲き”の微調整モデルが社内で驚くほどの結果を出しているが、どのモデルが優れているかを明確にするためにもう少し時間が必要だ」と説明しています。モデルの評価に時間がかかっており、そのためSDXLの公開が延期されているようです。

SDXL0.9はAIアート愛好家の間で大きな話題となっておりことから、SDXL1.0の公開にも大きな注目が厚集まることが期待されます。

追記：SDXL 1.0は7月27日に公開されました。SDXL 1.0の特徴や利用方法についてはこちらの記事で詳しく解説しています。