MidjourneyとStable Diffusionの違いを徹底解説!どちらがおすすめ?

「Midjourney」「Stable Diffusion」どちらもAI画像生成ツールですが、似ているようで使用や使い方は異なります。今回はこの二つのツールの違い、特徴をご紹介していきます。

Midjourney,Stable Diffusion比較表

ツール名MidjourneyStable Diffusion
費用10~60ドルStable Diffusion web UI:無料,
DreamStudio:1000クレジット/10ドル
画像生成数4自由に設定可能
生成時間1~3分程度1分~(生成条件,作業環境による)
使用方法Discordの登録Webツールの登録、または環境構築が必要
操作性直感的、プロンプトのみでしっかり生成できる。初心者には難しいが、細かな設定でより精度の高い画像生成ができる。
プロンプトの参考元、勉強方法Discord内で他ユーザーの生成画像を検索したり見ることができる。「Civitai」といった生成画像共有サイトを参照
商用利用無料プランのユーザー:商用利用は不可,公開する場合はMidjourneyへのリンクが必須
有料プランのユーザー:著作権は画像生成した本人に帰属、商用利用が可能
基本的に可能
※商用利用不可能のモデルがある
※商用利用不可の画像を使用した場合は不可
その他アカウントがあればデバイスを選ばず生成できるオフラインで作業ができる
関連記事

Midjourneyとは Midjourneyはデビッド・ホルツ率いる研究チームによって2022年7月から提供されているAI画像生成ツールです。このツールはDiscord上のbotとして機能し、ユーザー間で画像生成を共有する[…]

①:Midjourneyとは

1.Midjorney:概要

MidjourneyはDiscord(ボイス・​ビデオ・​テキストコミュニケーションサービス)のbotとして画像生成をすることができるイラストジェネレーターで、その中でプロンプトと呼ばれるテキスト入力で画像を生成することができます。Midjorneyを使用するユーザーと共有しながら画像生成をします。また、Discordはマルチプラットフォームに対応しているため、スマホなどのデバイスでも簡単に画像生成ができます。

2.Midjorney:料金プラン

Midjourneyの利用は有料のサブスクリプションが必要です。以下の表は2023年6月16日現在の料金プランとなっています。詳細はMidjourney公式を確認するようにしましょう。Midjoourneyのフリープランは現在停止されております。

プラン名料金内容
ベーシックプラン月額10ドル毎月 3.3時間GPU分
※毎月 200枚程度
スタンダードプラン月額30ドル毎月 15時間GPU分
※毎月 900枚程度
リラックス(低速)モードは無制限
プロプラン月額60ドル毎月 30時間GPU分
※毎月 1800枚程度
リラックス(低速)モードは無制限

参考:Midjourney

関連記事

Midjourneyとは Midjourneyはデビッド・ホルツ率いる研究チームによって2022年7月から提供されているAI画像生成ツールです。このツールはDiscord上のbotとして機能し、ユーザー間で画像生成を共有する[…]

②:Stable Diffusion

1.Stable Diffusion:概要

Stable Diffusion は入力されたテキストプロンプトをもとに画像を生成する潜在拡散モデルです。学習済みのデータを使用するため精度の高い画像を生成することができます。「Stable Diffusion web UI」を使用すれば無料でローカル環境での生成も可能です。

1.Stable Diffusion:料金プラン

Stable Diffusionはパソコンに環境構築する「Stable Diffusion web UI」とWebツールの2つで使用することができます。今回はWebツールの1つであるStable Diffusion公式の「DreamStudio」を例にご紹介します。

プラン名料金内容
DreamStudio1000クレジット/10ドル1クレジット約1枚生成可能
最初は200クレジット分が無料提供 
Stable Diffusion web UI無料無制限

生成画像比較

ではどのような違いがでくるのかを実際に同じプロンプトで生成してみます。Midjourneyはネガティブプロンプトを使用せず生成します。

猫の画像

まずは「家の中にいる猫」の画像を生成してみます。こちらのプロンプトを使用します。

Stable Diffusion モデル:

Chartreux/British Shorthair V1.0

プロンプト:

(photorealistic:1.4), official art, unity 8k wallpaper, ultra detailed, beautiful and aesthetic, masterpiece, best quality, 3d, animal, animal focus, cat, depth of field, film grain, house, motion blur, no humans, yellow eyes, (inside cardboard box:1.4), tongue out, (Chartreux:1.2) <lora:Chartreux-v2:0.5>

ネガティブプロンプト:

(((humans))), (human), (1male), (1girl), ng_deepnegative_v1_75t, badhandv4, easynegative, verybadimagenegative_v1.3

参考元:Civitai

生成画像:

MidjourneyStable Diffusion
光に関するプロンプトは記入していませんが、自然なライティングでまるで写真のような画像が生成されました。Midjourneyは全体の雰囲気を調整してくれます。プロンプトに忠実な画像が生成されました。ここからライティングや経路などさまざまなプロンプトを組み込んで理想の画像に近づけていきます。

人間の画像

次に宇宙にいる男性の画像を生成してみます。こちらのプロンプトを使用します。

Stable Diffusion モデル:

maturemalemix V1.4

プロンプト:

Draw a young programmer, sitting on a research platform floating in the middle of an asteroid belt. He is studying with a notebook, surrounded by several asteroids glowing with fiery auras. Dramatic lighting from distant stars and planets illuminates the scene, casting deep shadows on the suit. The young man looks confident and determined, looking at the vast and mysterious universe with wonder and respect,facial hair, cowboy shot,

ネガティブプロンプト:

EasyNegative,bad anatomy, badhandsv5-neg,

参考元:Civitai

生成画像:

MidjourneyStable Diffusion
服装、色合いの違うバラエティに富んだ4枚が生成されました。「惑星」「神秘的」という単語からカラフルな宇宙の画像が生成されました。このようにMidjourneyは単語の雰囲気が色合いに影響するという印象があります。比較的落ち着いた画像が生成されました。Midjyourneyではパソコンが生成されていますが、Stable Diffusion ではしっかり紙のノートが生成されています。このようにプロンプトに対する正確度は高い印象です。

街並みの画像

最後に芸術的な街並みの画像を生成してみます。こちらのプロンプトを使用します。

Stable Diffusion モデル:

Surreal city LoRA SD2.1

プロンプト:

<lora:Sur:1abstract street street in the city with abstract buildings and cars, in the style of otherworldly visions, gravity-defying landscapes, richly colored skies, hyperrealistic illustrations, psychedelic surrealism, swirling vortexes

ネガティブプロンプト:

nrealfixer, cgi, fake, render, B&W, (nude), (nacked)

参考元:Civitai

生成画像:

MidjourneyStable Diffusion
かなり作り込まれた抽象的な絵が生成されました。「異世界のビジョン」が細部まで反映されています。また違った異世界感の画像が生成されました。「渦を巻くスタイル」が少し現れています。プロンプトの比重も比較的正確な印象です。

まとめ

今回はMidjourneyとStable Diffusionの比較をしました。Midjounreyは少ないテキストでも完成された画像が生成される印象で、初心者でも扱いやすいです。一方Stable Diffusionはプロンプトに忠実でプロンプトをしっかりと書き込まなければなりません。

料金や、作業環境にもよりますが、しっかりとした完成イメージをもている場合はStable Diffusionで作り込む。なんとなくまとまりのある画像が欲しいなという方はMidjourneyがいいのではないかと思います。

~Stable Diffusionで素早く画像生成するには~

Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。

このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。

推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。

2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。

コスパを重視する方は、RTX 3060を選ぶと良いでしょう。

このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。