画像生成AIの分野で注目を集めるMidjourneyが、革新的なアップスケール機能を導入しました。これにより、高解像度の美しいAIアート作品の作成が可能になります。
参考:Forbes
Midjourneyの新機能とその特徴
Midjourneyは、これまで生成AIアートの中で抱えていた「低解像度の画像しか出力できない」という課題に取り組みました。そして、この課題を克服するための新機能として、画像を超高解像度にアップスケーリングする能力を導入しました。
これまで、デフォルトの出力解像度は1024×1024ピクセルでしたが、これを2倍、あるいは4倍にアップスケーリングする機能が追加されました。これによってデフォルトの最大サイズは4K解像度を超える4096×4096ピクセルとなりました。
この機能追加により、A3サイズでの印刷でも画質が低下することなく、クリアな画像を提供できるようになりました。特に、ウェブ画像やデスクトップの壁紙作成においても、高品質な出力が期待されます。
アップスケーリングのメリットとデメリット
アップスケーリング機能の利用には多くのメリットがありますが、一方で代償も存在します。デフォルトサイズの出力は数秒で完了できますが、4倍のアップスケーリングを行う場合、処理時間が2、3分かかることもあります。
さらに、Midjourneyは処理時間に基づいて課金されるため、この新機能の利用により、ユーザーが月間で生成できる画像の数が減少する可能性があります。ただし、追加料金を支払うことで、より多くの画像を生成する時間を確保することができます。
また、同社からは、アップスケーリング処理に関していくつかの注意点が示されています。特に、4倍のアップスケールでまれに画像が破損するリスクや、元々の画像が不明瞭な場合、アップスケーリングによる画質の改善が期待できないとのことです。
生成AIアート業界の動向
Midjourneyだけでなく、他の企業も画像生成AIの進化に力を入れています。例えば、Adobeは1週間前に「Firefly 2」という新しいバージョンを発表、OpenAIはChatGPTの有料ユーザー向けに画像生成AI「DALL・E3」が追加されました。
OpenAIは、10月19日(米国時間)にChatGPT PlusおよびEnterpriseに加入したすべてのユーザーが画像生成AI「DALL・E3」を利用可能になったことを発表しました。 この新機能により、ユーザーは自然言語のプロ[…]
これからの技術の進化に期待が高まる中、Midjourneyの新機能追加は、業界全体の一歩前進と言えるでしょう。
画像生成AIの解像度は?
次の表は主要な画像生成AIの出力解像度をまとめたものです。
サービス名 | 開発元 | デフォルトの出力解像度(正方形) |
Midjourney | Midjourney | 4096×4096 |
Stable Diffusion | Stability AI | 1024×1024 |
DALL・E3 | OpenAI | 1024×1024 |
Firefly 2 | Adobe | 2048×2048 |
今回のMidjourneyのアップデートの他にも、Stable Diffusionでは最新モデルStable Diffusion XLの公開時にデフォルトの解像度が512×512から1024×1024に拡大、AdobeのFirefly2では2048×2048となっており、AI生成アート業界での品質と解像度をめぐる競争が激化していることが窺えます。
Midjourneyとは Midjourneyはデビッド・ホルツ率いる研究チームによって2022年7月から提供されているAI画像生成ツールです。このツールはDiscord上のbotとして機能し、ユーザー間で画像生成を共有する[…]
「Stable Diffusionの最新モデルが知りたい...」「Stable Diffusion XL って何?」そう思う方もいるのではないでしょうか。 これまで研究目的で公開されていたStable Diffusion XLアップ[…]