Stable Diffusionは人物の画像生成のみならず、猫の画像生成にも非常に有用です。プロンプトを効果的に入力すれば、リアルな猫の画像を高品質に生成することが可能です。
今回PROMPTYでは、Stable Diffusionを用いて猫の画像生成を行う方法について詳しくご紹介したいと思います。
プロンプト
今回はアニメ調画像を生成するのに適したモデル「Anything-V5」と、リアル調のモデル「Chilloutmix」を使用してかわいい猫の画像を生成してみます。詳細設定は以下の通りです。
Sampling method:DPM++ 2S a Karras
Sampling steps:20
Width:512
Height:512
Batch count:1
Batch size:1
CFG Scale:7
Seed:-1
Script:None
プロンプト例①:通常の猫の画像
プロンプト:
cute cat, realistic, high quality, masterpiece, HD
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,comic), nsfw
Anything-V5を用いた生成画像
Chilloutmixを用いた生成画像
プロンプト例②:白い猫の画像
プロンプト:
cute cat, realistic, high quality, masterpiece, HD,(white fur),
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,comic), nsfw
Anything-V5を用いた生成画像
Chilloutmixを用いた生成画像
プロンプト例③:三毛猫の画像
プロンプト:
(calico cat), realistic, high quality, masterpiece, HD,
ネガティブプロンプト:
(worst quality, low quality:1.4), (zombie, sketch, interlocked fingers,comic), nsfw
Anything-V5を用いた生成画像
Chilloutmixを用いた生成画像
まとめ
いかがでしたでしょうか。
上で紹介したプロンプトを使用することによって、かわいい猫の画像を生成することが出来ました。
使用するモデルやプロンプトによって様々な異なる猫の画像を生成することが出来るので、是非色々試してみてください。
~Stable Diffusionで素早く画像生成するには~
Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。
このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。
推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。
2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。
コスパを重視する方は、RTX 3060を選ぶと良いでしょう。
このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。