「Stable Diffusionで浴衣や和服の人物を生成する方法を知りたいけど、難しそう…」
そう思う方もいるのではないでしょうか。Stable Diffusionでは、プロンプトを工夫することによって浴衣や和服の人物を美しく生成することが出来ます。
今回PROMPTYでは、Stable Diffusionで浴衣や和服の人物を生成する具体的な手法について詳しく解説していきたいと思います。
Stable Diffusionで着物や和服の人物を生成する方法を紹介
Stable Diffusionで着物や和服姿の人物を生成するためのプロンプトは数多くあります。以下にプロンプトをまとめました。
プロンプト | 生成画像 |
Kimono | 着物 |
yukata | 浴衣 |
Wafuku | 和服 |
Hakama | 袴 |
Japanese Clothes | 日本風の服 |
miko shrine maiden clothes | 巫女服 |
実際に使用してみた
上記で紹介したモデルを実際にリアル系のモデルとアニメ系のモデルで使用して検証してみます。使用するモデルはリアル系モデル「Basilmix」「chilloutmix」、アニメ系モデル「AnythingV5」「Counterfeit」を使用します。
また、今回は検証のためプロンプトを必要最低限のものに絞って入力します。
プロンプト
masterpiece,best quality,1 girl,{服装に関する単語}
ネガティブプロンプト
(worst quality,low quality:2),text,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples
上記のプロンプトを使用して生成された画像は以下の通りです。(一部抜粋)
AnythingV5
Counterfeit
Basilmix
Chilloutmix
アニメ系のモデルとリアル系のモデルのどちらも、「wafuku」で画像を生成した場合に和服は生成されず、普通の洋服や学生服が生成されることが多いようです。
浴衣などの画像生成は、アニメ系モデルであれば「AnythingV5」、リアル系のモデルであれば「Basilmix」の方がより本物に近いものが生成される傾向にあるようです。
着物や和服の画像生成に特化したLoRAを紹介
着物や和服を着た人物を生成しやすくするには、LoRAの使用も効果的です。ここでは、着物や和服の人物を生成するのに適したLoRAを紹介します。
Kimono Clothes
「Kimono Clothes」は様々な着物に対応したLoRAです。
このLoRAでは通常の浴衣や着物の他にも、丈の短い浴衣や振袖などのトリガーワードに対応しています。
Kimono わふく 和服
「Kimono わふく 和服」は浴衣を着た人物の生成をしやすくするためのLoRAです。
リアル系のモデルで使用すると浴衣を着た美しい人物の画像が生成できます。
kimono_copax_v1
「kimono_copax_v1」はアニメ系モデルでの着物を着た人物の生成を得意とするLoRAです。
トリガーワードは「kimono」のみと少ないですが、プロンプトを入力するのみではうまく画像を生成できない場合は試してみる価値があるでしょう。
実際に使ってみた
今回はこれらのLoRAを実際に使用してみます。使用するモデルはアニメ系モデル「AnythingV5」とリアル系モデル「Basilmix」です。
Kimono Clothes
プロンプト
masterpiece, ultra realistic, 32k, extremely detailed CG unity 8k wallpaper, best quality, soft lighting, solo, ponytail, kamisato ayaka (heytea), official art, official alternate costume, kamisato ayaka, blunt bangs, hair bow, hair ribbon, red ribbon, red kimonos, flower, outdoors, cherry blossoms, 1girl, black bow, cate , masterpiece,ultra realistic,32k,extremely detailed CG unity 8k wallpaper, best quality, stunning environment ,vibrant colors <lora:Kimono:1>
ネガティブプロンプト
nsfw, (worst quality, low quality, extra digits, male:1.4)),
Kimono わふく 和服
プロンプト
1girl,(japanese clothes, green kimono, floral print, kimono, print kimono, sash, wide sleeves, obi),city background,(RAW photo, best quality), (realistic, photo-realistic:1.4), masterpiece, an extremely delicate and beautiful, extremely detailed, 2k wallpaper, Amazing, finely detail, extremely detailed CG unity 8k wallpaper, ultra-detailed, highres, soft light, beautiful detailed girl, extremely detailed eyes and face, beautiful detailed nose, beautiful detailed eyes,cinematic lighting,city lights at night,starry sky,perfect anatomy,slender body,light smile <lora:Kimono_v1:0.8>
ネガティブプロンプト
paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), dot, mole, lowers, normal quality, monochrome, grayscale, lowers, text, error, cropped, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, out of frame, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature
kimono_copax_v1
プロンプト
masterpiece, ultra realistic, 32k, extremely detailed CG unity 8k wallpaper, best quality, soft lighting, solo, ponytail, kamisato ayaka (heytea), official art, official alternate costume, kamisato ayaka, blunt bangs, hair bow, hair ribbon, red ribbon, red kimonos, flower, outdoors, cherry blossoms, 1girl, black bow, cate <lora:kimono_copax_v1:0.4>, masterpiece,ultra realistic,32k,extremely detailed CG unity 8k wallpaper, best quality, stunning environment ,vibrant colors
ネガティブプロンプト
nsfw, (worst quality, low quality, extra digits, male:1.4)),
まとめ
今回PROMPTYでは、
- Stable Diffusionで浴衣や和服の人物を生成する方法
- 浴衣や和服の人物を生成するためのLoRA
を紹介してきましたがいかがだったでしょうか。
プロンプトを工夫することによって、Stable Diffusionでは簡単に浴衣の人物を生成することが出来ます。
皆さんもぜひ試してみて下さい。
~Stable Diffusionで素早く画像生成するには~
Stable Diffusionの画像生成スピードや画像サイズは、グラフィックボード(GPU)の性能によって大きく変わります。
このため、より効率的かつ快適な画像生成を望むユーザーにとって、最適なグラフィックボードの選択が重要となります。
推論処理やLoRAなどの追加学習処理といった大量の計算を効率よく行うためには、12GB以上のVRAMを持つグラフィックボードを選ぶことを強くおすすめします。
2GBや4GBのVRAMを持つグラフィックボードでは、学習プロセスや高解像度の画像生成に支障が出る可能性が高いです。
コスパを重視する方は、RTX 3060を選ぶと良いでしょう。
このグラフィックボードを使えば、Stable Diffusionの画像生成機能を最大限に活用することが可能となります。