【Stable Diffusion】SDXL1.0がリリースされたので試してみる

Windows,環境構築,画像生成

こんにちは、しきゆらです。
今回は、以前投稿した画像生成AIのモデルであるSDXL1.0がリリースされたので試した結果を簡単にメモしておきます。

以前投稿した画像生成AIのStable Diffusionですが、その開発元であるStability AIが作成したモデルであるSDXL 1.0がリリースされました。 SDXL 1.0については公式のアナウンスを見ていただきたいです。


ざっくり翻訳しながら読んだ感じだと、以下のような特徴があるとのこと。

  • 他のモデルで生成した画像より、多くの人に好まれる絵を生成できる
  • 画像内の要素の配置をいい感じに表現しやすくなった
    • 例として、背景の女性が手前にいる犬を追いかける、というのを上げていた
  • 画質を調整するプロンプトがなくても高画質な画像を生成できるようになった
  • オープンなモデルの中で最大のパラメータを持つ

うれしいのは3つ目のところでしょうか。
これまでは画質を上げるために「masterpiece」や「best quality」のようなプロンプトを入れることで画質を上げるテクニックを使うことが多かったのですが、SDXL1.0ではこれらを含まなくてもよいらしいです。

では、導入方法を確認していきます。

SDXL1.0のダウンロード・インストール

上記のアナウンス内にあるGithubページからリンクが張られていました。

下記から「sd_xl_base_1.0.safetensors」をダウンロードし、「stable-diffusion-webui-directml\models\Stable-diffusion」に設置します。
※ ここではdirectml版を利用していますが、ほかのものでも基本は同じです。

続いて、下記から「sdxl_vae.safetensors」をダウンロードし、「stable-diffusion-webui-directml\models\VAE」に設置します。

これで設定は完了。

では、実際に使ってみます。

SDXL1.0で画像を生成してみる

いくつか生成してみました。
すべて縦横1024pxで生成しています。

数語のプロンプトでも生成してみましたが、いい感じに生成してくれています。
ただ、これまでつかっていたプロンプトとは絵柄が変わっているので、好みの絵を出すにはまた調整していく必要がありそうです。

また、SDXLのモデルを使用するとメインメモリをもりもり消費します。
32GBメモリのうち20GB以上空いている状態で実行してみましたが、SDXL 1.0を選択するとメモリ使用率100%になりSSDも使うようになっていました。メモリ32GBでは厳しいかもしれません・・・。

CORSAIR DDR5-5600MHz デスクトップPC用メモリ VENGEANCE RGB DDR5シリーズ (PC5-44800) 64GB ブラック [32GB×2枚]

まとめ

今回は、Stable Diffusionの開発元であるStability AIが作成したモデルであるSDXL1.0を使って画像生成してみました。

結構リリース前から話題になっていただけあって、これまでのモデルとは大きく変わっている印象を受けました。
今後の発展にも期待したいところです。

今回は、ここまで。

おわり