【AI/画像生成】Windows11のAMD環境でStable Diffusionを動かしてみる

2023年7月2日2024年8月20日環境構築,画像生成

こんにちは、しきゆらです。
ChatGPTや画像生成など、AIが持てはやされて久しい昨今。
今回は、AMD環境でStable Diffusionを動かそうと思います。
なお、Stable DiffusionはCUDAを使うため基本的にはGeForce/NVIDIA RTX(旧Quadro)環境が必要になります。
Radeon環境ではそのままでは動かないので、Microsoftが提供しているCUDAの代わりDirectX12を使ったDirectMLを使って動くようにした「Stable-Diffusion WebUI DirectML」を使っていきます。

1. 追記: 2024/08/20
2. 画像生成AIとは
3. Stable Diffusion WebUI DirectMLを導入する
4. 動かしてみる
5. まとめ

追記: 2024/08/20

WSL環境でComfyUIを動かす記事を書きました。
生成速度もWin環境よりもだいぶ速いので、ご興味があればこちらもどうぞ。

【WSL2】Radeonでもまともな速度で画像生成したい

—- 追記ここまで

画像生成AIとは

画像生成AIとは、利用者がテキストやデータをAIへ入力し、入力を受けてAIが画像を生成する技術を指します。

AIというと、初めのころは特定の分野に特化した判断や識別などに利用されていました。
2000年代後半ころからはハードウェアの性能が上がったことが要因となり機械学習・ディープラーニング等が活発に利用されるようになり、将棋や囲碁等でAIがプロ棋士に勝利するようになってきました。

2020年からは、大量のデータから規則や構造を学習し、入力に対して同様なものを生成するAIが登場しました。
質問するとそれっぽい情報を返答してくれるChatGPTや、テキストで要素を列挙すると画像を作成する画像生成AIなどの生成AI・ジェネレーティブAIという分野が現在活発になっています。

上記のような生成AIのうち、画像を生成するAIの総称を画像生成AIというように表現されています。
よく使われるものとしては、DiscordからBeta版が利用でき気軽に使い始められるMidjourny、テキストのほかにも画像やControlNetと呼ばれるデータを入力して細かく生成する画像を指定できるStable Diffusionなどがあります。この他、Adobe Photoshopに搭載されているAdobe Firefly、Web上やMicrosoft Edgeのサイドバーから利用できるImage Creatorなど特定のツール・サービス上から利用できるものも存在しています。

Unknown Title

Unknown ...

https://www.midjourney.com/

Stability AI

Stability AI sparked the Generative AI revolution with the release of Stable Diffusion, developi ...

https://ja.stability.ai/stable-diffusion

生成塗りつぶしで創造力をさらに広げよう

アドビの画像生成AIを活用すると、テキストから画像やベクター、ビデオ、3Dを作成できます。Adobe Fire ...

https://www.adobe.com/jp/sensei/generative-ai/firefly.html

無料の AI Image Generator - Bing Image Creator

Bing のインテリジェント検索機能により、探しているものをより簡単にすばやく見つけられるようになり ...

https://www.bing.com/create

なお、画像生成AIについては、著作権や利用している学習データなど様々な問題が議論中です。
利用についてはあくまで自己責任ですが、手元で動かして遊ぶ以外にもアイデア出しの補助や構図の参考など使い方によっては便利であるのは間違いないかと思います。
使い方、生成物の利用・扱いに注意しながら楽しみましょう。

・・・と長々と書いてきましたが、ざっと調べたものなので
誤解やおかしな点などあればコメント等で教えていただければ幸いです。

ここからは導入・動作を見ていきます。

Stable Diffusion WebUI DirectMLを導入する

基本的にstable-diffusion-webuiのWikiにある「Install and Run on AMD GPUs」の手順に従って進めます。

Install and Run on AMD GPUs · AUTOMATIC1111/stable-diffusion-webui Wiki · GitHub

Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creat ...

https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki...

まずは、Python 3.10.6をインストールし、PATHを通します。
ここからダウンロード可能です。
※ 手元の環境では3.10.11でも動作していますが、まずは手順に記載されているバージョンから試してみてください

Download Python | Python.org

The official home of the Python Programming Language

https://www.python.org/downloads/

PATHの通し方はこの辺を参考に。

【Windows 11対応】Path環境変数を設定／編集して、独自のコマンドを実行可能にする：

Windows 10やWindows 11でよく使うコマンドやツールなどがあるなら、それらをまとめて1つのフォルダに ...

https://atmarkit.itmedia.co.jp/ait/articles/1805/11/news035....

続けてGitをインストール。

Git

Git Git is a free and open source distributed version control system designed to handle everythi ...

https://git-scm.com/

Gitをインストール後、こちらのリポジトリをお好みのところにクローンしてきます。

GitHub - lshqqytiger/stable-diffusion-webui-amdgpu: Stable Diffusion web UI

Stable Diffusion web UI. Contribute to lshqqytiger/stable-diffusion-webui-amdgpu development by ...

https://github.com/lshqqytiger/stable-diffusion-webui-direct...

基本的な準備はこれでおしまい。
簡単でよいですね、ありがたい。

実行時は、webui-user.batをダブルクリックして立ち上げます。
なお、環境によって必要なオプションがあります。
この辺を参考に、お使いの環境に必要なものをピックアップしてset COMMANDLINE_ARGS=のところに追記してください。

Command Line Arguments and Settings · AUTOMATIC1111/stable-diffusion-webui Wiki

Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creat ...

https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki...

手元の環境は、以下を記載しています。

set COMMANDLINE_ARGS=--disable-nan-check --no-half-vae --autolaunch

動かしてみる

webui-user.batを実行して起動を待ちます。
初回実行時は諸々必要なものをダウンロードしてくるので時間がかかるので、気長に待ちましょう。

オプションに--autolaunchを付けておくと、起動後規定のブラウザが立ち上がります。
つけていない場合は、Running on local URL: http://127.0.0.1:7860と記載がされれば起動完了です。
ブラウザにURLを入れて開きましょう。

なお、実行環境については過去の投稿にまとめていますが、以下の通りです。

こんにちは、世界

こんにちは、こんばんは、おはようございます管理人のしきゆらですこのサイトは、管理人のしきゆらが ...

https://shikiyura.com/2015/06/hello_blog/

CPU	AMD Ryzen 9 7900X
GPU	AMD Radeon RX7900XTX
メモリ	DDR5 96GB (5600MHz)

PC構成

ブラウザで開くとこんな感じ。

Prompt/Negative promptのところにいわゆる呪文と呼ばれるプロンプトを記載して、右上にあるオレンジ色の「Generate」を押せば生成が始まります。
それぞれの設定値については調べていただければと思います。

手元で動かしながら調べつつやっているので、もしかしたらまとめるかもしれません。

ちなみにですが、ハローアスカベンチマークの設定で512×512サイズの画像を生成した場合、1枚当たりおおよそ8秒程度で生成可能です。
ただし、CUDAではなくDirectML環境だからか生成結果はちょっと異なっているようです。

まとめ

今回は、最近話題の画像生成AIの1つであるStable DiffusionをRadeon環境で動かしてみました。

調べてみると、生成画像と呪文・プロンプトをセットで掲示してくれているサイトがいくつかありますが同じものを生成することはできないのでご注意ください。

ただ、PCスペックが許せばかなりの速度で生成してくれるので、遊んでみてはいかがでしょうか。

今回は、ここまで。

おわり

Posted by しきゆら

【画像生成】生成した画像をEagleを使って整理する

【Ruby】make 10 パズルを解くプログラムを書いてみる

コメント一覧

まだ、コメントがありません