AIで画像を生成するStable Diffusion。パソコンにグラフィックボードを搭載したことで動作する所までこぎ着けました。
先日はStable Diffusionが動かずにWeb上のサービスを利用してみたけど、今度はちゃんと自分のPCに作成環境を構築出来たのです。
方法は色々とあるみたいで、「Stable Diffusion Web UI」というブラウザを介して利用できる方法を採用。
ブラウザといっても、ネット上のサービスにアクセスするのでなく、ローカル(自分のPC)に環境を作って、そのUIとしてブラウザがあるということになります。
ネット上のサービスだと有料だったり枚数制限があったりするので、いっそローカルに環境を作ってしまおうということで。
解説サイトが沢山あるので詳しくは書きませんが、手順を一応メモ。
・Stable Diffusion WebUIが入っているzipファイルをダウンロードして所定のフォルダに解凍。
・モデルファイル(AIは様々なパターンで画像作成を学習していて絵のタッチ等に個性がある多くのモデルがある)をダウンロード。
私はとりあえず簡単なテキスト指定で作れるというAnythingにしてみました。(Counterfeit、TrinArt Derrida modelなども良さげ)
・上で解凍したフォルダにある「run.bat」を実行。これで必要なファイルがインストールされます。
実行するとコマンドプロンプト画面が表示され、そこそこ時間がかかりましたし、恐怖のRuntime Errorが出て進まずに苦労しました。
どうもPythonが最新でないようで、Pythonのフォルダに移動してアップデートするコマンドを実行したら解決。
・その後は「run.bat」が正常に動けば「http://127.0.0.1:xxxx」のようなローカルURLが表示され、Ctrl+クリックで作成画面に飛ぶ。
・あとはUIの日本語化をしました。
以下は、今日一時間くらいやって作成したサンプルです。何となく良さげですが、よく見ると微妙に変でちゃんとした絵にはなってない気がします。テキストでどんな画像が欲しいか指定するけど、次々と何枚も作っていると段々変な画像になっていきますw
↓私のTwitterアイコンやブログタイトルに使っている猫の写真を読み込んで元にしたもの
↓失敗な感じが強いもの。右の猫のしっぽの数が多いのか、他の猫と混ざってしまっているのか
↓どうしても絵がエッツな方向になる(上の猫もそうですが、catやgirlの他にsummer beachとプロンプトに追加してるからかw)
↓これはネットのプロンプトを参考にしてbooks, a coffee cupなどを追加したもの
↓もちろん冬の感じもできますので
あと人の指や猫のしっぽの数がおかしいことが結構あるし、異様に混ざった画像とかもあるので、テキスト(プロンプト)の指定をあれこれ考える必要があって、それが面白いかも。
今日は動作確認しただけなので、もう少し調べて確度を上げていきたいと思います。
ネット上には、このプロンプトでこの画像ができましたというサンプルが転がっていますが、そもそも生成モデルが違うので雰囲気も違った画像になるし、思ったように作れないです。
私の目的はDTM曲の背景画像で、そんな凝っていなくてもいいのですが、自分は全く絵心が無いのでこれだけ描いてくれれば面白いですね。
広告とか
-- 記事一覧ページへ --