ずっと気になっていた画像生成AI(Stable Diffusion)をついに触ってみました。
ローカルに環境構築するやり方とクラウドを利用するやり方があるようですが、予めこれ用に自宅PCにグラボを追加していましたので、迷うことなくローカル構築しました。
環境構築はこちらが参考になりました。ありがとうございます。
そして、男のロマン、美女の画像生成にも成功しました。ありがとうございます。ごちそうさまです。
画像生成AIでは、呪文と呼ばれるテキスト(英文)から画像を生成することができますが、始めたばかりで、何でも良いから何かテストしたい気持ちでした。
そこで、好きでしょっちゅう聴いているラジオ番組「JET STREAM」の冒頭の詩で、どんな画像が生成されるかやってみました。
JET STREAMの冒頭の詩
原文はこちらです。
遠い地平線が消えて、深々とした夜の闇に心を休めるとき、はるか雲海の上を
音もなく流れ去る気流は、たゆみない宇宙の営みを告げています。
満点の星をいただく果てしない光の海を、ゆたかに流れゆく風にこころを開けば、
きらめく星座の物語も聞こえてくる 夜の静寂のなんと饒舌なことでしょうか。
光と影の境に消えていったはるかな地平線も、瞼に浮かんでまいります。
JET STREAM 旅への誘いざない詩集ー遠い地平線が消えてー 堀内茂男/著
上空ではものすごい速さの風が吹く中、太陽が沈み、宇宙が見え始め、星座が語りかけてくるような夜の綺麗な情景を思い浮かべることができます。言葉一つひとつがとても綺麗な詩です。
生成AIに与える呪文は、正直ここまで綺麗な文章でなくても良いです。必要な情報をカンマ区切りで与えてやるだけで生成してくれます。
まずは、これを英語に翻訳します。英語は得意ではないので、Google翻訳に丸投げです。
こんな感じになりました。翻訳の善し悪しは本質ではないので無視することにします。
When the distant horizon disappears and your mind rests in the deep darkness of the night, far above the sea of clouds,
Air currents that flow away without a sound tell us about the constant workings of the universe.
If you open your heart to the wind that flows abundantly through the endless sea of light filled with stars,
You can even hear the stories of the twinkling constellations, and how talkative the quiet Shijima is at night.
The distant horizon that disappeared between light and shadow now appears on your eyelids.
JET STREAM 旅への誘いざない詩集ー遠い地平線が消えてー 堀内茂男/著(Google翻訳による英訳)
画像生成結果
画像生成AIは、使用するモデルによって出力結果が変わります。イラストレーターさんが変わるイメージです。
今回は、3種類のモデルを試してみました。
- blue_pencil-XL
- majicMIX realistic 麦橘写实
- Mklan Art Version
blue_pencil-XL
アニメの絵に特化したモデルで、アニメキャラクターを描くことが得意です。
JET STREAMの詩で以下の画像が出力されました。
上空からの視点とはいきませんでしたが、きれいな地平線と星空がイラスト調で描かれました。
アニメキャラクターが描かれているところも、このモデルの個性を感じます。
majicMIX realistic 麦橘写实
写真のような現実世界を描けるモデルです。
JET STREAMの詩で以下の画像が出力されました。
今回は横長の画像に設定してみました。
こちらも上空視点ではないですが、地平線と夜空が写真のようにしっかりと描かれています。
Mklan Art Version
CGっぽい絵が出せるモデルです。
JET STREAMの詩で以下の画像が出力されました。
星座っぽい感じが反映された幻想的な夜空が描かれていて、このモデルの個性を感じます。
コメント
画像生成AIを始めて2日目でプロンプトを十分に試せていませんが、それでもこのクオリティが出せることに驚愕しました。
分かったこととしては、思い通りの画像を出すには修行が足りないということと、久々に沼にハマる感覚があったということです。
普通にあっち系の画像が出せるのにも驚きました。LoRAでクオリティを上げたらヤバいのができそうです。(=゚ω゚)
プログラミングで直接画像処理をしていた時期もありましたが、レベルの違いを感じます。
コメント