で、イラスト描けないマンが画像生成AIを使っても画像生成は全然楽じゃないんですけれども、11月と10月は、色々な出力に挑戦してみました。
10月は特にハロウィン関係と背景の実写度を上げる工夫をして、更には現実の背景(渋谷や新宿)などの実写度を上げるのとは別に、仮想の空想の世界の実写度も上げようと。
で、どんな感じで味付けをしようかなって話です。

AIからしたら、この銀髪ちゃんが居る自室やゲーミングPCや、遊びに行ってるカフェやゲーセンなんかも当然実写レベルで描画してくる訳で、でもそれって、結局架空の背景ですよね。
だったらってんで、ドラゴンやモンスターが徘徊する空想の背景も実写にできるんじゃ?という事で、空想の架空の背景でも物理法則をこの現実世界と同じにしてしまえば、実写レベルが上がるんじゃ?という事で、色々とプロンプトを組んでみました。

エンタメとかこの手の空想世界ってのは、99%の真実に1%の嘘を、99%の嘘に1%の真実を混ぜると面白いってのが、なんか頭の中にあるので、完全には実写にせずに、嘘のノイズも混ぜて、自分が思ういい塩梅の絵にしていこうと。
そんな感じです。

巨大な塔があり、燃え盛る炎が見え、荒廃した大地からは水晶の石柱が何本も突き出している。
こんなよくあるありふれたファンタジーの風景ですが、これはこれでいいけれども、イラストチックになっていて、塗も単調で光源からのひかりの反射や影もいまいち、光学現象は殆ど反映されていない。
光源設定の光が届いているだけの所謂アニメ・イラスト調の背景。
これに何かを追加すると、実写レベルになるんですが、、、
何が不足しているのか?この画像の中で一番情報を持っているのは当然銀髪ちゃんです。
髪の毛、顔の作り、肌の質感、そして着ている服装の質感。
それらの情報があるので、光に対して光学現象の影や透過処理などが現実世界と同じ様に行われるわけですが、
この架空の背景には、巨大な塔、燃えているとか、荒廃した大地から突き出した水晶の石柱という見た目の情報しかありません。
それに対して銀髪ちゃんは、こんな服を着ていて、ヘテロクロミアで荒廃した大地に立っているという見た目情報は数百文字なのに、物理法則に関する情報だけで数千文字以上もあり、見た目情報<物理情報となっています。
という事は、この荒廃した大地にも物理情報を追加すれば良いわけです。

で、ここでSORAに自動でやったらいいじゃんと。
わざわざ、そんな自動でやってくれることをなんで???
生成AI使っててなんで自動でやらないの???バカなの???
背景=実写レベルの巨大な塔のある荒廃した大地で水晶の石柱がウンタラカンタラと。
プロンプトなんか数行で済むやないか?と。
思うかもしれませんが、要はこれはSORAはゲームを作るツールと同じなわけです。
RPGツクールやインディ系のゲームを制作するツールと同じなんです。
アセットだけで広大なフィールド、美麗なグラフィックのロケーションで、動きのモーションもアセットで、キャラもアセットで、それで完成しました!!!凄いでしょ!!!なんていうゲームメーカーやゲームスタジオは、中華系ぐらいですよね。
UE5を使っているゲームスタジオもアセットそのままで、ドラゴンズ ドグマ3とかモンハン7とかを作らないですよね?
ゲームメーカーも同じ、UE5で、アセットをそのまま使ってニーア・オートマタの新作を作らないのと同じ。
だから、生成AIのイラストだからこそ、アセットには、無い手作り感が必要な訳です。これ、生成AIなら尚更必要だと思うんです。
ただでさえ、他の人と同じ様な出力になるのに、AI任せだと、もう自分の個性や人間の領域ってないですよね。それなら、もう勝手にAIに色々な絵柄、作風のイラストを出力させときゃ良いわけです。
でも、そんなのは、ってことですよ。
なので、同じ様な似たような絵になりがちな生成AI出力だからこそ、人間の手を加えるのは必要だと思ってます。
で、自分が知ってる&フォローしてる人らは、そこを上手く自分の個性や味を出してるので、作品を見て毎日、すげぇえええと感動したり、なるほどぉおおぉぉと、関心したりしてるんですけど、自分の生成している銀髪のヘテロクロミアのメイドなんて、腐る程居ますよね?
エルフ耳の金髪メイドとか。どこで区別するの?どこで違う味を出すのか?ってことです。同じラーメンでもラーメン屋によって違うのと同じ。
で、ちゃんと独自の味を出しているお店(絵師さん)は強いし、人気もある。

ということで、背景=実写レベルの巨大な塔のある荒廃した大地で水晶の石柱がウンタラカンタラと。やっちゃえば、簡単ですけど、そこにはAIの創作の味しかありませんよね?
全部、SORAで制作、プロンプトもChatGPTに出力させてたら、これ、もう人間要らない訳ですよ。
誰がやっても同じ結果になるんですもん。電子レンジでチンするだけのナッシュみたいなもんです。
それを避けるために、また生成AIを制御して味付けしているのが楽しいので、こんな面倒な方法をしている訳ですが、生成AIが自動でしてくれる事を人間側が細かく制御し、調整するってのは、かなり大事だと思っています。
特に自分みたいな最近、生成AIをやり始めた人間には特に差別化が必要だと思ってます。
仮にパクられた、無断で修正・加筆されて転載されても自分で生成AIが自動で全部やってくる事を100%としたら、それをあえて95%とか105%と過剰に光が透過とか、空気感を重くしたり軽くしたり、自動生成のプロンプトじゃ再現出来ないことをやっていれば、パクられてもわかる訳です。
UE5を使っているスタジオも自分たちの味に調整して、ゲーム内の世界を構築していくわけで、生成AIの創作活動もゲーム制作と同じです。

時々、プロンプトもChat GPTで作ってもらって、ラフもAIで、衣装もAIで、ポージングもAIで、動画含めて全部AIで作ってもらいました!!とか言ってる人を見ると、人間要らんやん。それって創作主はAIやんけ。って思いません?AIにクリックさせられてるだけやんと。
じゃぁ、もうお前が寝てる間に全部AIに生成させたら???って思う時もある。
思うんで、マジで寝てよかなって時もあります。

という事で、物理情報を追加した状態。
地面や水晶に塔などが、イラスト調からグッと実写度が上がりました。
何を付け加えたかと言うと、そのまんま物理情報です。
架空の世界とはいえ、なんちゃら星のほにゃらら鉱石やなんちゃら未知の知らない鉄とかで構築されているわけではないですよね。
あの夢の国のディズニーランドのお城も初代のスターウォーズの映画のセットも、本当に夢の国の素材やタトゥイーンの木材や土や石で作っている訳では無いですよね。
という事は、架空の世界でも実際の地球の素材で作っているんで、地球の素材の物理法則を適用させれば良いだけです。
AIからすれば、、、
荒廃した大地=適当にどっかの大地のテクスチャでええやろ。
巨大な塔=その辺のどっかの塔でええやろ。
水晶の石柱=どっかの石柱でええやろ。
というのを防ぐため、生成AIがよく学習しているであろう有名な荒野なんかを指定していけば良いと思って、素材を色々試し試しでやっていきます。

最終的に園芸関連、建築土木関連から、最適な素材を見つけたので、それを指定しています。
石柱を1本でも2本でも何本でも良いんですけど、光学効果を確認するために左右で分けました。
で、架空世界の背景の素材情報が追加されたので、現実世界と同じ様に光学現象が確認できました。
この地面の光の反射は、背景がアニメ調やイラスト調だと発現しません。
これは、別に地面は光ってるとか、地面に炎が映っているとか反射しているとか、プロンプトには描いていません。
【現実世界と同じく忠実に物理法則を再現しなさい。】と、その物理法則ぐらいです。

で、次はドラゴンの吐くブレスです。
このドラゴンのファイヤーブレス。
これは、気体燃焼、液体燃焼、個体燃焼とで、燃焼の仕方や、炎の色も違います。
これを再現させる為に、ドラゴンの口の中にプロンプトでジェットエンジンを仕込んでいます。

まず、ブレスなんで、気体燃焼でと指定しています。
これは温度が上昇するので青い炎になります。
で、このドラゴンの炎は実際は青です。
ジェットエンジンからバックファイアの様に吹き出てるので、完全燃焼で青い。

そこを敢えてみんなが熱いと感じる炎の色に指定しています。
昼間なんかは完全燃焼の炎は視認し辛いんですよね、なので、敢えて炎の色をわざわざ着色するよう指定しています。

最初のドラゴンブレスと違うのは炎が真っ直ぐでドロっとしていない。
完全燃焼、気体燃焼なので、バスとか家屋が燃えている炎と違うってのがわかると思います。
で、そんな事をしなくても、ドラゴンブレスでOKでしょ?って、その通り。
他の人と同じ様なドラゴンブレスならそれでOKって事です。
でも、自分の味を出すなら一手間必要ってことです。
つまりは、AIの味を出すか、人間側の味を出すかって事です。
同じ猫のAIイラストでも絵師さんによって違うでしょ?
つまり、これはそれや。
ということで、AIはあまり指定がないと手抜きをします。
特にsoraはこちらのテキストをChat GPTが翻訳して伝えています。
最近でも未だにバカなあのChat GPTですが、キッチリ伝えないとかってな解釈をして、手抜きをするように伝えます。
ですが、これらを指示をすると、AIは何が何でもリソースを割いて実写レベルに演算して出力してくる事になります。
これで、AIが手抜きで色の階調を減らして描画したりするの事もなく、指定の描画レベルで描き上げてきます。
SORAのAIは、適当な指定の箇所は、演算負荷の低い手抜きの方へ手抜きの方へと、描画が緩い方へ直ぐに流されてしまう。
これは当然、リソースを高めに維持するよりは、当然負荷が低い方へってことで自然なAIの癖ですけど、それを如何に高負荷に描画させるかの制御が必要です。
ありきたりの描画をさせない。
AIが音を上げるぐらいの高負荷で描画させるが、ギリギリのところを攻める。
でも、これって、何度も言いますけど、プロンプトで、[背景=渋谷の実写で、ドラゴン=リアルに、主人公=可愛く]ってのでも、凄いのは出る訳です。

そこを、自分スタイルにするために、人間が色々考えて作ったラーメンなんだよっていう味を出すために、、、こんな面倒な事をしている訳です。
ゲームもAIイラストもラーメンも、インスタントや工場で大量生産されたものよりも、やっぱり手作りの方が良いってのは、任天堂さんのゲームを見れば、やっぱり丁寧に作るってのは、いつの時代も大事だなって思うわけです。
金型パクって、大量生産してハイ!できた!の中国の粗悪品と、丁寧に作られた製品。
どっちを買いますかって言ったら、後者になりますよね。
という事で、AIイラストだからこそ、人間味を大事にしていきたいなと、いうウザい説教みたいな記事になりましたが、、、
仮想の世界でも現実の素材の情報を提供すれば、SORAは物理しシミュレーターなので、忠実に再現してくれます。
最近話題のBananaは、凄いですけれども、自分的には色々チューニング出来て味付けできる現実世界シミュレーターのSORAは好きですね。(いや、未だに指4本とか、脚3本とか平気で描画してくるから大嫌いだけど!!)

まぁ、SORAって静止画を作るAIじゃないし、そもそもSORAでこれだけの枚数(6月から3万枚以上生成)を制作してる人も居ないだろうから、最後のSORA使いになるまで、適当に頑張ろうかなって思います。
という事で、今回の記事もくそつまんねぇーことダラダラかくやつなだーと思ったらスキを、面白かったよって人もスキをお願いします。
あと、エックスでは銀髪ちゃんのマイクロビキニ画像なんかも投稿(勿論検索除外なし)なので、フォローもお願いします。
あっ、そうそう、あの最近流行ってるSFW(職場で見てもOKだよの文言)あれ、あんま意味ないですよね。よく付けてる人居ますけどwエックスを監視してるAIに余計な学習させて、AIの学習結果が反映された時には軒並みSFW付きやそれに類似した画像が全部アウト!になると思うんですけどね。
で、自分ですが、最近は、検索除外になる事は少なくなりましたね、気合で乗り切れる。
フォローお願いしますね。
