【プロンプト全公開】生成AI 『Midjorney』を使って3週間で1,000枚のクリエイティブを作成し、電車広告に採用されるまで
こんにちは。キュービック新卒1年目のエンジニア倉嶋 将矢(くらしま しょうや)です。社内で随一のAI IQの高さを誇ると自負しています。
キュービックへは大学1年の時にインターンとして入社しました。SEOメディアの運用と新規立ち上げ、SREチームでのインフラのIaC化、スクレイピングシステム開発の業務などを担当。
インターン時代には社長の音声素材と写真を使ってAI世一を作ってみました。(インターンが社長をいじってこんなことしても爆笑に包まれる優しい会社、それがキュービックなんです)
社員になってからは、CTO室でAIの最新動向調査や社内活用に向けた検証などをしています。
また社内でAIにまつわる様々な取り組みを行っています。
▼例えば先日はこんなイベントを企画しました!
広告領域では大きく
バナーや動画広告の作成
ポスターなどのクリエイティブ作成
LPの初稿作成
などで活用が進んでいます。
バナー作成に関してはAdobeのFireflyやExpressを用いて素材生成や背景透過を行い、一部AIで生成することで作成しています。デザイナーの力を借りてテンプレート化も進めているため、大量生産体制が徐々に構築されつつあります。
この記事では僕がなぜ、約1000枚のアウトプットを作り、試行錯誤の末、電車の中吊り広告がだされたのか、その軌跡を実際の指示の文言(プロンプト)とともに世にさらけ出しちゃいたいと思います。
AI初心者の方はどのような指示を出したらどんなアウトプットになるのかを学ぶものとしてマーケターや広告業界の方は、AIのアウトプットを広告にするためにはどんな苦労がかかるのか、面白がりながら読み物として楽しんでもらえれば幸いです。
はじまりは突然でした。クリエイティブディレクターからのチャットです。
「お疲れ様です〜。入社は落ち着いたかな?」から始まる一連のメッセージ。
そう、何を隠そう僕が入社して1週間後の出来事です。通天閣の前で男女が浮いてる画像って作れたりします?って…新卒1年目にこんな相談が飛んでくる会社、それがキュービックです。
AIと聞くと「最新技術」「あっといういうまに出来上がる!」「デザイナーのお仕事がなくなるかも...!」などとささやかれてますが、実はそんなことありません。
人が脳内で作り出したイメージと近づけていくのってめっちゃ大変なんです。しかもどんなアウトプットになるかは毎回変わるから博打みたいなものです。
今回は、そんな僕がどんなフローでAIを駆使し電車の中吊り広告を制作したのかびっくりするほど地道な制作過程を実際のプロンプトとともにお届けします。
ことの背景は株式会社 大阪メトロ アドエラが運営するプロジェクト「aeru Osaka」と、キュービックのグループ会社であるParasolが運営するパーソナライズ婚活サービス「ヒトオシ」がタイアップして、Osaka Metro沿線での出会い・婚活・地域活性化をサポートする「aeru Osaka ×ヒトオシ婚活応援キャンペーン」を実施しようとなったのです。
しかし、納期はなんと3週間。
広告代理店などにお勤めのみなさんなどはその大変さを重々承知かもしれませんがロケハンして、キャスティングして、撮影して、データ入稿して、デザインして…全ての工程を3週間で…なんてはっきり言って無理!ですよね?
そこでキュービックが誇るAIスペシャリスト、この倉嶋に白羽の矢が立ったわけです。
新海誠風はどこまで新海誠風になるのか(1〜125枚目)
というわけで早速クリエイティブディレクターからの依頼にあるように「君の名は」「天気の子」など有名作品を世に輩出している日本を代表するアニメ監督新海誠さんのイメージで、男女が飛んでるデータを作ってみようとトライ。
下記の記事を参考に、新海誠さん風のテイストを作ります。
指示はこんな感じ。
Sunset, weather rain, clouds, rainbow rain, city of Tokyo, steel tower, Makoto Shinkai style
果たして「Makoto Shinkai style」でどこまで表現してくれるのか。
かなりテイストが寄りました。「今から晴れるよ!!!」って聞こえてきそうですね。でも、本物のアニメ画像を学習させるとかなり寄り過ぎかも。あくまで風なので今度は、このスタイルで通天閣を出せるかトライしてみます。
「 city of Osaka, Tsutenkaku Tower, steel tower」を加えます。
おお〜「通天閣」という文字は崩れてしまいますが…問題なく出せそう。
次に人を出してみます。まずは女の子ひとり。
結論、「Shinkai Makoto Style」と入力するとかなりスタイルは寄せられる。
Sunset, weather rain, clouds, rainbow rain この辺りの指示を入れるとよりドリーミーに。
空を飛ばせてみた(125〜500枚目)
今度は宙に浮いてもらいましょうかね
いけそうですね。浮遊感がしっかりでています。
次は通天閣を横目に浮いてもらいましょう。69枚目の挑戦です。
悪くはなさそう。ちゃんと通天閣っぽいものの近くで浮いてくれてます。
次はふたりで浮いてもらいます。「1woman and 1 man, floating in the sky with one hand outstretched」を加えて…
どうだ!
浮いてくれた!けれど、若い。プロンプトでは指定していないのに勝手に学生っぽい感じで出してきますね。
『ヒトオシ』は25〜35歳がボリュームゾーンなので要改善です。今度は服装と年齢も指定してみます。ドレスとスーツを着用させてみます。
一部は東京タワーになっちゃったものもありますが通天閣とともに大人の男女が無事、空を飛びました。アニメーションだけではなく、実写のパターンも、ということだったので、実写でも生成してみます。
ちなみにプロンプトの書き方は「写真のテイスト、登場人物、髪型や表情などの詳細、天気や場所、その他」の順番で構成するとAIの出力の精度が上がりそうです。AI界隈のなかでは基本情報ですが、倉嶋自身もやってみて、他の順番でも生成できなくはないけれど、よりはやく正確にAIも処理がしやすそうだなという順番になっています。英作文の文法みたいなものです。(文法があやふやでも伝わることには伝わるけど、よりスムーズな会話が外国人とできるよねってイメージ)
さてもしかしたら、お気づきの方もいますかね?「one beautiful cute harajuku Instagram woman」女性を生成する際になぜこんな回りくどい言い方をしているかというと、AIに「japanese」と打つと着物を着た女性が出てきてしまうのです。
「asia」だと韓国人とも日本人ともどちらとも言えないような人物が生成されてしまいます。現代の日本の女の子を生成したい場合は「harajuku」や「Shibuya」「Tokyo」と言った文言をいれてあげるとよいのです。
夕日バージョンも出してみます。
ちょっと非現実的なプロンプトはアニメっぽくなっちゃいますね。「weather rain, clouds, rainbow rain」を消して”夕方”というプロンプトのみに絞ってみます。
通天閣も真ん中に位置し、いい感じになりました。続いて、特に参考画像は読ませず、ネオンっぽくしてみます。「Night, neon Tsutenkaku Tower in the middle」をプロンプトに挿入。
これはこれで面白いですね。ラ・ラ・ランドっぽくなりました。
少し指示を減らしてみたりします。
指示を減らすとちょっとごちゃつきますね。構図や街の感じが変わっちゃいました。
新婚パターンも作ってみます。今度はしっかり構図やポーズを指定。
こういうのもありですが、なぜか通天閣が東京タワーになってしまう現象、再来。笑 何度か試行錯誤したものの全然通天閣がでてきてくれないので(どこ行った、通天閣) 一旦消してみると…
だいぶ上空にいっちゃいました…。後から通天閣を追加してみます。
後から追加すると、結構、違和感が残りますね。通天閣の輝きが眩しいです。
ちなみにAIって面白いのが”同じ”プロンプトでも出てくるアウトプットが毎回違って「one beautiful cute harajyuku Instagram woman in a dress and man in a suit」って言っているのに
なんてこともあります。笑
何度も何度も出てきたアウトプットをみて、プロンプトを変える、この繰り返しなのです。地道に作業を続けていれば、いいアウトプットも出てくるのでこの辺でParasolの「ヒトオシ」デザイナー神垣さんにフィードバックをもらいます。
顔崩れに対抗せよ(500〜750枚目)
これまで、計750枚の生成を行い、上記の候補がイメージと近い感じに出てきてくれました。
神垣さん>表情がもう少しわかるようにならないかな?
とのこと。広角だと顔のディティールを表現できなくなってしまっているのです。超高解像度の人間の写真生成は画角とポーズの関係で一定の限界は有りそうなので
・顔が映らないようにして破綻を減らす
・人間と背景は別で生成する
が対策として考えられそうです。
とはいえ、人間と背景を別で生成すると、ライティングの一貫性がなくなってしまうことがリスクに挙げられます。フォトショで調整するとしてもかなり骨が折れそうです。
この背景画像をもとに女性を生成してみますがトンマナが合いません。この両者を合成するのは違和感が出そうです。
また同じように背景画像を参考に女性を飛ばしてみますが、やっぱり顔の描写は繊細さが足らないままです。
飛んでいる女性を生成するのも実は難しいんです。
・先に近いところで顔を生成して背景はアウトペインティングで生成する
という手法もとってみます。例えばこんな感じ。先に構図を人間に寄ったものを生成し、後から広角にします。
…がBeforeから顔が崩れていて違和感を感じます。背景の通天閣と人間の顔はどちらも細かくは生成できないんですね〜
もともと学習しているであろう画像は
・通天閣の写真
・人の顔の写真
のはずで「通天閣で飛んでいる人の顔の写真」は学習していないはずなんです。なので、この学習していないであろう構図を出そうとするとデータ量が足らなくて顔が崩れる現象が起こるみたいです。
顔と通天閣を同時に生成すると顔の繊細さがなくなるので(風景だけor顔だけじゃないと繊細な生成にならない)のでアウトペインティングでは厳しそうです。
続いて…
アップスケールで高解像度化してディティールを繊細に描写させよう
荒い写真から繊細な写真を予測するAIも別であるため、最初は顔が崩れていても後から処理をすれば顔も予測されてきれいになるのではないかと考えました。生成された画像の女性部分だけを切り取って…再度参照のうえ、生成してみます。
この画像をもとに再生成すると…
男性も同様の処理を行い足など色味の違和感をフォトショップで少し修正すると…
確かに人間の解像度は上がりますが、一度に生成して出てきたものではない&合成しているので少し違和感が残りますね。
倉嶋>表情ここが限界そうです・・・
ヒトオシデザイナー神垣さん>うーん、これを見て女性も男性も「いいな」って惹かれないよね・・・多少の恋愛への憧れもあってヒトオシを始めて欲しいんだよね・・・
倉嶋>ですよね〜
その後も試行錯誤を繰り返しますが、やはり情報が多いせいか顔が鮮明にならないのと後から切り貼りすると上記のように違和感がでてしまいます。
倉嶋>飛ぶと町並みがなくて大阪感が出にくいし、全身が映らないといけないから顔が破綻してしまう…一旦条件を減らしたらどうなるか検証したいです!
そこで倉嶋がとった手法は…
いったん、飛ぶの諦めてみました(750〜800枚目)
これだけやってそもそもとばせないんか〜いというツッコミが方々からきそうですが、時には諦めも大切。
AIを使ううえでの僕なりのコツは、できる・できないをしっかり理解することです。まったく異なる条件や切り口で生成してみたら予想外のアウトプットがでることもありますしね。
新たなプロンプトのアウトプット。
お〜これだと表情の破綻なさそう。今度は「道頓堀」という指示も追加してみます。
これだと看板の文字崩れが気になっちゃいますねw 「ナナンプ?」「め”やじ?」 なんて書いてあるんだww 画像生成のAIは文字が弱めです。
ポートレートでだしてみます。(ポートレートは、プロンプトで打ち込む場合もあれば、ものによっては勝手にポートレートになるものもあったりします)
うん、この画角なら安定して表情も出せそうですね。ポートレートにして周囲をぼやけさせることで文字崩れも気になりません。
ちょっと寄り道。ジャンプ・ハイタッチ・向き合うのみなどなどポーズは自由自在
ヒトオシのLPをずっと見続けて他にどんな構図が出せそうか頭を抱えます。
キュービックで他部署のひとに(倉嶋が何をしているかよく知らない)「お!婚活ですか?いいですね」と言われるほどにw
色々できそうなこともわかったし、これはこれで躍動感があって◎もはや向き合うプロンプトすらなくしてみると…
背中もいい感じですね。大阪っぽさは、ぐっと上がりました。
年齢層をあげたパターンも見てみたいと要望をいただいたの生成してみたら迫力が違った(800〜830枚目)
ヒトオシデザイナー神垣さん>もう少しいろんなパターン見てみたいな…。大阪はおばちゃんの文化があるし、ヒトオシのサービスの「お節介」の文脈もあるから年齢層もあげたパターンもみてみたい!
ということで生成したみたのがこちら☟
年齢あげるとだいぶ画角がズームになったのはなぜだろうwそして右上は…さ、侍…風?
これもこれで味がありますが、マッチングアプリのターゲットからは外れるのでボツ。
メトロの画像に近づけさせたら服装の色合いまで学習しちまった
(830〜900枚目)
これまでのアウトプットと広告の方向性を踏まえ、
・ポートレートでない方が良い
・ 大阪メトロの車内風が理想
・顔の描写を表現できるような現実に近しい形
でアウトプットを出していこうと決まりました。大阪メトロの画像を参照させ、感じをつかみます。
※ここでいう参照とは、生成時に参考にする写真を与えることでスタイルが似た写真の生成を狙うことをいいます。
いざ生成!
電車の中であることはとっても伝わるが、大阪メトロのオレンジ・茶色の座席を学習したせいで、服装まで引っ張られているwww
電車が異常に細くなっていたり、黄色い線がでてきたりと破綻がけっこう増えました。
考えられる要因としては「似たテイストにすることにAIの思考が傾いているから」「空の車内から生成している」「写真のスタイルが寄るだけで構図は近づけられていない」などが考えられます。
ということで素材で学習させることを諦め、1から生成。まずは背中合わせパターン。
素敵に仕上がったけれど、これはこれで非現実的すぎる。満員電車でもないのに、他人同士が背中合わせなんてあり得ないですよね。笑
続いて横並びパターン。
続いてのパターン…
”向かい合ってスマホを操作”は不自然すぎました。
wwwwwwwww
近すぎる。不自然にもほどがあります。この構図は結構生成しにくいです。
他にも「向かい合ってスマホを操作」のパターンでいくつか出してみます。
人の立ち位置コントロールが難しいのと、電車内の出し方にばらつきが出ますね。日本の電車にはない柱が立ってしまっていたり。あと、プロンプトのsummerに引っ張られすぎて海やフェス帰りかな?という服装もちらほらw
次に、女性がスマホを操作していて、後ろに運命の男性が…!的な構図にも挑戦。
ん〜椅子の配置がバス〜!!!!
こっちもバス〜!!!!
まだまだ行くよ!構図への挑戦。「男女が降り際にすれ違い」パターンにいってみよう。
青春の1ページのようなイメージが生成されました。惜しいところまではいきますが”すれ違い”のコントロールが難しい。ふたりを同時にコントロールするのが難しそうです。
服装をノースリーブやブラウスなど夏服っぽくしたいので、summer って入れましたが、麦わら帽子や構図自体が夏っぽくなってしまいますね。服装を別途指定しないといけません。
とはいえ、様々なパターンが出来上がったのでこれらを持って、3回目のフィードバック。
・男女が背中合わせでスマホを見ているイメージ
・二人が横並びパターン
・向かい合ってスマホを操作しているイメージ
・女性がスマホを操作していて、後ろに運命の男性がいるイメージ
・男女が降り際にすれ違う
神垣さん>
構図は背中合わせか斜めが良さそうだね!サービスのペルソナをもとに男性は31~34歳くらい、女性:28~30歳くらいで生成しよう!
服装は
・通勤している姿
・リュックなどがあるといいよね
・また背景はニュートラルめな色合いにしてみよう
・斜めの構図で女性が前の方が良さそうだね
倉嶋>ラジャ
構図、表情、背景すべてを希望通りに生成するのはとてつもなく難しい…!(900〜950枚目)
というわけで、方針が決まったところでまたさらに僕の試行錯誤の日々が始まるのですが生成AIをこれから触るひとにはぜひ覚えていて欲しい…!
すべてを希望通りにだすなんて、無理だってこと…!!まずは電車の画像を読み込ませて生成してみるものの…
車内がスカスカに…!もともとの画像が人がいないのでこんなことになってしまうんですね〜
今度は単体で素材を作ってみます。
女性・男性を単体で生成。女性は斜め前から、男性は斜め後ろからの画角を出せるか調整してみたり。単体となるといくらでも向きが変えられることがわかりました。
こんな感じのプロンプトを打てば、すれ違い様っぽい感じを生成することが可能です。
最終フェーズ「着せ替え」(950〜1000枚目)
神垣さん>バッグなど、通勤している感を入れたいですね〜
男性→もうちょっと年齢を2〜3歳あげる感じでもいいかなと思っています
女性→体の厚みをなくす、服装もっと可愛く(シャツっぽい感じではなくブラウスや、カーディガン系)
また、もうちょっとヒトオシの男性会員から集めた、理想のタイプに近づけられると嬉しいです!(清楚めというか)
倉嶋>ラジャ
大体の構図と人物イメージは固まったので、ここからは(いや、これまでも、これからも)数の勝負。Zoom out やブラウスなのかノースリーブなのか、鞄の色はどうするのかディティールを詰めに行きます。
ラストスパートぉぉ!!!!
こちらが実際に掲載された電車の中吊り広告です!
僕の1000枚以上のアウトプットの末、ここまで辿りつきました。「運命のヒトは近くにおるかも。」というキャッチコピーとともに、最終形態がこのクリエイティブとなりました…。
AIを使いこなすための方法はシンプル。とにかく量を出してみることです。色々試してみると、出来ること・出来ないことがわかってきてその制約の中でどうやってクリエイティブに落とし込むか考えてみるのが大事です。
”AIだったら何でも出来る”は幻想で、AIでも出来ること・AIだから出来ることをしっかり見極めていくことがこれからのクリエイティブ制作では必要だなと感じます。
ここまで書いてなんと12800字の超大作となりました。笑
最後までたどり着いてくれて、キュービックってなんか面白そうなことやっているや〜ん!と思った方はこちら☟
パーソナライズ婚活サービス「ヒトオシ」の詳細はこちら☟
キュービックグループでは、AIと広告の共生をさらに進めていく方針です。
また面白い取り組みがあったらご紹介しますね〜!