Midjourneyで思い通りの絵を出したい【やってみた】

Midjourneyで思い通りの絵を出したい【やってみた】

「Midjourney」というAIが話題になってます。

簡単に言うと「こんな感じの絵を描いて!」って言うと「良い感じの画像」を作ってくれるAIですね。

「描いてほしい画像の特徴を人間がテキストで入力(英語)」→「AIが画像を出力」

で、↑こんな感じの絵が約1分で出来ます。指定は「海底都市の夜景」。

生成される絵がハイレベルなだけでなく、オーダーにかなり柔軟に応えてくれるというのも話題のポイント。

今回のアイキャッチ画像も「Midjourney」で作ってみました。(使ったのは有名なフレーズです。予想してみて下さい)

 

ただ、「思い通りの絵を描いてもらうためのオーダー」には色々とコツも必要なようです。

今回は「Midjourney」の使い方をまとめつつ、私の試行錯誤をお見せしていきます。

Midjourneyは無料利用者の画像出力回数が限られているので、「なるべく少ない試行回数で自分の好みドンピシャな画像が作りたい!」という方々の参考になれば良いなと思っています。

 

Midjourneyの始め方

Midjourney

↑公式サイトはこちら

MidjourneyはDicsord連携アプリなので、Discordのアカウントを作る必要があります。

 

詳しい導入手順は以下の3つの解説ページが分かりやすいです。どれか1つ選んでどうぞ。

 

洋風イラスト自動生成「Midjourney」 AIが1分で描いたと思えない濃密な世界観 – KAI-YOU

Midjourneyの使い方|TRPGの背景や挿絵に使える画像をAIが自動生成

Midjourney Beta – キーワードを元にAIの力でアーティスティックな画像を生成してくれるサービス!無料のオープンベータ版を利用可能!

 

「#newbies」チャンネルに入室するところまで辿り着いたら、ひとまず導入成功です。

 

まず色々眺めてみる

DiscordのMidjourneyサーバ内にある「#newbies」チャンネルのどれかに入室します。

この解説記事で言えば、【3.「/imagine」+好きな英語を入力】の直前までやります。

ここで「/imagine prompt」に続けて文章を打ち込めば絵が生成されるわけですが、何も打たなくてもどんどんログが流れていくことに気付くはずです。

無料ユーザーは基本的に「相部屋」状態になっているので、同じ時間帯に同じ部屋で画像生成している人が自分以外にいると、その人の生成画像などが勝手に流れてくるわけですね。

試行錯誤回数を節約したい無課金勢にとって他人の試行錯誤は重要です。

部屋を流れていくみんなのログを眺めて、「どんなワードを入力するとどんな絵が出力されるか」みたいな感触を掴みましょう。

 

TwitterでバズるMidjourneyの絵は「面白い絵」や「良い絵」が多いですが、ずっと眺めているとなかなか玉石混交だなという印象を受けます。

そういう意味では、山ほど生成される画像の中から「これはスゴい!」という絵を選んできてバズらせるには、「人間の目」というフィルターが不可欠だとも言えます。

 

個人的には、「面白い絵」は以下のどちらかのパターンが多いように感じました

①曖昧な指示を最小限に出して、「AIの想像力」をめいっぱい発揮した絵

②ガチガチに指示を入れて、「指示した人間の理想」を具現化した絵

中途半端に具体的な要求をいくつか並べたものは、「そりゃそうなるだろうな」という程度の、あんまり面白みが無い絵になりがちですね。(※個人の感想です)

①は慣れとセンスと閃きみたいなとこあるので、まずは②を目指してバリバリ試行錯誤してみようという所存です。

 

とにかく試してみる

さて、ここから入力を繰り返していくわけですが、先にターゲットを決めましょう。

今回は「アルチンボルド風に描いたキツネ」を描かせてみようと思います。完全に私の趣味です。

ちなみに知らない方向けに紹介しておくと、アルチンボルドはこういう感じの絵をたくさん描いている画家です。

この顔みたいなテイストで、「フルーツとか野菜を組み合わせて描いたキツネ」を狙っていきます。

 

まず「単語の羅列」パターンで、「Arcimboldo, fruits, fox」で行ってみましょう。

「フルーツ&キツネ」が出てきた。これはまぁ想定内。

次は名詞節で、「a fox consisting of fruits and vegetables painted by Arcimboldo」にしてみましょうか。

ちなみに「これって英語で何て言えばいいの?」って時にはDeepLをガンガン頼りましょう。

手打ちの英文で「これって言いたいこと言えてる?」みたいなのを確認する時にも使えます。

さて、今度はこうなりました。

やっぱり「果物まみれになっているキツネ」になってしまう……?

説明の方向を逆にして、「いくつかの果物と野菜が集まってキツネのシルエットを構成しているアルチンボルド風の絵」をDeepLに突っ込みます。そして出てきた文章「An Arcimboldo-style painting in which several fruits and vegetables come together to form the silhouette of a fox.」をそのままMidjourneyに。

左上のやつは方向性としては惜しい感じ。

他のは「シルエット」が「輪郭」みたいなニュアンスじゃなくて「影絵」として伝わってしまってますね。これは素直に私が悪い。

しかし左下のは……なんだろうこれは……ハリネズミか何かじゃないですか……? 少なくとも「キツネのシルエット」ではない気がする……。

左上のやつは方向性惜しい気がするので、ここで「V1」を押して「これに似た感じのやつ何パターンか出して!」って頼んでみます。

キツネの果物度が増したら成功だったんだけど、キツネのキツネ度が増してしまいました……。この血統は諦めましょう。

「An Arcimboldo-style painting in which several fruits and vegetables come together to form the silhouette of a fox」は「影」という単語が良くなかった気がするので、今度は抜いて「An Arcimboldo-style painting in which several fruits and vegetables come together to form a fox」を突っ込んでみます。

おー、惜し……い……?

今までで一番いい線行ってる気がする。

可能性を感じるので同じキーワードでもう一回いきます。シードが変わるので結果出力が揺れるはずです。

うお、今度はさっきより惜しくないのが出てきた。ダメ元で右上をもう少し揺らしてみるか。「V1」を押します。

ダメですね。この血統もここで放棄。

統語構造を変えれば「キツネ」の重み付けが変わるかもしれないので、もう一回まるっきり違うセンテンスを作り直してみましょう。

「アルチンボルドっぽいやつをどうやって英語で説明するか」ですが、こういう時は英語版Wikipediaが結構参考になります。

この冒頭にあるフレーズを使い回しましょう。(使った部分を勝手に太線にしました)

Giuseppe Arcimboldo (Italian: [dʒuˈzɛppe artʃimˈbɔldo];[1] also spelled Arcimboldi) (1526 or 1527 – 11 July 1593) was an Italian painter best known for creating imaginative portrait heads made entirely of objects such as fruits, vegetables, flowers, fish and books.

from Wikipedia “Giuseppe Arcimboldo” (https://en.wikipedia.org/wiki/Giuseppe_Arcimboldo)

というわけで、「Giuseppe Arcimboldo, imaginative fox made entirely of objects such as fruits and vegetables」というフレーズでチャレンジします。

これ今までで一番良い感じじゃない???

これをタネにして揺らして見ようと思ったんですが、鯖負荷で一回吹っ飛んでしまいました。

もう一回同じキーワードでチャレンジ。

やっぱこのキーワード良い感じですね。右上は謎ですが。

お、お、おぉ! おぉ?

惜しいような良い感じのような……。

ここで「そもそもなんで正面なんや? キツネなら横顔の方が分かりやすくない?」と思ったので、「profile(横顔)」を追加。ついでに余計なフレーズを削り、「Giuseppe Arcimboldo, imaginative profile of fox entirely made of fruits and vegetables」でトライ。

思ったより横顔になってねぇな……

パーツを果物と野菜に限定せず、葉とか花も入れたら形成しやすいかも。

Giuseppe Arcimboldo, imaginative profile of fox entirely made of fruits and vegetables and leaves and flowers」でトライ。

左上のオッサン誰だよって爆笑した。

結果が結構バラけてるので、このキーワードはシードのわずかな違いで色々な出力が出るようです。

というわけで、このキーワードで繰り返すと面白いのが出そう。

これで繰り返しトライして、7回目くらいで出てきたのがこちら。

横顔じゃないけど右上がイメージに近い。とりあえず「V2」。

この右下でいいんじゃない? ほぼ完成でしょ 「U4」いきます!

こうなりました!

個人的には割と最初のイメージに近いのが出来たかなと思います。

惜しいのは構成パーツがほとんど非実在野菜になってしまったことですかね。おそらく四季シリーズの「春」の花テクスチャが「夏」の野菜オブジェクトあたりと融合してしまったのかなと。

しかしとりあえず今の自分のテクニックで出来るとこまでは煮詰めたと思うので、ここで〆ます。

 

今日はここまで。お付き合い頂きありがとうございました。

 

余談ですが、たまに他のユーザが私の生成した画像で高精度画像を作り始めたりとか、そういうユーザの相互作用があるのも面白いですね。

全然知らない人が何回も画像を作り直して少しずつ精度を上げていくのを見て「頑張れ! 頑張れ! 着実にさっきより良くなってるぞ!」って心の中で応援したりね。

Midjourneyしばらくハマりそうです。

 

おわりに

★ひとことまとめ

1. Discordアカウントを作ってMidjourneyを試してみよう

2. 流れてくるログで他のユーザの作品を見るのも楽しい

3. 狙った画像を作るコツは下調べと閃きと試行錯誤

 

☆このトピックにオススメの本

リチャード ドーキンス(著), 吉成 真由美(編, 訳) 

進化とは何か ドーキンス博士の特別講義.

ハヤカワ文庫NF, 2016/12/20

記事後半で思い通りの画像を作るために「4つの生成画像の中から最も良いものを選び、それを更に乱数によって揺らして4つの画像を作る」というプロセスを何度か行いました。

ドーキンスは本書の中でこれを「アースロモルフ」と呼び、これは自然選択による進化プロセスを理解するためのモデルとして紹介しています。

少し前に流行った「どっちの画像がエッチかな?」で作るアレも同じですね。あっちは「遺伝的アルゴリズム」と呼んでいました。

Midjourneyは「機械学習によってテキストから期待される画像を生成する」というプロセスを起点として行いますが、「より作成者の望む画像に近づける」段階においては遺伝的アルゴリズムのアプローチを組み合わせているということになりますね。

The following two tabs change content below.

狐太郎

読んでは書くの繰り返し。 学んでは習うの繰り返し。

0 メディアカテゴリの最新記事