Midjourney V5が発売開始 – AIアートによるフォトリアル体験の次のステップへ

2023.3.23

Midjourney V5が発売開始 - AIアートによるフォトリアル体験の次のステップへ

Mascha Deikova2023.3.23

待望のMidjourney V5がリリースされた。Independent Research Labは、有名なAIアートジェネレーターの最新バージョンをリリースした。テキストプロンプトから息を呑むような画像を作成するという点で、すでに「フォトリアリスティックな驚異の世界」と呼ぶ人もいる。不思議かどうかはさておき、新たに学習されたモデルは、言語理解、正確さ、文体の柔軟性において、大幅な向上を約束している。

V5はMidjourneyの2つ目のディープラーニングモデルで、過去5ヶ月間、制作が続けられてきた。前作と比較して、全く異なるニューラル・アーキテクチャと新しい美的技術を使用していると謳っている。開発者が言うように「新しく訓練された、より大きな脳、より多くのことを知っている、より理解している、よりよく聞いている、といった特徴を耳にするかもしれない。これらはすべてV5の真実だ。” もちろん、私たちも実際に試してみる必要がある。そして驚くべきことに、このリリースは、まだアルファテストに過ぎないとはいえ、驚異を生み出しているのだ。

Midjourney V5がリリースされたが、どう使うか？

前回の記事では、Midjourneyについて触れ、AIを使ったアーティスティックなムードボードの作成に役立つことを説明した。また、このジェネレーティブ・ニューラル・ネットワークを使ってアートを作り始めるための詳しい手順も紹介している。まだMidjourneyを試したことがない場合は、この記事を読み進める前に、まずそちらの記事を読むことをお勧めする。

この記事を読んで、新しいV5モデルをワークフローに加えるにはどうしたらいいのだろうという疑問が湧くかもしれない。2つの方法がある。#newbiesのDiscordチャンネルで「/settings」と入力し、「MJバージョン5」を選択する方法だ。また、まずは試してみたいという場合は、プロンプトの最後に”- v 5 “というパラメータを追加するだけでもOKだ。

midjourney v5 is out now: how to enable it in your discord channel — Screenshot from the Midjourney Bot on Discord, highlighting the correct use of the “v 5” parameter. Image credit: Mascha Deikova / CineD

顔や手足の表現を向上

Midjourneyコミュニティが待ち望んでいた最大の変化の1つは、6本指の人間がいなくなることだった。新モデルでは、手足の扱い方に関する知識が大幅に増えたため、カオスブロブの数が減っていることに気づくだろう。また、V5では、顔や目を細部まで再現することができるようになった。以下に、いくつかのポートレート・テストを実施したが、実に素晴らしい出来栄えだった。

midjourney v5 is out now: enhanced photorealistic portraits with improved faces and limbs — Some experiments with realistic portraits. Image credits: created with Midjourney V5 by CineD

これは実在の人物ではない。驚くべき完成度だが、しかし、完璧では無い。例えば、モデルが鏡に向かって自撮りをしている画像では、反射に重大な問題があることに注意していただきたい。遊んでいる男の子の手も完璧ではないが、Midjourneyの以前のディープラーニングモデルに比べれば、雲泥の差がある。また、新しいアートジェネレーターは、本当に指を作りながら5まで数えることができる。

フォトリアリズムの大きな改善点

上記のように、V5モデルは一般的に、よりリアルなイメージを提供することができる。実際、アートスタイル、参照アーティスト名、メディアソースを指定しない場合、システムのデフォルト設定が適用され、結果は完全にフォトリアルに見えｒる。今回のプロンプトは写真のように見えるようにデザインされているので、より抽象的でアーティスティックなものが必要な場合は、文言を調整することをお勧めする。

Midjourneyがテキスト説明を読み取る方法を微調整するもう一つの方法は、プロンプトの最後に「stylize N」というパラメータを追加することだ（Nは0（最小）から1000（最大）の間で変化する）。この値が低いほど、AIのハウススタイルが最終的な画像に影響を与えることが少なくなる。つまり、ヴィンセント・ヴァン・ゴッホのような画像を生成する必要がある場合は、以下のテストで私が行ったように「- stylize 1000」と入れてみてほしい。

midjourney v5 is out now: how to stylize your image — The result of requesting an image in the style of Vincent van Gogh. Image credit: created with Midjourney V5 by CineD

私たちの実験や、ショーケースチャンネルに投稿されたMidjourneyコミュニティの他のメンバーからの生成された写真を見ていると、「信じられない」と思わずにいられない。そして、とても恐ろしい。本物の写真と人工知能が作った写真の区別がつかなくなる瞬間が来るのだろうか。時間がそれを教えてくれるのだろう。

Midjourney V5がリリース：より高いディテールアップとプロンプトによるパフォーマンスの向上

そんな心配はさておき、新型Midjourneyのもうひとつの特徴は、その完成度の高さだ。生成されたアートのディテールが正しく表示される可能性が高く、また、V5は入力に対して非常に反応が良い傾向にある。クリエイターはこのバージョンを、V3やV4よりも「ずっと自由な発想」と呼んでいる。そこで、前回のMidjourney関連記事で使用した私の古いプロンプトを、最新のバージョンと比較するために使ってみた。

midjourney v5 is out now: side by side comparison of V4 and V5 — On the left: the old output from V4. On the right: the result of the same prompt in the new V5. Image credits: created with Midjourney by CineD

Midjourneyがよりコントロールしやすく、予測された結果を出すことができるようになったようだ。同時に、この改良は使いにくくなることも意味している。短いプロンプトが以前ほどうまく機能しなくなるかもしれない。V5では、リストではなく文章を書き、より明確に欲しいものを説明する文章を使うことを開発者は勧めている。これは、私たちが学校で時々課される、とても短い作文のようなものだと考えｔてよいだろう。

より高い解像度とその他のアスペクト比

Midjourneyの5thバージョンでは、約束通り、解像度が2倍アップし、最大1024×1024までの画像を作成できるようになった。注意しなければならないのは、このモデルでは「アップスケール」ボタンの動作が異なることだ。V5で得られる画像はすべて最高画質なので、このボタンはアップスケール前の画像をグリッドから切り離すだけだ。最終的には、2048×2048の画像を生成する可能性もある。

さらに興味深いアップデートとして、より幅広いアスペクト比のオプションが追加された。以前は、カスタムのものは全くサポートされていなかった。新モデルでは、より広いキャンバスサイズや狭いキャンバスサイズを作成でき、好きなアスペクト比を試すことができる。

midjourney v5 is out now: new aspect ratios available — An example of a picture generated in Cinemascope by adding “–ar 21:9” to the prompt. Image credit: created with Midjourney V5 by CineD

イメージウェイトが復活

そして最後に、Midjourneyの最新バージョンで復活したイメージウェイト機能について紹介したい。写真や画像をリファレンスとして使用する場合、パラメータ「iw N」（Nは0.5から2.0まで）を使用してそのレバレッジを高めることができるようになった。先週、ジェイミー・リー・カーティスがアカデミー賞の助演賞を受賞した写真の例で、その仕組みを紹介しよう。彼女の写真をMidjourneyボットにアップロードして、彼女を他の惑星から来た美しいエイリアンに見立ててもらった。また、最後に「- iw 1.0」を付けて、女優を認識できるようにした。これが、AIが出した結果のひとつだ。

midjourney v5 is out now: reference image weight is back — A generated picture based on the reference photo of Jamie Lee Curtis. Photo reference source: A.M.P.A.S., 2023. Created with Midjourney V5 by CineD

重要な注意事項：作成した画像をムードボードやアイデア開発以外の目的で使用する場合（特に商用）、参考画像の権利を持つことを確認し、正しい帰属を忘れないようにしてください。

Midjourney V5の主な問題点

以前のバージョンのMidjourneyのユーザーは、プロンプトの作り方をもう一度勉強する必要がある。以前にも触れたが、心に留めておくべき重要なことだと思う。今、Discordでは、コミュニティメンバーがV5モデルへの要望をできるだけ正しく表現する方法を考えようと、多くの実験が行われている。
V5がV4より少し遅いと指摘するユーザーもいるが、品質やディテールアップも進んでいるので、驚くにはあたらないだろう。
そして、まだ新しく、負荷がとてつもなく大きい。だから、サーバーが過負荷になることがあるので注意していただきたい。Midjourneyのボットと直接チャットできる有料会員になるのも手かもしれない。

まとめ

Midjourney V5が発表され、私たちはすでにいくつかの内容に圧倒されている。ただし、開発者が述べているように、これは単なるアルファテストであり、最終リリースでは状況が変化することになる。このモデルは将来的に発売されないかもしれないとのことだが、すでにできることを見ていると、未来は予想より少し早くやってきたのかもしれない。

midjourney ai tools midjourney v5 image generator photorealistic AI art AIアート artificial intelligence