2022年の登場以来、手軽で高性能な画像生成AIとして人気を集めてきたMidjourney。しかし大統領選挙をめぐるフェイク画像やアーティストたちによる集団訴訟など、リスクやトラブルで話題になることも少なくありません。今回は、そんなMidjourneyをめぐる話題をさまざまなメディアの記事から紹介します。
この記事を読むことで、Midjourneyの概要から主要機能、どのような点で話題となっているのかまで、まとめて押さえることができます。ぜひ、ご確認ください。
Midjourneyとは
Midjourney(ミッドジャーニー)は、テキストから高品質な画像を生成するAIサービスです。2022年に公開され、その手軽さと生成される画像の美しさから瞬く間に人気を博しました。
Midjourneyは、Discordというチャットアプリ上で動作するという特徴があります。専門的な知識や技術は必要なく、テキストを入力するだけで簡単に利用できます。一方で生成される画像は多岐にわたり、アート作品のようなものから、写真のようなリアルなものまで生成可能です。
手軽さと品質の高さでクリエイターからも人気の高いMidjourneyですが、一方でフェイク画像をめぐるリスクが指摘されたり、著作権侵害をめぐる集団訴訟を起こされるといったトラブルにも直面しています。
ここではMidjourneyの魅力と課題について、各メディアの記事から紹介します。
画像生成AI「Midjourney」のV6は性能が向上し文字表示も可能に
画像生成AIである「Midjourney」は、日々進化を遂げており、リアルな写真と見分けが付かないような画像の生成も可能になってきています。それまでは、画像生成AIが出力するものには、「不気味の谷現象」を感じるものがあったり、人から見るとどうしても違和感を感じざるを得ない画像が多くありました。
2023年6月にMidjourney V6が発表され、日経クロステックによると、従来よりも短いプロンプトで、より高解像度な画像を生成できるようになったことがわかっています。
Midjourneyの利用には、コミュニティアプリDiscordのアカウントと、有料プランの契約が必要です。これまで以上に性能が向上しただけなく、生成画像に文字を入れることも可能になりました。これは英語のみに限りますが、SNS用の画像や広告関係のバナーを作成するなど、ビジネスシーンでも活用できる可能性も十分に考えられます。
ただし、プロンプトによって出力される画像の質には大きな差があります。様々なプロンプトを試しながら、求める画像を生成できるようになれば、日常からビジネスシーンまで十分に活用できる可能性が高いでしょう。
参考:画像生成AI「Midjourney」のV6を使ってみた、英語であれば文字表示も可能に(日経クロステック)
AIアートの高解像化機能を追加し4K出力も可能に
2023年10月、Midjourneyに「画像を超高解像度にアップスケーリングする機能」の追加が発表されました。Forbes Japanの記事によれば、Midjourneyの出力はこれまで1024×1024ピクセルに限定されていましたが、機能追加によって4倍のサイズ、具体的には「4K解像度を超える4096×4096」の出力が可能になります(デフォルトの場合)。
これまで、MidJourneyによる生成AIアートの出力については、低解像度の画像しか出力できないことが大きな課題となっていました。今回の機能追加によって高解像度の出力が可能になったことや、画質の問題が大きく改善したため、より高品質な画像の作成が可能となりました。
しかし、その代償として通常サイズの処理が数秒で完了するのに対し、4倍のアップスケーリングには2、3分ほどの時間がかかることが課題となっています。処理速度も今後は改善されていくことが予想されますが、それ以上に画像生成AIサービスの各社の競争が今後も激化することも免れないでしょう。特に解像度や画質の向上に各社が精力的に取り組んでいるため、処理速度も含めた飛躍的な改善にも期待できるでしょう。
参考:Midjourney、AIアートの高解像化機能を追加 4K出力可能に | Forbes JAPAN 公式サイト(フォーブス ジャパン)
独自の画風を登録する機能を追加、業界でも世界トップ級のポジションに
2023年11月にもMidjourneyの機能が強化されました。新しく追加された「スタイルチューナー(Style Tuner)」は、ユーザーが独自の画風を登録できる機能です。ライバルのStable Diffusionにも同様の仕組みがありますが、ASCⅡによるとStable DiffusionのLoRAが(学習のために)30~50枚の画像を用意する必要があるのに対し、Style Tunerは学習済みのデータから独自スタイルを生み出せる点が強みだと言われています。
Midjourneyの場合は、保有する学習済みデータのスタイルを基準にし、そのうえでユーザーが作成したい内容にあわせて選択したり、掛け合わせることで新たに独自のスタイルが生まれるような方法論を選択していることがわかります。さらに、そっくりの画像が生まれたりしないよう配慮していることもポイントの1つです。
それに加えて、その他のサービスよりも生成の手軽さや処理速度も改善されているため、画像生成AIの中では世界でもトップクラスに注目されているといえるでしょう。
参考:世界トップ級の画像生成AI「Midjourney」更に強力に。ライバル「Stable Diffusion」との違いもはっきり(アスキー)
生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討
「Midjourney V6」は、これまで以上に本物の写真と見分けがつかないほどリアルな画像の生成が可能になりました。ギズモードジャパンによると、レビュアーも「他のAI画像生成ツールと比べてもクオリティが圧倒的」と評価しているほど、画像のクオリティが高いということがわかります。
しかし、一方であまりのリアルさにフェイク・詐欺画像に悪用される懸念も高まっています。画像生成AIに限らず、Chat GPTをはじめ、今後のAI技術の進歩に伴う大きな課題とされています。
実際にそういった悪用を懸念し、Midjourneyでは今後1年間、ジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しているとTechnoEdgeの記事からわかります。金銭を目的とした詐欺だけでなく、公平性や法律に関わる選挙などで悪用されることを懸念し、プロンプトには規制を入れているようです。
しかし、この規制にはプロンプトによる抜け穴があるといい、またMidjourneyのバージョンによっても、生成できてしまうケースも確認されています。
各画像生成AIサービスだけでは規制しきれない現状から、X(旧Twitter)やMetaなどのSNSでは政治的な偽情報の生成や拡散を防ぐため、あるいは少なくともそれがAI生成だと特定しやすくするためにラベリングするなどの措置を進めています。
参考:Midjourneyがリアルすぎて写真と見分けがつかないレベルに (ギズモード・ジャパン)
参考:生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む(テクノエッジ TechnoEdge)
自作品の著作権を侵害されたとするアーティストたちの集団訴訟が裁判所によって棄却される
Midjourneyが直面する別のリスクが、アーティストによる訴訟です。GIGAZINEの記事によると、2023年1月には北カリフォルニア地区で著作権侵害を訴える集団訴訟が起こされましたが、この訴訟で判事は2023年10月時点において、訴状に問題があるとして訴えを却下する心証があることを開示し、原告に訴状を修正する許可を与えました。しかし、判事は判決のなかで「修正して問題を追及し続ける」ことを認めています。
画像に限らず、動画や音声などの生成サービスの進化と法律の整備は大きな課題の1つといえます。特にキャラクターなどの生成については、大手企業や作家が保有する権利に大きく関わるため、各国でその対処や法律の整備に声明が上がっています。
そのうえでは、画像生成AIの学習データに自身の作品が使われているかどうかを明確にすること、その利用を禁止することも重要となります。例えば、Midjournerでは、生成画像に自分の作品が使われているか否かは、「Have I Been Trained?」などのツールを用いて確認することができます。また、GIGAZINEの記事では、AI研究プロジェクト「Knowing Machines」が学習データから自分の作品を削除させるための有効な手段として「カリフォルニア州消費者プライバシー法(CCPA)にもとづいた削除リクエストの送信」を挙げています。国などによって受け入れられる法律が異なるため、その標準化や個人ができる対策は生成AIと向き合ううえで今後も欠かせないトピックとなるでしょう。
参考:画像生成AI「Stable Diffusion」と「Midjourney」に対する集団訴訟でイギリスの写真家が団結呼びかけ(GIGAZINE)
参考:画像生成AI「Stable Diffusion」や「Midjourney」に自作品の著作権を侵害されたとするアーティストたちの集団訴訟が裁判所によって棄却される(GIGAZINE)
画像生成AIのMidjourney創業者が語る「AIアートが起こす混乱と未来」
画像生成AIをめぐる問題について、Midjourney創業者のデヴィッド・ホルツ氏がForbes Japanに掲載されたインタビューにおいてその見解が示されています。「本当に大切なのは人間性」と語っており、「画像を美しく見せる」ことがMidjourneyの目的で、(商用の)アートとは無関係、というのがホルツ氏の考えです。
Midjourneyは技術がない人、創作に自信がない人でもAIによるアートを実現したいと考えており、拡大・成長を続けています。しかし、フェイク画像の作成や参照されるクリエイターの権利など、生成AIに関わる複雑な問題はまだまだ解決の目処が立っていない状況といえます。
そんな中、ホルツ氏はMidjourneyの利用によるクリエイターの保護や権利についても検討しているとのことです。例えば、プロンプトで自身の名前が使われることを懸念するクリエイターは、データトレーニングモデルに含まれない様にするなどが挙げられます。ただし、どの画像が明確に参照されたのかを追跡し、認証できる手段がないことから、ガイドラインだけでなく法整備による対策が今後も急務の課題となるでしょう。
参考:画像生成AIのMidjourney創業者が語る「AIアートが起こす混乱と未来」 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
まとめ
優れた性能を背景に賞賛と非難を集めてきたMidjourney。一方で画像生成AIの進歩は著しく、Stable DiffusionやDALL-E3といった強力なライバルも登場しています。さまざまな課題を克服しつつ、さらに魅力を深めていこうとするMidjourneyの取り組みに、これからも注目していきましょう。
株式会社エクサウィザーズでは、日進月歩で進化する生成AIの可能性と活用について、業界でいち早く取り組みながら、AIを活用した経営課題の解決を支援しています。生成AIの活用や社内人材の育成、AIを活用したDX推進などにご興味のある方はぜひエクサウィザーズにご相談ください。