AIで存在しない画像を作り出す
最近、ニュースでも、画像生成AIが話題になることが多くなりました。
多くの場合、フェイクニュースに偽造画像が使われて、株価が一時的に下がるなどという事も起きています。
合成画像は、昔からありますが、そこにAIを加えることにより、webからの画像収集が各段に効率的になり、画像修正の技術を使って、本物と見紛うほどの合成電子画像がつくられるようになったということかもしれません。
ディープラーニング
「画像生成AI」は、特にテキストやデータを入力するだけで、AIが自動的に画像を生成する技術で、簡単にイメージの画像を得ることができます。この技術は、Webレイアウトの作成や、オリジナルの写真やイラストの作成に使われます。
ディープラーニング(深層学習)と呼ばれる機械学習の手法が利用されます。
ディープラーニングは「AIが大量のデータや情報を自ら解析して、ある特徴を探し出すこと」といえます。画像生成AIではこの技術を応用しています。
入力されたテキストの特徴をAIがディープラーニングによって見つけ出し、その情報をイラストに落とし込むことで画像生成が行われています。
ネット上に公開された無数の著作物をデータとして利用する現行の画像生成AIについて、著作権を侵害している可能性があるとして、潜在的な法的リスクが指摘されています。
そして、データが権利者のライセンスを受けていることが望ましく、生成されたコンテンツの出所を示す手段が必要であるとしています。
経緯
画期的な「画像生成AI」は2022年に入ってから、次々と発表・公開されました。
2022年3月にはマイクロソフトも出資するAI開発企業のオープンAIが、そして5月にはグーグルが相次いで新しい画像生成AIを発表しました。
さらに、6月には米国の独立系ラボ、ミッドジャーニーが「Midjourney」を、8月には英国のスタートアップ、スタビリティAIが「Stable Diffusion(ステーブルディフュージョン)」を公開しました。
特にMidjourneyとStable Diffusionは誰でも無料で利用できる(Midjourneyは無料で生成可能な枚数に上限あり)ことから、多くのユーザーに利用されるようになりました。
多く使われる無料画像生成AIサービス
Bing Image creator
Dall-E2
Stable Diffusion
Midjourney
Canva
starryai
Dream by WOMBO
プロンプトの作成
画像生成AIの基本的な流れは、ツールに画像の元になるキーワードを入力するだけです。これを「Text-to-Image」と呼び、文字情報から画像に変換する仕組みになっています。基本的には英単語を半角スペースで区切る形です。「男性の笑顔」であれば「man smlie」と入力します。
ちなみに入力するキーワードは「プロンプト」や「呪文」と呼ばれています。
プロンプトとは画像生成時に入力する文章、もしくは単語の羅列のことです。どんな言葉を入力するかで生成される画像の出来が変わります。
AIによる画像生成においては、プロンプトの内容がとても重要です。
現状では日本語対応されていないサービスが多いので、基本的に英語で作ります。
英語文を作るのは、「ChatGPT」を利用します。作りたい対象物の名前に加えて、下記のイメージ プロンプトを入力すると質の高い画像が生成されやすいです。
写真風 :
photo,photograph,snapshot,1980s color photo,GoPro,pinhole camera,from news footage
絵画風 :
watercolor,oil paint,sketch,line art,ink drawings,acrylic paint,ukiyo-e style
CG風 :
unreal engine,redshift,octone,V-Ray,3D render
マンガ、イラスト :
manga,pop manga,comic,Abstraction,Corporate Memphis style,realistic illustration
Stable Diffusion
Stable Diffusion(ステーブルディフュージョン)は、完全無料で利用できる画像生成AIです。オープンソース型の画像生成AIで、商用利用や改変も可能となっています。
無料にも関わらず、画像が生成されるまでのスピードも速いです。
複雑な組み合わせのプロンプトでもストレスなく動作します。
Stable Diffusionの使い方1.「Enter your prompt」にプロンプトを入力
2.「Generate image」をクリック3.画像生成
Stable DiffusionはこちらStable Diffusionのトップページが表示されたら、画面中央付近までスクロールします。
どんなプロンプトを入力していいか分からない場合は、下に表示されている「Examples」から、気になるプロンプトをクリックしてみます。
例として「A delicious ceviche cheesecake slice」をクリックしてみたところ、以下のような画像が生成されました。
Midjourney
Discordのサイトで簡単な情報を入力するだけで、アカウントが取得できます。
公式サイト
入力したメールアドレスに招待メールが届くので、承認したら登録完了です。
ディスコードの画面左側のメニューから(1)Midjourneyのアイコンをクリックすると、下の画面になります。
(2)で「newbies-」と書かれているのが画像生成に使うスレッドです。
いずれかをクリックします。上の画像では「newbies-138」を選択中です。
(3)に「/imagine」と入力します。
「/imagine prompt」が表示されるので、これを選択します。
あとはプロンプトを入力してリターンキーを押せば、画像生成が始まります。
Bing Image Creator
Bing Image Creatorは、すでにBing AIを使えている方であればすぐに利用可能です。順番待ち登録の必要もありません。料金は無料です。
DALL・E2から提供されており、現時点(23年5月)では無料で作成できます。
公式サイト