Stable Diffusionで複数のキャラクターを作り分けてみよう

鷹の目週末プログラマーチャンネル
28 Oct 202311:52

TLDR本日はプログラマーのたかとが、Stable Diffusionを使用して複数のキャラクターを生成する方法を紹介します。セブデフュージョンvuiのバージョン1.6を使い、アニメV1モデルとパステルifデフを組み合わせ、幅900高さ600の設定で画像生成を行います。プロンプトにはイラストレーションやマスターピースを入れて、ネガティブプロンプトにはEネガティブやnsfwを指定。さらに、スタイルと服装を細かく調整し、3人の女の子を一気に生成。画像の加工にはエリテイラーとインペイント機能を使い、個性豊かなキャラクターを完成させます。

Takeaways

  • 😀 この動画は、Stable DiffusionというAIを使って複数のキャラクターを生成する方法を紹介しています。
  • 🎨 スクリプトでは、セイブ・ザ・フュージョンのバージョン1.6を使用し、アニメのモデル「2Waydreamer Anime V1」を利用しています。
  • 🖼️ 画像のサイズは横幅900、高さ600に設定され、サンプリングメソッドは「dpm++2m Karras」となっています。
  • 🔧 フィルターはオフに設定され、スタイルは「イラストレーション」と「マスターピース」を指定しています。
  • 🚫 ネガティブプロンプトには「Eネガティブ」や「nsfw」が入っていますが、これは避けることの示唆です。
  • 👘 服装は冬らしい「ホワイトセーター」を選び、髪型は「ブラックロングヘア」を選びました。
  • 👀 視線は「ルッキングアットビュー」でキャラクターがこちらを見ているように設定されています。
  • 🎭 キャラクターは3人で、それぞれ異なる服装と髪型が設定されています。
  • 🖌️ 画像生成後、エディタを使用して画像を加工し、キャラクターの表情や服装を変更しています。
  • 🎨 最終的に、個性豊かな3人のキャラクターが完成し、それぞれの特徴が鮮明に表現されています。

Q & A

  • セイブtheフュージョンとは何ですか?

    -セイブtheフュージョンは、画像生成AI「Stable Diffusion」を使用してキャラクターを生成するプロセスです。

  • このビデオではどのバージョンのセブデフュージョンを使用していますか?

    -このビデオではセブデフュージョンのバージョン1.6を使用しています。

  • 拡張機能としてビギナーをセットすることは何を意味しますか?

    -ビギナーをセットすることは、初心者向けの設定を有効にし、AIの学習プロセスを簡単にする拡張機能を使用することを意味します。

  • プロンプトに「イラストレーション」と「マスターピース」を入れる目的は何ですか?

    -プロンプトに「イラストレーション」と「マスターピース」を入れることで、生成される画像がよりアートワークに近づけ、品質が向上するようにAIに指示しています。

  • ネガティブプロンプトには何を入れていましたか?

    -ネガティブプロンプトには「Eネガティブ」と「nsfw」を入れていました。これにより、不適切な内容が生成されるのを避けることができます。

  • 「クローズアップ」をプロンプトに入れる理由は何ですか?

    -「クローズアップ」をプロンプトに入れることで、生成される画像がキャラクターの顔にフォーカスを当て、詳細を強調するようにAIに指示しています。

  • 「ジャパニーズ」をプロンプトに入れた目的は何ですか?

    -「ジャパニーズ」をプロンプトに入れたのは、生成される画像に日本風の要素を加えたいためです。これにより、服装や顔立ちに日本特有のスタイルが反映されます。

  • 「ロラー」機能とは何ですか?

    -「ロラー」機能は、画像の立体感を出すために使用される機能です。フラットカラーをオフにすることで、キャラクターの奥行きの表現を豊かにすることができます。

  • インペイント機能はどのように使用しましたか?

    -インペイント機能は、生成された画像を編集し、特定の部分を変更する際に使用されました。例えば、ジャケットの色を変えたり、髪型を変更する際に利用されました。

  • 最後に「ペデテイラー」機能を有効にした目的は何ですか?

    -「ペデテイラー」機能を有効にすることで、生成された画像の全体的な雰囲気やスタイルをよりリアルタイムに調整することができ、最終的な画像の完成度を高めるために使用されました。

Outlines

00:00

🎨 Creating Multiple Characters with AI

The speaker introduces themselves and expresses their intention to create multiple characters using the AI tool 'Save the Fusion.' They plan to demonstrate the process using AI5's Stable Diffusion. The tool allows for easy image generation from scratch. The speaker opts for the version 1.6 of 'Save the Fusion' and sets beginner features. They also check for 'AI Retiler' and initiate it. The process takes about 30 seconds. Once launched, the interface is displayed, and the speaker chooses an anime model and sets the image dimensions and sampling method. They also discuss turning off certain features and setting style preferences for the image creation, including negative prompts to avoid unwanted content.

05:02

🖌️ Refining AI-Generated Images

The speaker proceeds to prepare the prompt for generating an image of three girls. They input various keywords and settings to define the appearance, clothing, and style of the characters. They mention the use of 'SDExcel' to enhance the image and discuss the importance of adjusting weights for certain features. The speaker also talks about using 'Inpaint' to refine the image further, focusing on the facial features and background. They experiment with different settings and adjustments to achieve the desired look, including changing the clothing and hair style of the characters.

10:07

🎉 Finalizing the AI Artwork

In the final paragraph, the speaker continues to work on the image, making adjustments to the clothing and hair color of the characters. They mention the use of 'SDX' to randomize the seed and change the style. The speaker also talks about using 'Inpaint' to modify the appearance of the characters, such as changing the hair style and color. They experiment with different configurations and settings to achieve the desired outcome. The speaker expresses satisfaction with the final result and concludes the session with a round of applause.

Mindmap

Keywords

💡Stable Diffusion

Stable Diffusionは、テキストから画像を生成する人工知能技術の一つです。この技術は、ディープラーニングを用いて、ユーザーが入力したテキストプロンプトに基づいて画像を生成します。ビデオでは、Stable Diffusionを使用してキャラクターの画像を生成するプロセスが説明されています。

💡セイブtheフュージョン

セイブtheフュージョンは、ビデオのタイトルであり、キャラクターの画像を生成するテーマを示しています。このフレーズは、キャラクターを創造的に組み合わせて新しい画像を作ることを意味する可能性があります。

💡プロンプト

プロンプトは、AIに画像を生成する際の指示やヒントを提供するテキストです。ビデオでは、プロンプトに「3人の女の子」や「冬っぽい服装」などのキーワードを入力して、AIに特定のスタイルや服装のキャラクター画像を生成させる例があります。

💡サンプリングメソッド

サンプリングメソッドは、画像生成AIが画像を生成する際に使用するアルゴリズムのタイプを指します。ビデオでは、dpm++2mカラスというサンプリングメソッドが選択されていますが、これは画像の質やスタイルに影響を与えるパラメーターです。

💡スタイル

スタイルは、生成される画像の雰囲気や外観を定義する要素です。ビデオでは、アニメスタイルやパステルのようなスタイルが選択されており、これにより生成されるキャラクターの外観が決まります。

💡ネガティブプロンプト

ネガティブプロンプトは、画像生成AIに避けるべき内容を指定するテキストです。ビデオでは、「Eネガティブ」や「nsfw」がネガティブプロンプトとして使用されており、これにより生成される画像から不適切な内容が除外されます。

💡ヘッドウェイト

ヘッドウェイトは、画像生成プロセスで特定の要素(この場合は頭部)に重点を置くために使用されるパラメーターです。ビデオでは、ヘッドウェイトが1.5に設定されていると説明されており、これによりキャラクターの顔の詳細が強化されます。

💡インペイント

インペイントは、既存の画像を編集し、細部を修正または変更するプロセスです。ビデオでは、インペイント機能を使用して、生成された画像のキャラクターの服装や髪型を変更する例があります。

💡ローラ

ローラは、画像の色や影を調整するフィルターまたはツールのことで、画像の立体感や質感を向上させるために使用されます。ビデオでは、ローラを使用して画像に立体感を出そうとしています。

💡フラットカラー

フラットカラーは、画像の色を単色にし、立体感を失わせる効果です。ビデオでは、フラットカラーを使用してキャラクターのヘッドパーツを平面的にして、特定のアートスタイルを表現しています。

Highlights

今日はセイブtheフュージョンで複数のキャラクターを作る方法を紹介します。

Stable Diffusionを使用して画像生成を行います。

セブデフュージョンvuiのバージョン1.6を使用し、拡張機能を設定します。

アニメのモデル「2ワイフドリーマーアニメV1」を利用し、画像サイズを指定します。

サンプリングメソッドとしてdpm++2mカラスを選択し、サンプリングステップを30に設定。

Fsfwフィルターをオフにし、スタイルを「え名用」に設定。

プロンプトに「イラストレーション」と「マスターピース」を入力し、ネガティブプロンプトを設定。

3人の女の子を表示させるために「3ガーズ」をプロンプトに追加。

服装として「ホワイトセーター」を選び、ヘッドウェイトを1.5に設定。

髪型には「ブラックロングヘア」を選び、ウェイトを1.5に設定。

見た目を変えるために「クール」、「ピュアフェイス」をプロンプトに追加。

「ルッキングアットビュー」をプロンプトに入れて、視線をこちらに向ける画像を作成。

「クローズアップ」をプロンプトに加えて、画像をより大きく表示。

「ジャパニーズ」をプロンプトに入れて、日本人風の顔を生成。

「着物」をプロンプトに加えて、和風の服装を表現。

「ロラ」を設定して画像に立体感を出す方法を説明。

「フラットカラー」をマイナス設定して、ヘッドラインを強化。

プロンプトの準備が完了し、cfgスケールを9に設定して画像生成を試みる。

3人の並んでいる画像が生成され、背景のソイルを改善するため再生成を試みる。

画像のシートをシード呼び出し、エリテイラーを有効にして画像を加工。

インペイント機能を使用して画像中の顔を切り出して背景を改善。

女の子を2個性を持たせるためにブラッシュアップを実施。

ジャケットとブラウンのポニーテールをプロンプトに追加して画像を生成。

画像生成が上手くいかなかった場合、何枚か生成してから選ぶ方法を提案。

ヘアスタイルと服装を変更し、ピンクのトレーナーをプロンプトに指定。

ペデテイラーを有効にして画像を生成し、完成形を目指す。

画像生成が成功し、3人の女の子が個性豊かに表現された画像が完成。