画像生成AI『Stable Diffusion』で表情だけを変える方法。呪文集一覧やコツもご紹介

AI FREAK - 最新のAIツールをご紹介
23 May 202308:13

TLDR今日の動画では、Stable Diffusionという画像生成AIを使って表情を変える方法とそのコツを紹介します。ベース画像を用意し、プロンプトを調整することで、様々な表情を生成することができます。例えば、スマイルを強調するためには、コロンと数字を追加して指示を出します。数字を調整することで、より自然な表情を表現することが可能です。また、表情に応じたプロンプトを用いて、より細かく調整することができます。悲しい表情や怒っている表情も試し、それぞれの表情には適した強調度合いが必要です。最後に、表情を変えるプロンプトの一覧を紹介し、参考にしていただければと思います。

Takeaways

  • 🖼️ プロンプトを調整することで、Stable Diffusionで表情を変化させることができます。
  • 📸 ベースとなる画像を用意し、レファレンスオンリー機能と併用して表情を調整します。
  • 😄 スマイルを表現するプロンプトに数字を追加することで、表情の強度を制御できます。
  • 🔍 コントロールネットを使用して、既存の画像の雰囲気を維持しながら表情を変更できます。
  • 🔢 数字の調整によって、表情の細かい変化を加えることができます。
  • 😉 笑顔を表現するプロンプトは、数字の調整によって自然な表情に調整できます。
  • 😔 悲しい表情を表現する際には、より高い数字を設定することでより良い結果を得ることができます。
  • 😠 怒っている表情を表現する際には、プロンプトと数字の調整が必要です。
  • 🎭 XYZプロットを使用して、様々な表情を一度に試すことができます。
  • 📈 強調度合いが1.5を超えると、不自然な画像が生成される可能性が高くなります。
  • 📝 表情を変えるプロンプトの一覧を提供し、各プロンプトに1.4の強調を加えることで、参考例として使用できます。

Q & A

  • ステーブルディフュージョンで表情を変える方法とは何ですか?

    -ステーブルディフュージョンで表情を変えるには、プロンプトを調整し、特定の感情表現を強調する単語を追加します。また、コロンと数字を用いて、その強調の度合いをコントロールできます。

  • ベースとなる画像を用意する際のポイントは何ですか?

    -ベースとなる画像は、理想の表情を生成する上で重要な役割を果たします。以前紹介された「レファレンスオンリー」機能と併用することで、元の画像の雰囲気を保ちながら表情を変更できます。

  • プロンプトに加える単語の種類にはどのようなものがありますか?

    -プロンプトに加える単語には、「スマイル」、「アップセット」、「ハウルウィズラフター」など、様々な感情表現に関する単語があります。これらを使って、画像に求める表情を指示できます。

  • 数字を調整することで何が変わりますか?

    -数字を調整することで、プロンプトで指定された感情表現の強弱を制御できます。数字が大きいほど、指定された表情が強調されますが、適切なバランスを見つけることが重要です。

  • 表情を生成する際のコツは何ですか?

    -表情を生成する際のコツは、プロンプトと数字を適切に調整することで、理想の表情を模索するということです。また、使用するモデルやメインのプロンプトによっても結果が変わるため、参考例を基にしながら微調整を繰り返す必要があります。

  • レファレンスオンリー機能とは何ですか?

    -レファレンスオンリー機能は、ベース画像の雰囲気を引き継ぎながら、新しい表情やスタイルを加えるためのステーブルディフュージョンの機能です。これにより、元の画像の雰囲気を保ったまま、表情の変化を試すことができます。

  • XYZプロットとは何ですか?

    -XYZプロットは、ステーブルディフュージョンで使用される機能で、プロンプトに応じて画像を生成し、様々な表情のバリエーションを一度に表示することができます。

  • 怒っている表情を生成する際の注意点は何ですか?

    -怒っている表情を生成する際は、プロンプトとして「アングリー」などの単語を使用し、数字を調整して表情の強弱を制御します。また、プロンプトに加えて、強調を表すワードを追加することで、より伝わるものを作成できます。

  • 悲しい表情を表現する際の数字の調整はどのように行われますか?

    -悲しい表情を表現する際は、数字を1.7から2.0まで調整することで、より控えめから強烈な悲しみを表現することができます。各プロンプトに応じて最適な数字を試行錯誤しながら見つけることが重要です。

  • 生成された画像で不自然な部分が見られる場合はどうすればよいですか?

    -生成された画像で不自然な部分が見られる場合は、数字の調整や解像度の向上、プロンプトの変更など、様々な要因を試行錯誤しながら最適な結果を目指すことができます。

  • ステーブルディフュージョンで表情を変更する際の強調度合いの目安は何ですか?

    -強調度合いが1.5を超えると、おかしな画像が生成されてしまう確率が高くなります。したがって、1.5前後で調整を行って、自然な表情を生成することが推奨されます。

Outlines

00:00

😀 Mastering Expressions with Stable Diffusion

This section introduces techniques for modifying facial expressions using Stable Diffusion. By carefully adjusting prompts, various expressions can be added to images, demonstrated by an example image. The section walks through the use of a feature called 'reference-only', which maintains the original vibe of a female's face while allowing modifications like adding a smile. Further adjustments are made by altering the intensity of the smile through numerical values in the prompt, showing how different settings (from subtle to overly strong) impact the generated results. The segment concludes with an exploration of how using different expressions, such as 'smirk' or 'howl with laughter', and adjusting their intensities can yield diverse results, proving that fine-tuning is essential for desired outcomes.

05:01

😡 Exploring Angry Expressions

This section explores generating angry expressions using Stable Diffusion, beginning with the word 'angry' set at 1.5 intensity. The produced image maintains the expression without distortion. However, other prompts like 'upset' do not convey as strong a sentiment at the same intensity, prompting further experimentation with words and intensity adjustments. By modifying prompts and intensities, such as using 'very upset', different expressions are achieved. The section also notes that while some prompts at 1.4 intensity result in unnatural hand expressions, these can potentially be improved by adjusting resolution or settings. The narrator advises that the results can vary depending on the model and main prompt used, emphasizing the importance of using these tools as a guide rather than a definitive solution.

Mindmap

Keywords

💡ステーブルディフュージョン (Stable Diffusion)

ステーブルディフュージョンは、画像生成のための人工知能モデルです。このビデオでは、そのAIを使って表情を変える方法について解説しています。AIはプロンプトに応じて画像を生成し、細かく調整することで理想的な表情を作り出すことができます。

💡プロンプト (Prompt)

プロンプトとは、AIに指示を与えるための言葉やフレーズのことです。ビデオでは、プロンプトを調整することで、生成される画像の表情を制御しています。例えば、「スマイル」と入力すると、笑顔の画像が生成されます。

💡コマンド (Command)

コマンドは、プロンプトに加えてAIに与える具体的な指示です。数字を付け加えることで、表情の強度を制御することができます。ビデオでは、スマイルの強さを数字1.5や2.0で指定して、より自然な笑顔を生成しています。

💡コントロールネット (Control Net)

コントロールネットは、AIが生成する画像の特定の要素を細かく制御できる機能です。ビデオでは、この機能を使って画像の雰囲気を保ちながら、表情を変更しています。非常に便利な機能であり、理想的表情を生成する上で欠かせないです。

💡XYZプロット (XYZ Plot)

XYZプロットは、プロンプトの効果を可視化するツールです。ビデオでは、この機能を使って、様々な表情を生成し、それぞれのプロンプトがどの程度の表情を引き出すかを確認しています。

💡強調 (Emphasis)

強調は、プロンプトの後の数字で表現され、AIがその言葉をどれだけ重視するかを制御します。ビデオでは、数字を調整することで、生成される表情の強さを細かく調整しています。

💡ジェネレート (Generate)

ジェネレートとは、AIに指示を与えて画像を生成するアクションです。ビデオでは、プロンプトとコマンドを入力し、ジェネレートボタンをクリックして、新しい画像を生成しています。

💡レファレンスオンリー (Reference Only)

レファレンスオンリーは、AIが生成する画像を既存の画像と比較して、雰囲気を引き継ぐ機能です。ビデオでは、この機能を使って、ベース画像の雰囲気を保ちながら表情を変えています。

💡怒っている表情 (Angry Expression)

怒っている表情は、AIが生成する画像の表情のひとつです。ビデオでは、「アングリー」と入力することで、怒っている表情を生成しています。また、数字の調整で、怒りの強さを制御しています。

💡悲しい表情 (Sad Expression)

悲しい表情は、AIが生成する画像で表される感情です。ビデオでは、悲しい表情を作るために、プロンプトの数字を2.0に設定して画像を生成しています。悲しみを表現する際には、細かい調整が必要になることが示されています。

💡表情変更プロンプト (Expression Change Prompt)

表情変更プロンプトとは、AIに表情を変える指示を与えるための言葉です。ビデオでは、様々な表情を作り出すために、異なるプロンプトを用いて説明しています。プロンプトに応じて生成される表情は、理想的な結果を得るための重要な要素です。

Highlights

ステーブルディフュージョンを使って表情を変える方法を紹介します。

プロンプトを調整することで、様々な表情を生成できます。

ベースとなる画像を用意し、レファレンスオンリー機能と併用して表情を変えます。

プロンプトに「スマイル」と加えることで笑顔を生成できます。

スマイルの強度を数字で調整することで、より自然な笑顔を作ることができます。

数字を1.5に設定すると、適度な笑顔が生成されます。

他の表情を表現するために、プロンプトに異なる単語を追加してみます。

XYZプロットを使って、様々な表情を一度に表示します。

表情のプロンプトに応じて、生成された画像の質が変わることがあります。

数字を調整することで、指示がうまく行かない画像を改善できます。

悲しい表情を表現する際には、1.3から1.5の強調度合いで試してみます。

怒っている表情を表現する際には、1.5の強調度合いで生成します。

プロンプトに「アップセット」を追加し、動揺する表情を生成します。

プロンプトと数字の調整を繰り返すことで、理想の表情を模索できます。

表情を変えるプロンプトの一覧を紹介し、1.4の強調を加えます。

数値を調整したり、解像度を上げることで画像の質を改善できます。

レファレンスオンリーを使用しない場合でも、強調度合いによって表現が変わります。

コントロールネットと併用する場合は、干渉の程度を調整してみることが大切です。

1.5を超える強調度合いは、おかしな画像が生成される可能性が高いです。