安定した拡散でより良い顔を作成する方法
Stable Diffusion を使用すると、ほぼすべてのテキストベースの画像を作成できます.たとえば、プロジェクトで AI の顔を強化する必要があるが、同じ顔を更新するのに問題がある. もしそうならヒントを使用して、Stable Diffusion の顔の作成プロセスを効率化できます。詳細については、以下をお読みください。
Contents
安定した拡散でより良い顔を作成するにはどうすればよいですか?
Stable Diffusion でより良い顔を作成するには、Deforum Stable Diffusion v0.5 という Google Colab をセットアップする必要があります。その方法は次のとおりです。
- ブラウザを開いて、 このウェブサイト.
- 「接続」ボタンを押して、「NVIDIA GPU」をクリックしてください。これは Google のサーバー GPU であるため、心配する必要はありません。NVIDIA グラフィックス カードは必要ありません。
- Web サイトにコンピューターの使用を許可します。
- GPU カードの下部 (「モデルと出力パス」) を押します。
- Google Colab を Google ドライブに接続し、[モデルと出力パス]の横にチェックマークが表示されるまで待ちます。
- 「環境のセットアップ」を選択し、システムにアカウントを接続させます。 「Python 定義」でも同じことを行います。
- 「モデルの選択とロード」に移動します。このセクションでは、.ckpt ファイルをダウンロードして Google ドライブにアップロードするモデルが必要です。 このウェブサイト 「Download Weights」セクションの「sd-v1.4.ckpt」を押して、このファイルを、改善したいモデルが含まれている Google Drive AI フォルダーにアップロードします。
- [モデルの選択と読み込み]セクションの横にある[再生]ボタンを押します. Google Colab が使用できるようになるまで、緑色のチェック マークが表示されるまで待ちます.
Google Colab がセットアップされると、Stable Diffusion を使用して AI の顔を強化できます. このプロセスは古いレンダリング強化とも呼ばれ、画像の解像度を変更することになります:
- 強調したい顔を切り取り、別の画像として保存します。
- 顔を Google Colab 一時ドライブ (左側のパネル) にドラッグしてアップロードします。
- 写真の上で右クリックし、ボタンをクリックしてください。 「コピーパス」
- 右側のメニューの「init_image」フィールドに画像を貼り付けます。
- 「プロンプト」ウィンドウに移動し、顔に付けたいプロンプトを入力します。必ず入力してください。
最良の結果を得るには、プロンプトで引用符で囲みます。 - 「実行」セクションに移動し、「画像設定」メニューを見つけます。
- ピクセル解像度を変更して、顔の明瞭度を高めます。たとえば、800×800 がほとんどの場合に適しています。
- 「実行」ウィンドウの下にある赤い「再生」ボタンを押して、画像を表示します。
- 画像はさまざまな解像度で表示されます。 必要な効果が得られるまで、手順を繰り返します。
- ドライブから画像をダウンロードし、オリジナルをオーバーレイします。
より良い顔を作成するために、安定した拡散を伴うバリエーションをどのように使用しますか?
解像度を変えることで顔を直接改善することに加えてバリエーションを提案することもできます。 よりシャープな画像を生成します。 最初のステップは、「アニメーション」を「なし」に設定することです。次のことを行う必要があります。
- 上記の手順に従って、Google ドライブを Google Deforum Stable Diffusion 0.5 Colab に接続します。
- 顔画像を Colab の左側のパネルにアップロードします。
- 「アニメーション」メニューに移動し、設定を変更します。 「animation_mode」を「なし」に
- [アニメーション]セクションの横にある[再生]ボタンをクリックして、変更を保存します。
「アニメーション」設定を変更したら、アニメーションを作成したくないので、他のほとんどの設定を無視できます。 一部の「プロンプト」は次の手順に従います。
- 元のプロンプトを出発点として使用します。
- 行を変更して、必要な変更を加えます。 AI 顔に機能を追加するか削除するかによって、ウィンドウではなく「プロンプト」セクションで機能します。 「アニメーションプロンプト」
- プロンプトの最初と最後に引用符を配置します。
- プロンプトの最後にコンマを置きます。 (引用符の後)
- 「プロンプト」ウィンドウの左上隅にある「再生」ボタンをクリックして、画像を表示し、進行状況を保存します。
次にカスタマイズするメニューは「実行」メニューで、ウィンドウに移動する必要があります。 「画像設定」を開き、次の変更を行います。
- 「サンプリング設定」に移動し、「シード」を「-1」に設定します。
- 必要な効果が得られるまで、「サンプラー」設定を使用してみてください。
- 「ステップ」はいくつでも定義でき、「スケール」の値も自由です。
- 「ddim」レンダリングを使用している場合は、「Sampler」ウィンドウで「ddim_eta」を「1」に設定します。
- 見つかるまで下にスクロールします。 「バッチ設定」に移動し、「n_batch」行に移動して、必要なバリエーションの数をテキスト ボックスに入力します。
- 「デフォルト設定」に移動し、「use_init」オプションの横にあるボックスをクリックすると、設定の横にチェック マークが表示されます。
- 元の画像の 50% を再利用する場合は、「強度」ボックスに「0.5」と入力します。 より高い値またはより低い値を入力できます。 ソースをどれだけ再利用したいかによって異なります。
- 左パネルの「ファイル」アイコンをクリックします。 最適化する顔画像を含むフォルダーに移動します。 左側にドラッグします画像が読み込まれるまで待ちます。 右クリックして押す 「パスコピーボタン」
- パスを「init_image」ボックスに貼り付け、メニューの左上隅にある赤い「再生」ボタンをクリックします。 「画像設定」
- プログラムに画像をレンダリングさせ、さまざまなスタイルを追加させます。 画面の下部に、バリエーションを含む新しい顔が表示されます。
安定した拡散で視覚化を改善する方法
Stable Diffusion で顔を強調する場合、適切な指示を作成するために多くの作業が必要です。 この機能は、「txt2img」テクノロジーを使用して画像を生成するために使用され、プロンプトやその他のパラメーターを使用します。 入力に基づいて画像を作成します。
前述のように目的の結果を得るには、ある時点で「シード」値を入力する必要があります。 バリエーションを組み合わせるときの「ステップ」の数を変えることもできます。
ただし、これらの機能は、結果面を改善するという点ではあまり役に立たない場合があります。 高品質のビジュアライゼーションを確保するには、「プロンプト」ゲームをレベルアップする必要があります。 そのために役立つヒントをいくつか紹介します。
- 具体的に – プロンプトは非常に詳細にする必要があります。 特に序盤フレーズの始まりは終わりよりも効果があるからです。 重要な情報を省略した場合ご希望の外観にならない場合があります。
- 英語に固執する – Stable Diffusion の開発者は、20 億を超える英語のテキストと画像のペアを使用しています.100 以上の他の言語では、より少ないペアしかありません. これは、各言語のシェアが英語よりもはるかに少ないことを意味します. その結果、英語以外でプロンプトを作成すると、正確な結果が得られない場合があります.
- ジャンルとアート タイプを組み合わせる – Stable Diffusion はあらゆるタイプの画像を生成できます。 油絵やアクリル画などファッション写真、漫画、版画など、必要な画像のスタイルを指定すると、アルゴリズムがより正確になります。
- モダン – アーティスティックなイメージをお探しの場合。 「ArtStation トレンド」またはその他の名前を追加して、Stable Diffusion を意図した画像にできるだけ近づけることができます。
- 言葉遊び – プロンプトを書くとき誇張してはいけないので、「シャープ フォーカス」や「見事な照明」などの技術的特徴や、「素晴らしい」、「ゴージャス」、「素晴らしい」などの形容詞をいじってみてください。
- アーティスト名を追加 – Stable Diffusion を使用すると、有名なアーティストのスタイルで画像を作成できます。 この効果を達成するために Andry Warhol、Caspar David Friedrich、Auguste Renoir など、アーティストの名前をプロンプトに追加します。
- 免責事項を使用する – インターフェイスの一部のバージョンは、否定的なプロンプトに応答します。 これらにより、イメージの作成時にシステムが避けるべきものを指定できます。
この安定したスプレッドで、あなたの想像力と創造力を存分に発揮してください。
安定した拡散制御には時間がかかる場合があります。 特に、AI の顔などの画像を強化したい場合。 1 つか 2 つの行を間違えると、プロジェクトが簡単に台無しになる可能性があります。 したがって、プロンプトを作成してビルド パラメーターを入力するときは、特に注意する必要があります。 いくつかの調整を加えて顔やその他のパーツを作る必要があります。 あなたの写真を簡単に美しく
どのくらいの頻度で安定拡散を使用しますか? 写真に多様性を加えたことはありますか? もしそうならそれらはどのような影響を与えますか? 以下のコメントセクションであなたの経験を共有してください。