モーリーのメモ

アプリ開発等(プログラミング、CG作成)、興味を持ったことを実践してまとめるブログです。

モーリーのメモ

画像生成AIをインストールして画風を追加する!:Krita、Stable Diffusion

 テキストによる指示に従ってAIが画像生成するソフトウェアをインストールします。

  • プロンプト:"a cat wearing a tuxedo(タキシードを着た猫)"
     プロンプトは、AIに指示を与えるためのテキストのことです。
  • 生成された画像

  • モデルファイル(AIの学習済みデータ)を切り替えることで、画風を変更出来ます。

 
 今回は、ペイントソフトのKritaをインストールして、Stable Diffusion(画像生成AI)のプラグインを導入します。そしてモデルファイルをダウンロードして利用する方法を説明します。
 
 すべて無料で使用できます。Stable Diffusionは画像生成の使用回数に制限もありません。(※今後変わるかもしれません。)
 
 一度プラグインの起動に失敗したのですが、その修正方法も記載しています。

使用環境

 私が使用している環境です。

Kritaをインストール

 無料で使えるオープンソースのペイントソフト『Krita』をインストールします。

  1. 下記のサイトを開きます。
    krita.org
  2. Windows インストーラ』をクリックします。

  3. ダウンロードした『krita-x64-5.2.2-setup.exe(149.493KB)』を実行します。
  4. 『はい』をクリックします。

  5. 『OK』をクリックします。

  6. 『Next』をクリックします。

  7. 『I accept ~』にチェックを入れて、『Next』をクリックします。

  8. 『Next』をクリックします。

  9. 『Next』をクリックします。

  10. 『I Agree』をクリックします。

  11. 『Next』をクリックします。

  12. 『Install』をクリックします。

  13. 『Next』をクリックします。

  14. 『Finish』をクリックします。

    以上で、Kritaのインストール作業は完了です。

krita-ai-diffusionをインストール

 Kritaに『Stable Diffusionのプラグイン』を導入します。

  1. 下記のサイトを開きます。
    github.com
  2. 『Download』をクリックします。

  3. 『Download krita_ai_diffusion-1.14.0.zip』をクリックします。

  4. 『Krita』を起動します。
  5. 『ツール』→『スクリプト』→『Python プラグインをファイルからインポート』をクリックします。

  6. 『krita_ai_diffusion-1.14.0.zip』を選択して『開く』クリックします。

  7. 『はい』をクリックします。

    補足
    • プラグインのインポート先(ユーザ名にはWindowsのログインユーザ名が入ります)
      C:\Users\(ユーザ名)\AppData\Roaming\krita\pykrita
  8. 『Krita』を再起動します。
  9. 『新しい画像』をクリックします。

  10. 『幅』と『高さ』を”300”にして、『作成』をクリックします。
    動作確認ができればいいので、処理を軽くするため画像サイズを小さくしました。

  11. 『設定』→『ドッキングパネル』→『AI Image Generation』をクリックします。

  12. 『Configure』をクリックします。

  13. すべてのオプションにチェックして『Install』をクリックします。

    補足
    • プラグインのインポート先
      C:\Users\(ユーザ名)\AppData\Roaming\krita\pykrita\ai_diffusion\.server
    • オプションは後から追加出来ます。
      インストールサイズはデフォルトの設定で12.6GB、全て選択すると30.6GBでした。
      利用できるモデルファイルが増えるため、『Stable Diffusion XL』は入れておいたほうが良さそうです。
  14. 『OK』をクリックします。
    正常に実行されると『Server running - Connected』となります。
    注意:起動に失敗すると赤文字でエラーログが表示されます。私の環境で起きたエラーの対処法を次章に書いています。

起動エラーの対処法

 エラーログをよく見ると”The NVIDIA driver on your system is too old”との記載がありました。
 最新のドライバーをインストールすることで無事起動できました。
 グラフィックボードの確認方法とドライバーの更新方法を説明します。

  1. 『Win + R』キーを押して、”dxdiag”と入力して『OK』をクリックします。

  2. 『ディスプレイ』タブを選択してグラフィックボードを確認します。

  3. 下記のサイトを開きます。
    www.nvidia.co.jp
  4. 先ほど調べたグラフィックボード、OSを選択して、『探す』をクリックします。

  5. 『ダウンロード』をクリックします。

  6. 『ダウンロードの同意』をクリックします。

  7. ダウンロードした『551.52-desktop-win10-win11-64bit-international-dch-whql.exe』を実行します。
  8. 『はい』をクリックします。

  9. 『OK』をクリックします。

  10. 『同意して実行する』をクリックします。

  11. 『次へ』をクリックします。

  12. 2つのチェックボックスをオフにして、『閉じる』をクリックします。

  13. Kritaを起動して、『AI Image Diffusion』ドッキングパネルの『Configure』をクリックします。

  14. 『Launch』をクリックします。

    私の場合はこれで『Server running - Connected』となって正常に起動しました。

描画テスト

 実際にAIで画像を生成します。

  1. 『1.5 Digital Artwork』を選択して、”2 cat”とテキスト入力してから『Generate』をクリックします。

    補足
    • 『1.5 Digital Artwork』は『Style Presets(画風の設定)』です。
      ”1.5”はStable Diffusionのバージョンです。
      v1.0初期バージョン
      v1.5高品質化、高速化、アーティファクト(ノイズ・歪み)減少
      XL高解像度、詳細な表現、高い忠実度
    • ”2 cat”はプロンプトです。
      プロンプトは、AIモデルに生成させたい画像を指示するために使用するテキストです。
    少し待つと画像が生成されました。
    右下を見ると4パターン生成されていています。クリックで切り替えることが出来ます。

モデルファイルを追加してStyle Presetsを設定する

 Stable Diffusionではモデルファイル本体のことをCheckpointファイルと呼びます。それに加えて『Style Presets』の下記の項目を設定することで、画風を追加・調整することが出来ます。

    checkpoint特定の画風を再現するためのモデルファイル。CivitAI等の配布サイトで入手可能。
    LoRAcheckpointファイルに服装、髪型、ポーズ、背景、物体等を追加するためのファイル。
    style prompt生成したい画像の特徴をテキストで指示します。
    negative prompt生成したくない画像の特徴をテキストで指示します。
  1. 下記のページを開きます。
    civitai.com
  2. 『Download options』のボタン→『Model Safe Tenser(6.46GB)』をクリックします。

  3. ダウンロードした『aamXLAnimeMix_v10.safetensors』を下記のフォルダに配置します。
    C:\Users\(ユーザ名)\AppData\Roaming\krita\pykrita\ai_diffusion\.server\ComfyUI\models\checkpoints
  4. Kritaの『AI Image Generation』ドッキングパネルの『歯車』ボタンをクリックします。

  5. 『+』ボタンをクリックします。

  6. Nameに”AAM XL Anime Mix”を入力します。

  7. 『更新』ボタンをクリックしてから『aamXLAnimeMix_v10』を選択します。

  8. 『Style Prompt』に下記のテキストを貼り付けます。
    masterpiece, best quality, highres

    補足
    • テキストの意味
      masterpiece傑作
      best quality最高品質
      highres高解像度
  9. 『Negative Prompt』に下記のテキストを貼り付けます。
    nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name

    補足
    • テキストの意味
      NSFW職場不適切(Not Safe For Work)
      Lowres低解像度
      Bad anatomy解剖学的に不自然
      Bad hands手が不自然
      Text画像内にテキストが含まれている
      Error生成エラー
      Missing fingers指が欠けている
      Extra digit指が余分
      Fewer digits指が足りない
      Cropped画像がトリミングされている
      Worst quality最悪の品質
      Low quality低品質
      Normal quality普通品質
      Jpeg artifactsJpeg圧縮によるノイズ
      Signature作者の署名
      Watermark透かし
      Usernameユーザー名
      Blurryぼやけている
      Artist name作者名
  10. 『OK』をクリックします。

     
    追加した『Style Presets』が選択できるようになっています。

     
    今回は以上です。好みのモデルファイルを見つけて導入し、様々なプロンプトで画像作成を試して見てください。