RVMX AIによるテキストより画像生成検証Tool(参考)

RVMX AIによるテキストより画像生成検証Tool(参考)

概要

 RVMX AIによるテキストより画像生成検証Tool(参考)

   最近テキストよりAIによる画像を生成が話題となっています、そこで実際の機能と応用の可能性について検証してみました。
  検証用Toolは出来るだけどのPCでも動作するものを選択しました。
  方法はPC内ですべてを処理するものとWEBUIによる方法を試しました。
  最近はStable Diffusionがオープンソースで出てきて話題になっています、
  しかしPC内ですべてを動作させるにはNIVDA製のGPU(約10万円程度)が追加で必要なので除外しました。
  そのためPC内ですべてを動作させるにはNCNN(モバイル向けの推論フレームワーク)によるCPU動作としました、
  しかし時間はGPUを使ったものよりはかかります。
  また、NCNNよりはStable Diffusionのほうがプロンプトに対して正確に対応するみたいです。
  よって、Stable DiffusionもWEBUIを使うWeb経由の利用も可能としました。但し制約はあります。
  動作は2023年版以降となります。
    プロンプト=ノエル,原神インパクト,シルバーショートヘア,緑の目,赤いバラ,白い布,白い鎧のドレス,かわいい,赤いスカートの例
    プロンプト=madonnaの例

1.回線設計よりの使い方

     -1.回線設計とは直接関係機能の為、サンプルソフト提供機能を開発して提供できるようにしました。
    
-2.RVMX AIによるRVMX AIによるテキストより画像生成検証Tool(参考)し、インストール
      但し、データが多い為約3Gとなります。回線速度の遅いときは時間がかかります

2.操作説明

    -1.画面説明
   

     a.プロンプト  プロンプト(呪文)
      a-1.日本語     現在はプロンプト(AIへ渡す呪文)は基本的に英語となっています。
                しかしわかりやすくするため日本語入力も可能としています、
                但しRVMX AIによるテキストより画像生成用プロンプト作成補助Tool(参考)のサポートが必要となります

      a-2.希望する特徴   ホジティブ(希望)プロンプト
       a-2-1.プロンプト表示テキストボックス   直接修正も出来ます

       a-2-2.参照ボタン  RVMX AIによるテキストより画像生成用プロンプト作成補助Tool(参考)経由の入力

      a-3.否定する特徴   ネガティプ(非希望)プロンプト
       a-3-1.プロンプト表示テキストボックス   直接修正も出来ます

       a-3-2.参照ボタン  RVMX AIによるテキストより画像生成用プロンプト作成補助Tool(参考)経由の入力

     b.画像作成条件
      b-1.横幅      画像の横幅(ピクセル)

      b-2.高さ      画像の高さ(ピクセル)

      b-3.種       拡散用の種

      b-4.ステップ     繰り返し数

      b-5.高速化     効果?

     c.画像作成ボタン    画像作成を開始します。
   作成中

   -2.プルダウンメニュー
     a.システム
   
      a-1.プロンプトジェネレータ ツール   RVMX AIによるテキストより画像生成用プロンプト作成補助Tool(参考)を単独で起動します
      a-2.自分の辞書へ自動登録  日本語と英語の変換で辞書にないときは同区画面が自動的に出てきて登録ができます。

      a-3.終了         ソフトの停止

     b.オプション
   
      b-1.Stable Difffuse WEBUI Stable DifffuseをWeb経由で利用する参考サイト、
                      但しこの機能は提供先の仕様変更で使えなくなることが有ります

       b-1-1.Hugging Face      ハグフェイス ? 未来を築くAIコミュニティ。

       b-1-2.Mage.Space       Mage.Spaceの説明

       b-1-3.DreamStadio      DreamStadioの使い方

     c.Help
   
      b-1.説明      本説明

      b-2.バージョン    ソフト情報
   

3.操作方法

    -1.目的とする画像の特徴(呪文)の入力

    -2.ネガティブプロンプト、ほしくない画像の特徴の入力

    -3.画像作成条件を設定

    -4.画像作成ボタンをON    CPUでの動作の為時間がかかります。

4.結果例

    -1.プロンプトを東京より富士山を眺めて朝日がさす、建物の高い場所よりの景色の例でWEBUIとの比較も
     a.NCNNでの例
   富士山がない?
     b.Hugging Faceでの例
   
     c.Mage.Spaceでの例
   富士山がしっかり出てきている
     d.DreamStadioでの例(br>
   朝日が強調されている

    -2.キャラクターの特徴を入れた例
     a.NCNNでの例
   

5.その他

    -1.本ソフトはGPU等特殊なハードが無くても確認ができるようにしています、しかしCPU動作の為速度は遅くなります。
    -2.NCNNはStable Diffuseよりプロンプトでの再現に劣っているみたいです。
    -3.本ソフトは.Net Frameworkではなくて試験的に.Net Core(共通プラットフォーム)で作られています。
      共通プラットフォームとは、Apple・Linux・Windows・スマホなど上で動作できる環境です。
    -4.Stable DiffusionにはNSFWコンテンツ対策がされています、よってStable DiffusionのWEBUIでの操作にはNSFWコンテンツは拒否されます。
     NSFWとは裸・ポルノグラフィ・卑語・暴力に関連する画像です。
     しかし、本ToolのNCNNにはNSFWコンテンツ対策がされていませんので、成果品の扱いには注意してください

6.AI関連リンク

    -1.RVMX AIによるテキストより画像生成用プロンプト作成補助Tool(参考)
    -2.RVMX AI関連 News
    -3.RVMX AIによるテキスト生成検証Tool(参考)

提供ソフトのQ&A
(有)RVMX