Amuse v3で扱ってる v3.2までのモデル一覧 -SD MODEL-
(当環境下における一方的な主観的体感とメモと寸評)  

【寸評:日本人は東アジア系の顔に分類されてるモデルが多数】

・StableDiffusion
    BASE MODEL、論外
・StableDiffusion(AMD GPU)
    BASE MODEL、AMD GPUにファインチューニングされたモデル
    他モデルがあるので出番なし

A-Zovya Photoreal
Absolute RealityAnalogMadnessunStable Illusion
    SDモデルで無難なReal系MODEL。テスト生成時には良く使っている
    
Absolute Reality:25~30STEP, GuidanceScale:4.5~10
    他は詳細なかったり404やら。
        A-Zovya PhotorealでLCMスケジューラーを使ってみた 

            設定メモ
            Scheduler:LCM, SIZE:768x1024, STEP:16, GuidanceScale:2.00
            Optimization:Level 4, BetaSchedule:Liner, 
            BetaStart:0.00085, BataEnd:0.0145
            Decoder TileMode:Overlap, 
Decoder TileOverlap:256,

・AziibPixelMix
    ドット絵モデル

Colorful
Copax Timeless
    Colorful:Real系、Copax Timeles:semi-Real系
    この辺からクセが強くなる、Default settingのままだと使い辛い印象
    Colorfulは色彩豊かではあるが人物(特に女性)生成にかなりバラつきがある。
    PromptとSettingが嚙み合った時は思いのほか良い。

Dark Sushi MIXMeinaMixReal Cartoon 3DSXZ LumaToonYou
YesMix
    *Amuseで使えるPony系と呼べる(呼べそうな)モデル
        Real Cartoon 3D、ToonYou、SXZ LumaはCartoon系
            Pinup・Cover系グラビアを生成するのはコレかな
            
SXZ Lumaはsemi-real系cartoonモデルと呼べばいいのか?
            スケジューラー次第でどっちかに寄る、色相暗め。
            LCMとの相性は良いように思える。
         
    
    Dark Sushi MIX、MeinaMix、YesMixはanime/2Dキャラ系か?
            YesMixにクセの強さはある、総じてKDPM2やLCMは良い感じに
            Eular系だとMODEL本来の質感が出せそう。

            [20250805] YesMixはコッチのカテゴリーに移動

Dreamshaper v8
Juggernaut v11
    全SDモデル中、動作が重い。
    BASE MODELとして捉えると他モデルが見えてくる気がした

EpicRealismExperience 
    共にReal系、特徴がないのが特徴の無難なモデル
    代替として残せるが基本使う機会は少ない。
    日本人女性はどうしても東アジア系統の顔付きに分類される

Fluently v4
    ウェザリング描写が特徴的なCartoon+Realartのようなモデル
    ライティングなどの光源Prompt次第で化けそうな感じ
    使っていて面白いモデルの一つ
 、詳細メモはLCM版にて。

LyrielPhoton 
    Lyriel:semi-Real系、Photon:Real系

    使ってみると一見無難なモデルなのだがスクエアサイズではなく
    縦長サイズ膝上~全身生成は一気に安定度が増す
    目のサイズを変える場合はanime styleの指定をすると良さげ


MajicMIX Realistic
    日本人女性の顔立ちが近いモデル、ただしちょっと気を抜くと
    すぐに崩れて胴長・足長のバランス悪い構図になり
    スクエアサイズで上半身~鼠径部ショットは安定してた。

Neverending Dream
    Dreamshaperの派生形なのかもしれないが
    なぜかPony系タグの方が効きやすく
    リアル系プロンプトを使っても楽しませてくれるモデルだが使い道に悩む
    ファンタジー系のディテールをきめ細かく出してくれたりする    

RealDosMix
    Neverending Dreamに似た感じのsemi-realsticモデル...らしいが
    二次系ダッチワイフの商品紹介に見えてくる。

Realistic Vision v6
    
Lyriel、Photonと逆でスクエアサイズで安定する...というより
    縦長だとyoung・girlのプロンプトでもmature、顔が老ける

ReV Animated
    Pony系タグでCartoon系3Dアニメ風
    semi-real系の中では一番扱いやすかった

RPG
    一番厄介で苦労したモデル、japaneseって単語に何か恨みでもあるのか?
    ってぐらいNegative imageを誘発する
    onnx入れ替えてCustomで使おうと考えてるモデルの第一候補。

================
抜けがあったら追加予定、個人環境や使い方
個人の主観や体感などは同じではないので使ってみるのが一番

    ControlNET Canny(Part.1Part.2Part.3Part.4Part.5Part6
    
ControlNET Depthを使って生成した結果も踏まえて
・YesMix、RPG(安定生成低め、代替MODELが多い)
・Dreamshaper、Juggernaut(派生MODELが多い)
この辺のMODELはBackup取ってRemove
しても問題なさそうではある。 
    ***Removeについて

        Model ManagerタブでRemoveすると一覧から消えるので
        Setting→Stable DiffusionからRemoveする
================

SD MODELを使ってみて
    ・SD MODELのアップデートは望み薄
        統廃合の末にSDXLに移行していると思われる。
    
リンク先に推奨設定が載っていること多いので要確認
        Googleで検索するとSTEP数は多いほど良いとか
        GuidanceScaleは1.00のままで良いとか
        Amuseでも役に立ちそうな情報が少ないので

        STEP数、GuidanceScale(CFGと同等)などの微調整は必須
        一番目についた調整は、STEP:50、GuidanceScale:7.00
        現環境下ではコレを基準値にして調整している
    ・Promptはシンプルで短く明確に、目元のPromptは大切

    ・上手く書けたPromptは比較的破綻が少ない
    ・上手く書けてもPromptがモデルに合わないこともある
    ・Negative Promptの有効活用
        一度生成→Negativeな部分を書くとか、初めから全部入れとか手法を変える
    ・1024x1024のようなサイズは破綻前提で考える
        生成画が荒れてり崩れたり、Promptの効きが悪いと感じたら
        一度SIZEを落とすか、high resolution, masterpiece, best qualityなど
        おまじない程度のPromptを活用、512x512の推論MODELなので限界はある。

    ・image inpaintやupscalerの活用

    ・最近公開された「Stable Diffusion 3.0 Medium NPU最適化MODEL」で
        AMDは高品質の画像生成Promptのヒントとして
            シーン全体を記述
            構図の詳細  
            色やスタイル
        完璧な結果は複数回、同じPromptで複数シードを試すことを推奨している。
        MODELの違いがあるので目安、参考程度にするのが良いかもしれん。


MODELで遊びすぎて未だにControlNetやFeature Extractorを触ってない状態。
今後の課題の一つだが、やっとSD MODELが終わったのでLCM MODELで遊んでみる。