Amuse v3で扱ってる v3.2までのモデル一覧 -SD MODEL-
(当環境下における一方的な主観的体感とメモと寸評)
【寸評:日本人は東アジア系の顔に分類されてるモデルが多数】
・StableDiffusion
BASE MODEL、論外
・StableDiffusion(AMD GPU)
BASE MODEL、AMD GPUにファインチューニングされたモデル
他モデルがあるので出番なし
・A-Zovya Photoreal、Absolute Reality、AnalogMadness、unStable Illusion
SDモデルで無難なReal系MODEL。テスト生成時には良く使っている
Absolute Reality:25~30STEP, GuidanceScale:4.5~10
他は詳細なかったり404やら。
A-Zovya PhotorealでLCMスケジューラーを使ってみた
設定メモ
Scheduler:LCM, SIZE:768x1024, STEP:16, GuidanceScale:2.00
Optimization:Level 4, BetaSchedule:Liner,
BetaStart:0.00085, BataEnd:0.0145
Decoder TileMode:Overlap, Decoder TileOverlap:256,
・AziibPixelMix
ドット絵モデル
・Colorful、Copax Timeless
Colorful:Real系、Copax Timeles:semi-Real系
この辺からクセが強くなる、Default settingのままだと使い辛い印象
Colorfulは色彩豊かではあるが人物(特に女性)生成にかなりバラつきがある。
PromptとSettingが嚙み合った時は思いのほか良い。
・Dark Sushi MIX、MeinaMix、Real Cartoon 3D、SXZ Luma、ToonYou、YesMix
*Amuseで使えるPony系と呼べる(呼べそうな)モデル
Real Cartoon 3D、ToonYou、SXZ LumaはCartoon系
Pinup・Cover系グラビアを生成するのはコレかな
SXZ Lumaはsemi-real系cartoonモデルと呼べばいいのか?
スケジューラー次第でどっちかに寄る、色相暗め。
LCMとの相性は良いように思える。
Dark Sushi MIX、MeinaMix、YesMixはanime/2Dキャラ系か?
YesMixにクセの強さはある、総じてKDPM2やLCMは良い感じに
Eular系だとMODEL本来の質感が出せそう。
[20250805] YesMixはコッチのカテゴリーに移動
・Dreamshaper v8、Juggernaut v11
全SDモデル中、動作が重い。
BASE MODELとして捉えると他モデルが見えてくる気がした
・EpicRealism、Experience
共にReal系、特徴がないのが特徴の無難なモデル
代替として残せるが基本使う機会は少ない。
日本人女性はどうしても東アジア系統の顔付きに分類される
・Fluently v4
ウェザリング描写が特徴的なCartoon+Realartのようなモデル
ライティングなどの光源Prompt次第で化けそうな感じ
使っていて面白いモデルの一つ 、詳細メモはLCM版にて。
・Lyriel、Photon
Lyriel:semi-Real系、Photon:Real系
使ってみると一見無難なモデルなのだがスクエアサイズではなく
縦長サイズ膝上~全身生成は一気に安定度が増す
目のサイズを変える場合はanime styleの指定をすると良さげ
・MajicMIX Realistic
日本人女性の顔立ちが近いモデル、ただしちょっと気を抜くと
すぐに崩れて胴長・足長のバランス悪い構図になり
スクエアサイズで上半身~鼠径部ショットは安定してた。
・Neverending Dream
Dreamshaperの派生形なのかもしれないが
なぜかPony系タグの方が効きやすく
リアル系プロンプトを使っても楽しませてくれるモデルだが使い道に悩む
ファンタジー系のディテールをきめ細かく出してくれたりする
・RealDosMix
Neverending Dreamに似た感じのsemi-realsticモデル...らしいが
二次系ダッチワイフの商品紹介に見えてくる。
・Realistic Vision v6
Lyriel、Photonと逆でスクエアサイズで安定する...というより
縦長だとyoung・girlのプロンプトでもmature、顔が老ける
・ReV Animated
Pony系タグでCartoon系3Dアニメ風
semi-real系の中では一番扱いやすかった
・RPG
一番厄介で苦労したモデル、japaneseって単語に何か恨みでもあるのか?
ってぐらいNegative imageを誘発する
onnx入れ替えてCustomで使おうと考えてるモデルの第一候補。
================
抜けがあったら追加予定、個人環境や使い方
個人の主観や体感などは同じではないので使ってみるのが一番
ControlNET Canny(Part.1、Part.2、Part.3、Part.4、Part.5、Part6)
ControlNET Depthを使って生成した結果も踏まえて
・YesMix、RPG(安定生成低め、代替MODELが多い)
・Dreamshaper、Juggernaut(派生MODELが多い)
この辺のMODELはBackup取ってRemoveしても問題なさそうではある。
***Removeについて
Model ManagerタブでRemoveすると一覧から消えるので
Setting→Stable DiffusionからRemoveする
================
SD MODELを使ってみて
・SD MODELのアップデートは望み薄
統廃合の末にSDXLに移行していると思われる。
・リンク先に推奨設定が載っていること多いので要確認
Googleで検索するとSTEP数は多いほど良いとか
GuidanceScaleは1.00のままで良いとか
Amuseでも役に立ちそうな情報が少ないので
STEP数、GuidanceScale(CFGと同等)などの微調整は必須
一番目についた調整は、STEP:50、GuidanceScale:7.00
現環境下ではコレを基準値にして調整している
・Promptはシンプルで短く明確に、目元のPromptは大切
・上手く書けたPromptは比較的破綻が少ない
・上手く書けてもPromptがモデルに合わないこともある
・Negative Promptの有効活用
一度生成→Negativeな部分を書くとか、初めから全部入れとか手法を変える
・1024x1024のようなサイズは破綻前提で考える
生成画が荒れてり崩れたり、Promptの効きが悪いと感じたら
一度SIZEを落とすか、high resolution, masterpiece, best qualityなど
おまじない程度のPromptを活用、512x512の推論MODELなので限界はある。
・image inpaintやupscalerの活用
・最近公開された「Stable Diffusion 3.0 Medium NPU最適化MODEL」で
AMDは高品質の画像生成Promptのヒントとして
シーン全体を記述
構図の詳細
色やスタイル
完璧な結果は複数回、同じPromptで複数シードを試すことを推奨している。
MODELの違いがあるので目安、参考程度にするのが良いかもしれん。
MODELで遊びすぎて未だにControlNetやFeature Extractorを触ってない状態。
今後の課題の一つだが、やっとSD MODELが終わったのでLCM MODELで遊んでみる。