In letzter Zeit habe ich an mehreren Stellen gelesen, das Wan 2.1 (eigentlich zur Generierung von Videos gedacht) sogar bei kleinen Grafikkarten bessere Bilder generiert als Flux. Da ich "nur" eine RTX3070 mit 8GB VRam habe (und 32 GB Ram) habe ich das mal ausprobiert. Das Ergebnis finde ich gar nicht mal so schlecht. Ich habe in das Workflow noch zwei weitere Lora Loader eingebaut. Ich bin noch am probieren was die zusätzlichen Loras nutzen. Die KI sagt dazu: Grundregel: 1–3 LoRAs pro Workflow 1–2 LoRAs: Ideal für kompakte Änderungen (z. B. ein Stil-LoRA + ein Charakter-LoRA) Geringes Konfliktpotenzial, überschaubarer VRAM-Einsatz 3 LoRAs: Erlaubt komplexere Kombinationen (Stil, Motion, Detail) Spannungsfeld: Stärke jeder LoRA auf 0.3–0.5 reduzieren, um Überlagerungen zu vermeiden. Als Model nutze ich das wan2.1-t2v-14b-Q4_0.gguf Mit 6 Steps werden teils schon sehr gute Ergebnisse in bei mir 90 Sekunden erreicht. Beim Scheduler schwanke ich zwischen simple, beta und ddim_uniform. Finger und Zehen werdenrecht gut gemacht. Aber es schwankt immer etwas.