Stability AI veröffentlicht Stable Diffusion 3.5: Ein Schritt in Richtung Realismus?
Die Welt der KI-Bildgeneratoren ist in ständiger Bewegung. Neue Modelle und Updates erscheinen in schneller Folge und versprechen immer bessere Ergebnisse. Nun hat Stability AI, das Unternehmen hinter dem bekannten Open-Source-Modell Stable Diffusion, seine neueste Version veröffentlicht: Stable Diffusion 3.5.
Stable Diffusion 3.5: Was ist neu?
Stable Diffusion 3.5 kommt in drei Varianten daher: Large, Large Turbo und Medium. Jede Variante hat ihre eigenen Stärken und ist auf unterschiedliche Anwendungsfälle zugeschnitten.
Stable Diffusion 3.5 Large
Mit 8 Milliarden Parametern ist Stable Diffusion 3.5 Large das leistungsstärkste Modell der neuen Serie. Es soll eine höhere Bildqualität und eine bessere Umsetzung von Texteingaben (Prompts) bieten als seine Vorgänger.
Stable Diffusion 3.5 Large Turbo
Stable Diffusion 3.5 Large Turbo ist eine destillierte Version des Large-Modells. Das bedeutet, dass es schneller Bilder generieren kann, allerdings auf Kosten der Detailgenauigkeit.
Stable Diffusion 3.5 Medium
Stable Diffusion 3.5 Medium ist mit 2,5 Milliarden Parametern das kleinste der drei Modelle. Es wurde speziell für den Einsatz auf Consumer-Hardware optimiert und soll auch auf weniger leistungsstarken Geräten flüssig laufen.
Verbesserungen gegenüber Stable Diffusion 3
Stability AI räumt ein, dass die Vorgängerversion, Stable Diffusion 3 Medium, nicht die Erwartungen der Community erfüllen konnte. Mit Stable Diffusion 3.5 hat das Unternehmen auf das Feedback der Nutzer gehört und einige Schwachstellen der Vorgängerversion behoben.
Zu den wichtigsten Neuerungen gehören:
- **Verbesserte Prompt-Adhärenz:** Stable Diffusion 3.5 soll Texteingaben besser umsetzen und somit genauere Ergebnisse liefern.
- **Höhere Bildqualität:** Die neue Version soll realistischere und detailliertere Bilder generieren.
- **Schnellere Inferenzzeiten:** Insbesondere die Large Turbo-Variante soll deutlich schneller Bilder erstellen können.
Verfügbarkeit und Lizenzierung
Stable Diffusion 3.5 Large und Large Turbo sind ab sofort verfügbar. Die Medium-Variante soll am 29. Oktober folgen.
Alle drei Modelle werden unter der Stability AI Community License veröffentlicht. Das bedeutet, dass sie für nicht-kommerzielle Zwecke kostenlos genutzt werden können. Unternehmen mit einem Jahresumsatz von unter 1 Million US-Dollar dürfen die Modelle ebenfalls kostenlos kommerziell nutzen. Für größere Unternehmen bietet Stability AI eine Enterprise-Lizenz an.
Fazit
Mit Stable Diffusion 3.5 hat Stability AI ein vielversprechendes Update seiner KI-Bildgenerator-Technologie veröffentlicht. Die neue Version soll nicht nur die Schwächen der Vorgängerversion ausbügeln, sondern auch neue Möglichkeiten für Künstler und Kreative eröffnen. Ob Stable Diffusion 3.5 den hohen Erwartungen gerecht wird, werden die kommenden Wochen und Monate zeigen.
Quellen
- https://stability.ai/news/introducing-stable-diffusion-3-5
- https://venturebeat.com/ai/stable-diffusion-3-5-debuts-as-stability-ai-aims-to-improve-open-models-for-generating-images/
- https://siliconangle.com/2024/10/22/stable-ai-releases-next-gen-open-source-stable-diffusion-3-5-text-image-ai-model-family/
- https://techcrunch.com/2024/10/22/stability-claims-its-newest-stable-diffusion-models-generate-more-diverse-images/
- https://the-decoder.de/stability-ai-veroeffentlicht-neue-stable-diffusion-3-5-modelle/
- https://www.tomsguide.com/ai/stabilityai-releases-stable-diffusion-3-5-a-step-up-in-realism
- https://stability.ai/
- https://www.marktechpost.com/2024/10/22/stability-ai-releases-stable-diffusion-3-5-stable-diffusion-3-5-large-and-stable-diffusion-3-5-large-turbo/
- https://huggingface.co/stabilityai/stable-diffusion-3.5-large
- https://www.reddit.com/r/LocalLLaMA/comments/1g9j5b6/stability_ai_has_released_stable_diffusion_35/