Eigene Porträts mit der deutschen KI Flux selbst gestalten

Kategorien:

No items found.

Freigegeben:

September 2, 2024

Artikel jetzt als Podcast anhören

Per Open-Source-KI aus Deutschland zu Superman: Wie du dein eigenes Bild in Flux nutzt

Seit einigen Wochen sorgt Flux, eine Open-Source-Bild-KI aus Deutschland, im Netz für Aufsehen. Die KI ist zwar noch nicht lange öffentlich verfügbar, kann aber schon mit etablierten Tools wie Midjourney oder Stable Diffusion mithalten. Doch Flux kann mehr als nur normale Bildgenerierung. Sie ermöglicht es, die KI mit eigenen Fotos zu trainieren und anschließend KI-Bilder mit dem eigenen Gesicht zu erstellen. Egal, ob als Superman oder in einem Ferrari auf Hawaii – Flux macht es möglich. In diesem Artikel erklären wir, wie das funktioniert und was ihr dafür benötigt.

Das braucht ihr

Zunächst eine kleine Vorwarnung: Die vorgestellte Methode ist nicht kostenlos, aber keine Sorge, Millionär müsst ihr auch nicht sein. Das Training des Modells kostet ungefähr fünf US-Dollar und mit jedem weiteren Dollar könnt ihr 13 Bilder generieren.

Folgendes wird benötigt:

- Eine Kreditkarte zum Bezahlen - Rund 15 Fotos von euch selbst (in guter Auflösung und das Gesicht sollte klar erkennbar sein) - Einen Account auf der Website des KI-Anbieters fal.ai

Auf der Website von fal.ai können verschiedene KI-Modelle per Weboberfläche genutzt werden. Bezahlt wird mit Credits, die ihr im Voraus auf der Website kaufen müsst. Dazu oben rechts einfach auf das kleine Plus drücken und Credits für zehn Dollar kaufen. Das reicht für das Training und für einige Bilder.

Erst trainieren, dann generieren

Nachdem ihr euch bei fal.ai angemeldet und Credits gekauft habt, steuert ihr das Modell zum Training von Flux an. Dort ladet ihr eure Fotos entweder einzeln oder gesammelt als Zip-Datei hoch. Ihr könnt einige Einstellungen vornehmen, aber die Standardeinstellungen sind in der Regel ausreichend. Wichtig ist, dass ihr ein sogenanntes Trigger Word festlegt. Dieses benötigt ihr später im Prompt für Flux, um der KI zu sagen, dass ihr ein Foto von euch selbst generieren wollt. Ihr könnt hier alles wählen, wir haben uns für „alterego“ entschieden.

Wenn alles eingestellt und hochgeladen ist, klickt ihr auf „Start“ und müsst dann einige Minuten warten. In dieser Zeit wird die KI mit euren Fotos trainiert. Sobald das Training abgeschlossen ist, erscheint rechts unter „Training history“ ein Eintrag. Dort müsst ihr dann „Show output“ auswählen und die zweite der beiden angezeigten URLs kopieren – die, die mit „lora.safetensors“ endet. Diese benötigt ihr im nächsten Schritt.

Nun müsst ihr bei fal.ai in der Auswahl der Modelle „FLUX.1 [dev] with Controlnets and Loras“ auswählen. Das ist die Flux-KI, die ihr mit euren Trainingsdaten füttern könnt. Klappt die Additional Settings aus und tragt beim Punkt „Loras“ die kopierte URL ein, indem ihr auf „Add item“ klickt. Damit habt ihr Flux eure Trainingsdaten verlinkt und könnt mit der Generierung von Fotos beginnen.

Der Prompt

Um Bilder von euch zu generieren, müsst ihr auf ein paar Details achten. Zum einen muss der Prompt immer das von euch vorher festgelegte Trigger Word beinhalten. In unserem Beispiel mit dem Superhelden aus Metropolis wäre der Prompt also „alterego as Superman“. Tragt ihr im echten Leben eine Brille und wollt auch in den KI-Bildern eine tragen, müsst ihr diese in der Regel dazu prompten. Nach einem Klick auf „Run“ erstellt Flux euch innerhalb weniger Sekunden das gewünschte Bild von euch selbst.

Um euch die Erstellung von Prompts zu erleichtern, könnt ihr auf eine Sprach-KI wie ChatGPT oder Gemini zurückgreifen. Bittet den Chatbot darum, Prompts für eine Bild-KI zu erstellen, gebt an, dass das Trigger Word immer enthalten sein und die Prompts auf Englisch sein müssen. Im Anschluss könnt ihr dem Bot eine Szene beschreiben und erhaltet innerhalb von wenigen Sekunden ausführliche Prompts, die häufig zu guten Ergebnissen führen.

Die Ergebnisse sind teilweise erschreckend gut

Auch wenn Flux manchmal ordentlich daneben liegt und Bilder generiert, die nur entfernt an einen selbst erinnern, sind die Ergebnisse zum Großteil erschreckend nah an echten Fotos der Person, mit der die KI trainiert wurde. Manchmal stimmen die Hände nicht, stellenweise passt der Körper nicht zur Größe des Kopfes, aber die gezeigte Person ist in unserem Versuch fast immer klar zu erkennen. Sogar man selbst muss immer wieder genau hinschauen, um zu erkennen, ob ein Foto nun wirklich einen selbst zeigt oder nur durch eine KI erstellt wurde.

Solche Ergebnisse waren bisher nur mit einem deutlich größeren Aufwand zu erzielen und dann auch oft sehr viel schneller als KI-Bilder zu erkennen. Aber gerade die Qualität der Bilder kann auch zu einem Problem werden.

Was spaßig ist, öffnet leider auch Missbrauch eine Tür

Auch wenn bei dieser Spielerei lustige Bilder herauskommen, gibt es dennoch einen Aspekt, den wir nicht unerwähnt lassen wollen. Klar sollte natürlich sein, dass ihr nur Fotos von euch selbst nutzt, denn mit allem anderen verstoßt ihr gegen das Recht am eigenen Bild anderer Personen.

In der Weboberfläche von fal.ai ist außerdem der sogenannte Safety Checker immer aktiv und kann auch nicht deaktiviert werden. Heißt, ihr könnt Bilder nur bis zu einem bestimmten Punkt generieren, um Missbrauch der Funktion zu vermeiden. Allerdings ist das eine Entscheidung von fal.ai, Flux selbst kennt diese Grenzen nicht und per API-Schnittstelle kann der Safety Checker auch deaktiviert werden. Zudem ist Flux auch mit Safety Checker relativ ungehemmt. Ein Bild mit einer Waffe in der Hand? Kein Problem.

Immerhin konnten wir dank Safety-Funktion keine Nacktbilder oder Ähnliches erzeugen. Dennoch, aus der lustigen Spielerei mit Superman-Bildchen kann mit etwas Kenntnis auch ein echtes Problem werden. Leider ist das kein Thema, das erst mit Flux aufkommt, auch andere Bild-KI können Gesichter bereits in Fotos mit zweifelhaftem Inhalt generieren. Doch mit neuen Modellen wie Flux werden die Bilder immer realistischer und damit immer schwerer von echten Fotos zu unterscheiden. Spätestens jetzt sollten wir uns also überlegen, wie wir in Zukunft mit diesem Thema umgehen. Gesellschaftlich, politisch und regulatorisch.

Fazit

Flux bietet faszinierende Möglichkeiten, eigene Bilder mit Hilfe der KI zu generieren. Die Qualität der generierten Bilder ist beeindruckend und öffnet neue kreative Türen. Allerdings birgt die Technologie auch Risiken, insbesondere im Hinblick auf den Missbrauch und die Einhaltung von Persönlichkeitsrechten. Es bleibt abzuwarten, wie sich die Nutzung solcher Technologien weiterentwickelt und welche Maßnahmen getroffen werden, um Missbrauch zu verhindern.

Bibliography

https://t3n.de/news/open-source-ki-deutschland-superman-bild-flux-1642928/ https://www.finanznachrichten.de/nachrichten-2024-08/63100175-per-ki-zu-superman-dein-eigenes-bild-in-flux-nutzen-so-geht-s-397.htm https://twitter.com/t3n/status/1828681424574005261 https://www.threads.net/@dl7ag/post/C_M90JlI7hh https://www.itsicherheitnews.de/per-ki-zu-superman-dein-eigenes-bild-in-flux-nutzen-so-gehts/ https://de.linkedin.com/posts/t3n-magazin-yeebase-media-gmbh_wolltest-du-schon-immer-mal-superman-sein-activity-7234447227950108672-BpPI https://t3n.de/ https://twitter.com/t3n/status/1828406062182986235 https://snipki.de/flux-ki-bilder-generator/ https://www.facebook.com/100064654845221/posts/920397723458714/

Was bedeutet das?