Für Teams, Einzelnutzer, Kanzleien und Transkription – derselbe Mindverse Look, klar aufgeteilt nach Anwendungsfall.
für Teams und Unternehmen
Die Plattform für Unternehmen, die eigene KI-Workflows, Wissensdatenbanken und Assistenten produktiv einsetzen möchten.
für Einzelnutzer und Creator
Der einfachste Einstieg in das Mindverse-Ökosystem für Content, Recherche, Bilder, Audio und produktives Arbeiten.
für Juristen und Kanzleien
Die spezialisierte KI-Lösung für juristische Recherche, Vertragsarbeit und kanzleispezifische Workflows.
für Audio, Meetings und Transkription
Schnelle KI-Transkription für Audiodateien und Meetings – ideal zum sofortigen Start oder für regelmäßige Nutzung.

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Landschaft der künstlichen Intelligenz wird kontinuierlich durch innovative Entwicklungen geprägt. Eine aktuelle Veröffentlichung von Netflix auf der Plattform Hugging Face, dem "VOID"-Modell, hat in Fachkreisen Beachtung gefunden. Dieses Modell ist darauf ausgelegt, Objekte aus Videos zu entfernen und dabei deren physikalische Interaktionen mit der Umgebung zu berücksichtigen.
Netflix hat sein erstes öffentliches KI-Modell namens "VOID" (Video Object and Interaction Deletion) auf Hugging Face zugänglich gemacht. Die Relevanz dieser Entwicklung liegt in der Fähigkeit von VOID, Objekte nicht nur visuell aus Videosequenzen zu eliminieren, sondern auch die physikalischen Auswirkungen ihrer Anwesenheit und Entfernung im Video zu simulieren. Dies umfasst beispielsweise Schatten, Reflexionen oder das natürliche Herunterfallen eines Objekts, das zuvor von einer entfernten Person gehalten wurde.
VOID basiert auf dem CogVideoX-Fun-V1.5-5b-InP-Modell, einem 3D-Transformer mit 5 Milliarden Parametern, und wurde speziell für das Video-Inpainting optimiert. Ein zentrales Element ist die sogenannte interaktionsbewusste Quadmaske. Diese Maske ist in der Lage, vier verschiedene Bereiche auf Pixelebene zu kodieren:
Die Eingabe für das Modell besteht aus dem Video selbst, der Quadmaske und einem Textprompt, der die Szene nach der Objektenfernung beschreibt. Die Standardauflösung beträgt 384x672 Pixel, und das Modell kann bis zu 197 Frames verarbeiten. Es verwendet den DDIM-Scheduler und operiert mit BF16-Präzision, ergänzt durch FP8-Quantisierung zur Speichereffizienz.
Die Nutzung von VOID ist primär für Fachanwender konzipiert. Für einen schnellen Einstieg wird ein Notebook-Ansatz vorgeschlagen, der die Einrichtung, den Modelldownload und die Inferenz an einem Beispielvideo automatisiert. Für eine detailliertere Steuerung und die Verarbeitung eigener Videos ist ein Kommandozeilen-Interface verfügbar. Eine wesentliche technische Anforderung für die Ausführung von VOID ist eine GPU mit mindestens 40 GB VRAM, wie sie beispielsweise die NVIDIA A100 bietet.
Der Workflow zur Anwendung von VOID gliedert sich in mehrere Stufen:
Das Training von VOID erfolgte auf synthetischen, paarweisen kontrafaktischen Videos. Diese wurden aus zwei Hauptquellen generiert:
Das Training erforderte erhebliche Rechenressourcen, insbesondere 8x A100 80GB GPUs unter Verwendung von DeepSpeed ZeRO Stage 2.
Für Unternehmen im Bereich der Medienproduktion, visuellen Effekte und der KI-gestützten Content-Erstellung bietet VOID neue Möglichkeiten. Die Fähigkeit, Objekte nahtlos und physikalisch plausibel aus Videos zu entfernen, kann den Workflow in der Postproduktion erheblich optimieren und Kosten senken. Anwendungsgebiete könnten die Erstellung von cleanerem Footage für Marketingzwecke, die Anpassung von Szenen ohne aufwendige Nachdrehs oder die Vereinfachung komplexer visueller Effekte sein. Die Verfügbarkeit auf Plattformen wie Hugging Face fördert zudem die Weiterentwicklung und Integration in bestehende Systeme.
Netflix' Vorstoß, ein solch spezialisiertes und leistungsfähiges KI-Modell öffentlich zugänglich zu machen, unterstreicht den Trend zur Demokratisierung fortschrittlicher KI-Technologien. Dies ermöglicht es einem breiteren Spektrum von Entwicklern und Unternehmen, innovative Lösungen zu erforschen und zu implementieren, was die gesamte Branche vorantreiben kann.
Die fortlaufende Entwicklung und Verbesserung solcher Modelle, wie sie auch auf Plattformen wie Hugging Face durch die Community betrieben wird, ist entscheidend für den Fortschritt in der KI-Forschung und deren praktischer Anwendung. VOID repräsentiert einen weiteren Schritt in Richtung intelligenterer und effizienterer Werkzeuge für die digitale Inhaltserstellung.
Bibliography - a30wattbulb/void-model. Hugging Face. URL: https://huggingface.co/a30wattbulb/void-model - akhaliq (AK). Hugging Face. URL: https://huggingface.co/akhaliq - akhaliq (AK). Hugging Face. URL: https://huggingface.co/akhaliq/activity/all - akhaliq (AK). Hugging Face. URL: https://huggingface.co/akhaliq/activity/upvotes - akhaliq (AK). Hugging Face. URL: https://huggingface.co/akhaliq/models - andrewpareles. Keep our Models List updated! · Issue #446 · voideditor/void. GitHub. URL: https://github.com/voideditor/void/issues/446 - Netflix/void-model. GitHub. URL: https://github.com/netflix/void-model - netflix/void-model · Hugging Face. Hugging Face. URL: https://huggingface.com/netflix/void-model - Netflix just dropped their first public model on Hugging Face: VOID | Hacker News. Hacker News. URL: http - Readme. Hugging Face. URL: https://huggingface.co/netflix/void-model/resolve/main/README.md?download=trueLernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen