In einer Welt, in der digitale Inhalte und Medien ständig an Bedeutung gewinnen, ist die Fähigkeit, realistische Bilder zu erstellen und zu bearbeiten, entscheidend für viele Industriezweige geworden. Vom Game Design über E-Commerce bis hin zur Filmproduktion – die Möglichkeiten der digitalen Materialbearbeitung revolutionieren kreative Prozesse. Ein besonders spannender Fortschritt in diesem Bereich ist das ZeST-Verfahren (Zero-Shot Material Transfer from a Single Image), das eine bahnbrechende Methode zur Materialübertragung in Bildern darstellt.
ZeST, entwickelt von einem Team aus Forschern, darunter Ta-Ying Cheng, Prafull Sharma, Andrew Markham, Niki Trigoni und Varun Jampani, ermöglicht es, Materialien von einem Beispielbild auf ein Objekt in einem anderen Bild zu übertragen, und das ohne vorheriges Training. Dieser Ansatz nutzt Diffusionsadapter, um implizite Materialeigenschaften aus dem Beispielbild zu extrahieren und diese dann mithilfe eines vortrainierten Inpainting-Diffusionsmodells auf das Zielobjekt zu übertragen. Dabei werden Tiefenschätzungen als geometrische Hinweise und Graustufenobjektschattierungen als Beleuchtungshinweise verwendet.
Die Methode funktioniert mit echten Bildern und benötigt keine Anpassung an spezifische Datensätze, was ZeST zu einem Zero-Shot-Ansatz macht. Sowohl qualitative als auch quantitative Ergebnisse auf realen und synthetischen Datensätzen zeigen, dass ZeST fotorealistische Bilder mit übertragenen Materialien erzeugt. ZeST kann darüber hinaus für mehrfache Bearbeitungen und robuste Materialzuweisungen unter verschiedenen Beleuchtungsbedingungen verwendet werden.
Die Herausforderung bei der Materialbearbeitung in 2D-Bildern besteht darin, die Materialinformationen von anderen Objekteigenschaften wie Geometrie und Beleuchtung zu trennen und auf ein neues Bild anzuwenden. ZeST vereinfacht diesen Prozess, indem es sich auf die jüngsten Fortschritte im Bereich der Bildgenerierung und -bearbeitung stützt und diese für das Problem der Materialübertragung anpasst. Die Präsentation dieses Verfahrens in Form einer einfachen Pipeline mit sorgfältig ausgewählten Designentscheidungen ist ein Schlüsselaspekt der Forschung.
Ein weiterer Vorteil von ZeST ist, dass keine expliziten 3D-Modelle, Beleuchtungseinstellungen oder Materialinformationen benötigt werden. Mit heutzutage leicht zugänglichen 2D-Tiefen- und Segmentierungsschätzungen und dem impliziten Materialtransfer wird die Notwendigkeit einer expliziten Spezifikation von 3D-Geometrien oder Materialmerkmalen umgangen. Dies öffnet die Tür für zahlreiche Anwendungen in der Grafikbearbeitung, wie das Anwenden vorgefertigter Materialien auf reale Bilder, das Bearbeiten verschiedener Materialien von Objekten in einem einzigen Bild oder lichtbewusste Materialübertragungen.
Die Forscher haben ZeST bereits auf einer Vielzahl von synthetischen und realen Datensätzen getestet und die Ergebnisse sind vielversprechend. ZeST erzielt eine hohe Foto-Realität und Materialgenauigkeit in den Ausgabebildern und funktioniert komplett ohne Training. Durch die Verwendung verschiedener Objektmasken kann ZeST auch dazu verwendet werden, unterschiedliche Materialien auf mehrere Objekte in einem einzigen Bild zu übertragen. Darüber hinaus kann ZeST lichtbewusste Materialübertragungen durchführen, indem es Reflexionen ändert und gleichzeitig texturale Muster konsistent hält, was potenzielle Anwendungen in Verbindung mit 3D-Texturierungsmethoden eröffnet.
Die Forscher haben ihre Arbeit und Demonstrationen des ZeST-Verfahrens auf der Plattform Hugging Face veröffentlicht, wo Interessierte die Technologie selbst ausprobieren können. Die dazugehörige Demo ist jetzt öffentlich auf Hugging Face verfügbar und läuft auf ZeroGPU, was es ermöglicht, das Verfahren kostenlos zu testen. Die Forschungsgemeinschaft und die Öffentlichkeit sind eingeladen, ihre besten Ergebnisse zu teilen und so zur Weiterentwicklung und Verbreitung dieser innovativen Technologie beizutragen.
Die Entwicklungen im Bereich der künstlichen Intelligenz und der Bildbearbeitung schreiten schnell voran, und ZeST ist ein herausragendes Beispiel dafür, wie technologische Innovationen die kreativen Möglichkeiten erweitern können. Mit zunehmendem Bedarf an hochqualitativen visuellen Inhalten könnten Verfahren wie ZeST bald zu einem unverzichtbaren Werkzeug für Designer, Künstler und Content-Ersteller weltweit werden.
Quellen:
- Hugging Face Papers: ZeST: Zero-Shot Material Transfer from a Single Image, arXiv:2404.06425, https://huggingface.co/papers/2404.06425.
- Projektseite von ZeST: https://ttchengab.github.io/zest.
- Hugging Face Spaces-Demo von ZeST: https://huggingface.co/spaces/fffiloni/ZeST.