Die Erstellung von Panoramabildern durch das Zusammenfügen mehrerer Fotos ist eine etablierte Technik, um Weitwinkelansichten zu erhalten, die über das Sichtfeld einer einzelnen Aufnahme hinausgehen. Bei Videos, die durch Schwenken der Kamera aufgenommen wurden, ist dies jedoch komplizierter, insbesondere wenn sich Objekte innerhalb der Szene bewegen. Ein neues Verfahren namens VidPanos widmet sich diesem Problem und ermöglicht die Synthese von Panorama-Videos aus solchen Schwenkvideos.
Die größte Herausforderung bei der Erstellung von Panorama-Videos aus Schwenkvideos besteht darin, die zeitliche und räumliche Konsistenz der Szene zu gewährleisten. Dies beinhaltet:
VidPanos begegnet diesen Herausforderungen durch die Anwendung generativer Videomodelle. Anstatt die Panoramaansicht lediglich aus den vorhandenen Bilddaten zusammenzusetzen, nutzt VidPanos diese Modelle, um fehlende Bildinformationen zu ergänzen und ein konsistentes Gesamtbild zu erzeugen. Dies wird durch einen zweistufigen Prozess erreicht:
Zunächst werden aus dem Schwenkvideo Schlüsselpunkte und Bewegungspfade von Objekten extrahiert. Diese Informationen dienen als Grundlage für die nachfolgende Generierung der Panoramaansicht.
Basierend auf den extrahierten Informationen generiert VidPanos mithilfe von Deep-Learning-Modellen die fehlenden Bildinformationen und erzeugt so eine vollständige Panoramaansicht der Szene. Dabei werden die Bewegungspfade der Objekte berücksichtigt, um eine flüssige und realistische Darstellung zu gewährleisten.
VidPanos bietet gegenüber herkömmlichen Panorama-Stitching-Methoden mehrere Vorteile:
VidPanos stellt einen vielversprechenden Ansatz für die Generierung von Panorama-Videos aus Schwenkvideos dar. Zukünftige Forschungsarbeiten könnten sich auf die Verbesserung der Genauigkeit und Effizienz des Verfahrens konzentrieren, sowie auf die Erweiterung der Einsatzmöglichkeiten, beispielsweise durch die Integration von 360-Grad-Videos.