Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
In der kontinuierlichen Entwicklung autonomer Fahrsysteme stellt die Fähigkeit, seltene und unvorhersehbare Szenarien zu meistern, eine zentrale Herausforderung dar. Waymo, ein führendes Unternehmen im Bereich autonomes Fahren und eine Tochtergesellschaft von Alphabet, hat nun einen signifikanten Schritt in dieser Hinsicht unternommen. Das Unternehmen integriert das innovative KI-Modell Genie 3 von Google DeepMind, um ein neuartiges Simulationssystem zu schaffen, das als „Waymo World Model“ bezeichnet wird. Dieses System ist darauf ausgelegt, autonome Fahrzeuge auf Situationen vorzubereiten, die weit über die Grenzen des alltäglichen Straßenverkehrs hinausgehen.
Autonome Fahrsysteme sammeln Milliarden von virtuellen Fahrkilometern, um ihre Algorithmen zu trainieren und zu validieren, bevor sie im öffentlichen Straßenverkehr eingesetzt werden. Traditionelle Simulationsmodelle stützen sich dabei oft auf reale Fahrdaten, die von der Fahrzeugflotte des jeweiligen Unternehmens gesammelt wurden. Dieser Ansatz birgt jedoch eine inhärente Einschränkung: Seltene, potenziell gefährliche oder außergewöhnliche Ereignisse sind in solchen Datensätzen naturgemäß unterrepräsentiert. Hier setzt das Waymo World Model an, indem es diese Lücke durch die Generierung von Szenarien schließt, die in der Realität kaum oder gar nicht erfasst werden könnten.
Das Herzstück des Waymo World Models bildet Genie 3, ein fortschrittliches allgemeines Weltmodell von Google DeepMind. Genie 3 zeichnet sich durch sein umfassendes Weltwissen aus, das es durch das Vortraining auf einem extrem großen und vielfältigen Satz von Videos erworben hat. Diese breite Wissensbasis ermöglicht es Waymo, Situationen zu simulieren, die von der eigenen Flotte noch nie direkt beobachtet wurden. Dazu gehören beispielsweise:
Die Fähigkeit von Genie 3, dynamische und interaktive 3D-Umgebungen in Echtzeit zu generieren, ist dabei entscheidend. Es kann detaillierte Welten aus einem einfachen Textprompt oder einem Bild erstellen und diese Umgebung dynamisch verändern.
Ein wesentliches Merkmal des Waymo World Models ist die Fähigkeit, sowohl 2D-Kameradaten als auch 3D-Lidar-Ausgaben zu generieren. Während Kameras visuelle Details liefern, sind Lidar-Sensoren unerlässlich für präzise Tiefeninformationen, die als komplementäres Signal dienen. Diese multimodale Datengenerierung stellt sicher, dass die autonomen Fahrzeuge die simulierten Szenarien so wahrnehmen, wie sie es auch in der realen Welt mit ihren eigenen Sensoren tun würden. Waymo und DeepMind haben hierfür einen spezialisierten Nachschulungsprozess entwickelt, um das 2D-Videowissen von Genie 3 in die für Waymos proprietäre Hardware maßgeschneiderten 3D-Lidar-Ausgaben zu übersetzen.
Das Waymo World Model bietet Ingenieuren eine hohe Kontrolle über die Simulationen durch drei Hauptmechanismen:
Dieser Mechanismus ermöglicht das Testen von kontrafaktischen Szenarien. Ingenieure können beispielsweise untersuchen, wie das autonome Fahrzeug in einer bestimmten Situation anders hätte handeln können. Im Gegensatz zu rekonstruktiven Methoden, die bei Abweichungen von der ursprünglichen Route visuell zusammenbrechen können, behauptet Waymo, dass das generative Modell Realismus und Konsistenz beibehält.
Hier können Straßenlayouts, Ampelbedingungen und das Verhalten anderer Verkehrsteilnehmer angepasst werden. Dies erlaubt die Erstellung maßgeschneiderter Szenarien durch die selektive Platzierung von Objekten oder die Anwendung benutzerdefinierter Mutationen an Straßenlayouts.
Als flexibelstes Werkzeug ermöglicht die sprachbasierte Steuerung die Anpassung von Tageszeiten, Wetterbedingungen oder die Generierung vollständig synthetischer Szenen. Dies ist besonders nützlich, um Bedingungen mit schlechten Lichtverhältnissen oder starken Blendeffekten zu simulieren, die für die Sensoren eines Fahrzeugs schwierig sein können.
Ein weiterer Aspekt ist die Fähigkeit des Waymo World Models, gewöhnliche Dashcam- oder Mobiltelefonvideos in multimodale Simulationen umzuwandeln. Dies zeigt, wie der Waymo Driver eine Szene mit seinen Sensoren wahrnehmen würde und ermöglicht ein hohes Maß an Realismus, da die Simulationen auf tatsächlichem Filmmaterial basieren.
Für Szenarien, die eine längere Dauer erfordern, wie das Manövrieren in einer engen Gasse, hat Waymo eine effizientere Variante des Modells entwickelt. Diese ermöglicht eine „dramatische Reduzierung des Rechenaufwands“ bei gleichzeitiger Aufrechterhaltung hoher Qualität für groß angelegte Simulationen.
Das Ziel dieser fortschrittlichen Simulationskapazitäten ist es, die Sicherheit und Zuverlässigkeit autonomer Fahrsysteme signifikant zu erhöhen. Indem selbst die unwahrscheinlichsten „Edge Cases“ im Voraus simuliert und gemeistert werden, soll der Waymo Driver besser auf die Komplexität des realen Straßenverkehrs vorbereitet sein. Dies schafft einen strengeren Sicherheitsstandard und soll gewährleisten, dass die Technologie lange vor dem realen Auftreten solcher Herausforderungen bewältigt werden kann. Die Nutzung von Weltmodellen wie Genie 3 stellt somit einen wichtigen Schritt in Richtung einer sichereren und breiteren Akzeptanz autonomer Fahrzeuge dar.
Trotz der beeindruckenden Fortschritte weist Genie 3 auch Grenzen auf. Es kann beispielsweise keine realen Orte mit perfekter geografischer Genauigkeit simulieren und hat Schwierigkeiten mit der Darstellung von Text. Die Konsistenz der Simulationen ist auf einige Minuten beschränkt, wobei die Entwickler an einer Ausweitung auf mehrere Stunden arbeiten. Zudem ist die Interaktion mehrerer unabhängiger Agenten in einer gemeinsamen Umgebung noch eine Forschungsherausforderung.
Google DeepMind betont die Bedeutung eines verantwortungsvollen Umgangs mit dieser Technologie. Genie 3 wird zunächst nur einem kleinen Kreis von Akademikern und Entwicklern zugänglich gemacht, um Feedback zu sammeln und potenzielle Risiken zu evaluieren, bevor eine breitere Veröffentlichung erfolgt. Ziel ist es, die Technologie so zu entwickeln, dass sie die menschliche Kreativität fördert und gleichzeitig unbeabsichtigte Auswirkungen minimiert.
Die Integration von Google DeepMinds Genie 3 in Waymos Simulationsstrategie markiert einen entscheidenden Fortschritt für die autonome Fahrindustrie. Durch die Generierung von hyperrealistischen und extrem seltenen Szenarien können autonome Fahrzeuge auf eine Weise trainiert werden, die mit realen Testfahrten nicht zu erreichen wäre. Dies trägt maßgeblich dazu bei, die Sicherheit, Zuverlässigkeit und letztendlich die Akzeptanz autonomer Fahrsysteme zu verbessern und neue Maßstäbe in der Entwicklung intelligenter Mobilitätslösungen zu setzen.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen