KI für Ihr Unternehmen – Jetzt Demo buchen

Robot Utility Models: Richtlinien für den Einsatz in unbekannten Umgebungen ohne Voranpassung

Kategorien:
No items found.
Freigegeben:
September 10, 2024

Artikel jetzt als Podcast anhören

Inhaltsverzeichnis

    Robot Utility Models: Allgemeine Richtlinien für Zero-Shot-Einsätze in neuen Umgebungen

    Einleitung

    In den letzten Jahren haben Roboter, insbesondere solche, die mit großen Datenmengen trainiert wurden, eine Vielzahl von Fähigkeiten zur Manipulation und Navigation in der realen Welt gezeigt. Verschiedene unabhängige Bemühungen haben gezeigt, dass Roboter, wenn sie ausreichend Trainingsdaten in einer Umgebung erhalten, ihre Richtlinien auf gezeigte Variationen in dieser Umgebung verallgemeinern können. Jedoch steht die Notwendigkeit, Roboter in jeder neuen Umgebung nachzujustieren, im krassen Gegensatz zu Modellen in der Sprach- oder Bildverarbeitung, die Zero-Shot für offene Weltprobleme eingesetzt werden können. In dieser Arbeit präsentieren wir Robot Utility Models (RUMs), ein Rahmenwerk für das Training und die Bereitstellung von Zero-Shot-Roboter-Richtlinien, die direkt auf neue Umgebungen verallgemeinern können, ohne Nachjustierung.

    Robot Utility Models

    Wir verfolgen einen ganzheitlichen Ansatz zur Erstellung von Robot Utility Models. Im Kern folgt unser System dem Imitationslernrahmen. Um das Imitationslernen effektiv zu skalieren, entwickeln wir neue Werkzeuge und Techniken zur Verbesserung der Datenerfassung, des Modelltrainings, der Inferenz und der Bereitstellung.

    Datenerfassungstool

    Eine der Hauptanforderungen unseres Systems ist es, diverse und dennoch genaue Demonstrationsdaten kostengünstig zu skalieren. Zu diesem Zweck setzen wir auf die evolutionäre Entwicklung von Handheld-Tools zur Datenerfassung.

    Modelltraining

    Wir trainieren Richtlinien auf diesen diversen Datensätzen mit modernsten multimodalen Verhaltenslernalgorithmen. Dies zeigt, wie sie große Mengen an Demonstrationsdaten aufnehmen und skalieren können. Schließlich setzen wir die Richtlinie in verschiedenen Umgebungen ein, mit Selbstkritik durch multimodale Sprachmodelle (mLLMs) und Wiederholungen, um die Richtlinie robust auf kostengünstiger, universeller Hardware auszuführen.

    Bereitstellung

    Eine Auswahl unserer trainierten Modelle ist auf dem Hello Robot Stretch ohne größere Modifikationen verfügbar. Neben der Standardbereitstellung auf Stretch ermöglichen wir auch die Bereitstellung auf anderen Robotern, Kameras und Beleuchtungsbedingungen, was die Generalisierbarkeit unseres Ansatzes zeigt.

    Erkenntnisse und Ergebnisse

    Die Erstellung und Bereitstellung von RUMs hat zu mehreren interessanten Erkenntnissen geführt: - Die Quantität und Qualität der Daten ist entscheidend für das Training eines Utility-Modells, während die Wahl der Modellarchitektur weniger kritisch ist. - Die Vielfalt der gesammelten Daten ist entscheidend für die Generalisierung des Modells auf neue Umgebungen und wichtiger als die rohe Datenmenge. - Das Modell kann in einzelnen Umgebungen leistungsfähiger gemacht werden, indem eine Selbstkritik der Modellleistung mit einem unabhängigen Modell durchgeführt und bei Bedarf wiederholt wird. Um RUMs zu validieren, führen wir insgesamt 2.950 Roboter-Rollouts in realen Umgebungen durch, darunter in Wohnungen in New York City (NY), Jersey City (NJ) und Pittsburgh (PA). Diese Experimente ergeben folgende Erkenntnisse: - Es ist möglich, allgemeine Robot Utility Models mit einer moderaten Menge an Daten, in der Größenordnung von 1.000 Demonstrationen, zu erstellen. Diese RUMs erreichen eine durchschnittliche Erfolgsrate von 90% bei Zero-Shot-Bereitstellungen in 25 neuen Umgebungen. - Der Erfolg von RUMs beruht hauptsächlich auf zwei Schlüsseltechniken. Erstens, die Verwendung von multimodalen Richtlinien bietet eine Zero-Shot-Erfolgsrate von 74,4%. Zweitens, das mLLM-basierte Selbstkritik- und Wiederholungssystem verbessert die Erfolgsrate um weitere 15,6%. - Während das Gesamtframework für RUMs unkompliziert ist, liegt der Teufel im Detail, wo wir unerwartete Quellen für Gewinne finden, z.B. Datenvielfalt vs. Datenmenge.

    Schlussfolgerung

    RUMs zeigen, dass es möglich ist, Roboter-Richtlinien zu erstellen, die in neuen Umgebungen ohne weitere Daten oder Training erfolgreich sind. Dies stellt einen bedeutenden Fortschritt dar und ebnet den Weg für die Entwicklung robuster und vielseitiger Roboteranwendungen in der realen Welt. Unsere Code-, Daten-, Modell- und Hardwaredesigns sowie unsere Experiment- und Bereitstellungsvideos sind open-source und auf unserer Website verfügbar: robotutilitymodels.com.

    Bibliographie

    https://arxiv.org/html/2409.05865v1 https://robotutilitymodels.com/ https://deeplearn.org/arxiv/525324/robot-utility-models:-general-policies-for-zero-shot-deployment-in-new-environments https://twitter.com/gm8xx8/status/1833339598690226615 https://arxiv-sanity-lite.com/?rank=pid&pid=2409.05865 https://synthical.com/article/Robot-Utility-Models%3A-General-Policies-for-Zero-Shot-Deployment-in-New-Environments-a7887356-6e28-479e-b8b6-5dcd7b64afd8? https://github.com/haritheja-e/robot-utility-models https://paperswithcode.com/author/julian-mehu https://arxiv.org/list/cs.RO/recent
    Mindverse vs ChatGPT Plus Widget

    Warum Mindverse Studio?

    Entdecken Sie die Vorteile gegenüber ChatGPT Plus

    Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

    🚀 Mindverse Studio

    Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

    ChatGPT Plus

    ❌ Kein strukturierter Dokumentenvergleich

    ❌ Keine Bearbeitung im Dokumentkontext

    ❌ Keine Integration von Unternehmenswissen

    VS

    Mindverse Studio

    ✅ Gezielter Dokumentenvergleich mit Custom-Prompts

    ✅ Kontextbewusste Textbearbeitung im Editor

    ✅ Wissensbasierte Analyse & Zusammenfassungen

    📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

    Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

    ChatGPT Plus

    ❌ Nur ein Modellanbieter (OpenAI)

    ❌ Keine Modellauswahl pro Use Case

    ❌ Keine zentrale Modellsteuerung für Teams

    VS

    Mindverse Studio

    ✅ Zugriff auf über 50 verschiedene KI-Modelle

    ✅ Modellauswahl pro Prompt oder Assistent

    ✅ Zentrale Steuerung auf Organisationsebene

    🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

    OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
    Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
    Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
    Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

    ChatGPT Plus

    ❌ Keine echte Teamkollaboration

    ❌ Keine Rechte- oder Rollenverteilung

    ❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

    VS

    Mindverse Studio

    ✅ Teamübergreifende Bearbeitung in Echtzeit

    ✅ Granulare Rechte- und Freigabeverwaltung

    ✅ Zentrale Steuerung & Transparenz auf Organisationsebene

    👥 Kollaborative KI für Ihr gesamtes Unternehmen

    Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

    Bereit für den nächsten Schritt?

    Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

    🎯 Kostenlose Demo buchen

    Wie können wir Ihnen heute helfen?

    Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
    Herzlichen Dank! Deine Nachricht ist eingegangen!
    Oops! Du hast wohl was vergessen, versuche es nochmal.

    🚀 Neugierig auf Mindverse Studio?

    Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

    🚀 Demo jetzt buchen