Wähle deine bevorzugte Option:
für Einzelnutzer
für Teams und Unternehmen

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Die Interaktion zwischen Menschen und künstlicher Intelligenz entwickelt sich stetig weiter. Ein aktueller Schwerpunkt in der Forschung liegt auf der Entwicklung von Systemen, die in der Lage sind, komplexe, mehrstufige Dialoge zu führen und dabei externe Werkzeuge effizient zu nutzen. Diese Entwicklung ist von besonderer Relevanz für Unternehmen, die KI-gestützte Lösungen in ihren Geschäftsprozessen implementieren möchten, um die Effizienz und Qualität der Kundeninteraktion zu steigern.
Traditionelle Ansätze zur Dialoggenerierung konzentrierten sich oft auf klar definierte, aufgabenorientierte Szenarien. Diese Modelle sind in der Regel darauf ausgelegt, spezifische Ziele mit einem Minimum an Interaktion zu erreichen. In der Praxis zeigte sich jedoch, dass solche Systeme oft nicht die Komplexität und den iterativen Charakter menschlicher Kommunikation widerspiegeln. Ein rein aufgabenorientiertes Design führte zu Dialogen, die zwar effizient das Ziel erreichten, aber nicht die reichhaltigen, mehrstufigen Gespräche generierten, die in realen Szenarien üblich sind.
Ein Paradigmenwechsel hin zu benutzerorientierten Simulationsansätzen ist festzustellen. Dabei wird die Aufgabengenerierung von einem dedizierten Benutzersimulator entkoppelt, der menschliche Verhaltensregeln nachahmt. Dazu gehören inkrementelle Anfragen und schrittweises Feedback. Dieser Ansatz ermöglicht die Generierung authentischerer und längerer mehrstufiger Dialoge, die der iterativen Natur realer Problemlösungen gerecht werden.
Um die Limitationen bestehender Datensätze zu überwinden, wurde der "ToolDial"-Datensatz entwickelt. Dieser Datensatz umfasst 11.111 mehrstufige Dialoge, die auf APIs von RapidAPI basieren und durchschnittlich 8,95 Gesprächsrunden pro Dialog aufweisen. Der Fokus von "ToolDial" liegt auf der Simulation komplexer Interaktionen, bei denen mehrere APIs sequenziell aufgerufen werden müssen. Dies ist beispielsweise der Fall, wenn ein Benutzer eine für den Aufruf einer Haupt-API notwendige Information nicht bereitstellen kann und das System proaktiv eine andere API finden und ausführen muss, um diese Information zu erhalten.
Die Dialoge in "ToolDial" integrieren 16 verschiedene Benutzer- und Systemaktionen. Beispiele hierfür sind "Anfordern", "Klarstellen" oder "Informationen nicht bereitstellen", um die Dynamik realer Interaktionen abzubilden. Die Generierung dieses Datensatzes erfolgte in mehreren Schritten:
Die Qualität des "ToolDial"-Datensatzes wurde sowohl durch automatische Metriken als auch durch menschliche Evaluatoren bewertet. Die Dialoge erhielten hohe Bewertungen in Bezug auf Natürlichkeit, Kohärenz und Effizienz, was die Anwendbarkeit für das Training und die Bewertung von Tool-Augmented Language Models (TALMs) unterstreicht.
Die Forschung untersuchte die Fähigkeiten verschiedener Sprachmodelle – sowohl proprietäre wie GPT-3.5-turbo, GPT-4o-mini, GPT-4-turbo und GPT-4o, als auch Open-Source-Modelle wie CodeLlama-7b-Instruct-hf, Qwen2.5-Coder-7B-Instruct und Llama3-8B-Instruct – in drei zentralen Aufgabenbereichen:
Die Gesamtleistung des feingetunten TD-Llama-Modells, bei dem sowohl Dialogzustand als auch Aktion korrekt generiert werden mussten, lag bei 77,1 % für einzelne Äußerungen und bei 28,3 % für vollständige Dialoge. Dies verdeutlicht, dass weiterhin erhebliches Verbesserungspotenzial besteht, um die Robustheit und Zuverlässigkeit dieser Systeme in komplexen, realen Szenarien zu gewährleisten.
Die Entwicklung benutzerorientierter mehrstufiger Dialoggenerierung mit Tool-Einsatz stellt einen wichtigen Schritt in Richtung anspruchsvollerer KI-Agenten dar. Die Fähigkeit, dynamisch auf Benutzerbedürfnisse zu reagieren, externe Tools intelligent zu integrieren und dabei kohärente und glaubwürdige Dialoge zu führen, ist für viele Branchen von entscheidender Bedeutung.
Die vorliegende Forschung hebt die Notwendigkeit robuster Datensätze hervor, die die Komplexität menschlicher Interaktionen und die Vielseitigkeit von Tool-Einsatz widerspiegeln. Gleichzeitig zeigt sie auf, dass selbst moderne Sprachmodelle noch vor Herausforderungen stehen, insbesondere bei der präzisen Dialogzustandsverfolgung und der intelligenten Aktionsauswahl in längeren und komplexeren Konversationen. Die kontinuierliche Verbesserung dieser Fähigkeiten wird maßgeblich dazu beitragen, das volle Potenzial von KI-gestützten Dialogsystemen in der Geschäftswelt auszuschöpfen.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen