KI für Ihr Unternehmen – Jetzt Demo buchen

Die Entwicklung adaptiver KI-Agenten zur Verbesserung der Nutzererfahrung durch Präferenzlernen

Kategorien:
No items found.
Freigegeben:
January 11, 2026

KI sauber im Unternehmen integrieren: Der 5-Schritte-Plan

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg

1
🎯

Strategie & Zieldefinition

Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.

✓ Messbare KPIs definiert

2
🛡️

Daten & DSGVO-Compliance

Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.

✓ 100% DSGVO-konform

3
⚙️

Technologie- & Tool-Auswahl

Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.

✓ Beste Lösung für Ihren Fall

4
🚀

Pilotprojekt & Integration

Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.

✓ Ergebnisse in 4-6 Wochen

5
👥

Skalierung & Team-Schulung

Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.

✓ Ihr Team wird KI-fit

Inhaltsverzeichnis

    mindverse studio – Ihre Plattform für digitale Effizienz

    Optimieren Sie Prozesse, automatisieren Sie Workflows und fördern Sie Zusammenarbeit – alles an einem Ort.
    Mehr über Mindverse Studio erfahren

    Der schnelle Überblick

    • KI-Agenten können Präferenzen von Nutzern über mehrere Interaktionssitzungen hinweg erlernen und anwenden.
    • Ein neuer Benchmark namens MultiSessionCollab ermöglicht die Bewertung dieser Lernfähigkeit in verschiedenen Problembereichen.
    • Durch den Einsatz von Gedächtnissystemen und Reinforcement Learning (RL) können Agenten ihre Kollaborationsqualität signifikant verbessern.
    • Menschliche Nutzerstudien bestätigen die positiven Auswirkungen dieser Gedächtnisfunktionen auf die Benutzererfahrung und Personalisierung.
    • Herausforderungen bestehen weiterhin in der domänenübergreifenden Generalisierung und der vollständigen Erfassung impliziter Präferenzen.

    Als Senior Specialist Journalist und Analyst für Mindverse beleuchten wir heute eine entscheidende Entwicklung im Bereich der Künstlichen Intelligenz: die Fähigkeit von KI-Agenten, Nutzerpräferenzen durch Interaktion zu erlernen und für eine langfristige Zusammenarbeit zu nutzen. Diese Thematik ist von zentraler Bedeutung für die Weiterentwicklung kollaborativer KI-Systeme, insbesondere für B2B-Anwendungen, bei denen eine präzise Anpassung an individuelle Kundenbedürfnisse unerlässlich ist.

    Die Evolution kollaborativer KI-Agenten

    Die Interaktion zwischen Mensch und KI entwickelt sich stetig weiter. Während traditionelle Ansätze oft auf vordefinierten Regeln oder expliziten Anweisungen basieren, rückt die Fähigkeit von KI-Agenten, aus der Interaktion mit Nutzern zu lernen, zunehmend in den Fokus. Dies ist besonders relevant für Szenarien, die eine langfristige Zusammenarbeit erfordern und in denen sich Präferenzen im Laufe der Zeit entwickeln oder ändern können. Menschliche Interaktionen sind dynamisch; Kommunikationsstile passen sich an, gemeinsames Verständnis wird aufgebaut und individuelle Vorlieben verfeinert. Eine ähnliche Adaptionsfähigkeit wird von fortschrittlichen KI-Agenten erwartet, um eine effiziente und zufriedenstellende Zusammenarbeit zu gewährleisten.

    Die Anpassung an Nutzerpräferenzen ist essenziell, um langfristige Beziehungen zu fördern und die Qualität der Kollaboration kontinuierlich zu verbessern. Nutzer haben oft spezifische Vorlieben, wie Informationen präsentiert oder Entscheidungen getroffen werden sollen. Beispielsweise bevorzugt ein Anwender möglicherweise prägnante Zusammenfassungen, während ein anderer detaillierte Schritt-für-Schritt-Anleitungen wünscht. Anstatt dass der Nutzer diese Präferenzen immer wieder explizit angeben muss, sollten KI-Agenten in der Lage sein, diese kontinuierlich zu erlernen und zu berücksichtigen.

    MultiSessionCollab: Ein neuer Benchmark für langfristige Kollaboration

    Um die Fähigkeiten von KI-Agenten in diesem Bereich systematisch zu bewerten, wurde der Benchmark MultiSessionCollab entwickelt. Dieser Rahmen ermöglicht es, zu untersuchen, wie gut konversationelle Agenten Nutzerpräferenzen erlernen und diese nutzen können, um Interaktionen über mehrere Sitzungen hinweg zu verbessern. Der Benchmark simuliert dabei Benutzer, die in Problem-Lösungs-Aufgaben zusammenarbeiten, wobei jeder Benutzer eine eigene Persona und Interaktionspräferenzen besitzt, die auf Erkenntnissen aus Psychologie, Kognitionswissenschaft und Mensch-Computer-Interaktion basieren.

    Im Gegensatz zu früheren Evaluierungsmethoden, die sich oft auf die reine Informationswiedergabe konzentrierten, bewertet MultiSessionCollab den Einfluss von Gedächtnissystemen auf die langfristige Interaktionsqualität. Dies beinhaltet die Fähigkeit des Agenten, relevante Informationen für zukünftige Interaktionen zu erkennen und diese effektiv einzusetzen.

    Gedächtnissysteme und Reinforcement Learning zur Präferenzadaption

    Ein zentrales Element zur Verbesserung der langfristigen Zusammenarbeit sind Gedächtnissysteme für KI-Agenten. Diese Systeme ermöglichen es Agenten, Nutzerpräferenzen über mehrere Sitzungen hinweg zu speichern und zu verfeinern. Zu Beginn einer Interaktion haben Agenten oft keine Kenntnis über die Präferenzen eines Nutzers. Im Laufe der Zeit, während der Interaktion, äußert der Nutzer jedoch seine Vorlieben, oft auch durch Korrekturen oder spezifische Anweisungen. Ein Gedächtnissystem erlaubt es dem Agenten, diese Signale zu erfassen und in zukünftigen Sitzungen proaktiv anzuwenden.

    Die Architektur solcher Gedächtnissysteme umfasst typischerweise zwei Komponenten:

    1. Sitzungsbezogene Reflexion: Nach jeder Interaktionssitzung analysiert der Agent die Konversation, um Präferenzinformationen zu identifizieren, die für zukünftige Interaktionen nützlich sein könnten. Dies können spezifische Präferenzen, deren Anwendungskontexte oder erfolgreiche Ansätze sein. Das bestehende Gedächtnis des Agenten wird dann mit diesen neuen Informationen aktualisiert.

    2. Persistentes Gedächtnis: Das Gedächtnis wird zu Beginn jeder neuen Sitzung als Teil der Systemanweisung des Agenten bereitgestellt. Dies ermöglicht es dem Agenten, sein Verhalten an die erlernten Präferenzen anzupassen, ohne dass der Nutzer diese wiederholt angeben muss. Bei jeder Interaktionsrunde werden relevante Teile des Gedächtnisses dynamisch abgerufen, um das Verhalten des Agenten stärker an den Präferenzen auszurichten.

    Darüber hinaus kann Reinforcement Learning (RL) genutzt werden, um Agenten darin zu trainieren, ihr Gedächtnis effektiver zu aktualisieren. Durch die Ableitung von Lernsignalen aus dem Benutzerverhalten im MultiSessionCollab-Umfeld können Agenten belohnt werden, wenn sie umfassendere Reflexionen generieren und ihr Gedächtnis sinnvoll anpassen. Dies führt zu einer präziseren Erfassung von Nutzerpräferenzen und einer besseren Anpassung in nachfolgenden Interaktionen.

    Empirische Evidenz und menschliche Studien

    Umfassende Experimente mit verschiedenen Sprachmodellen und Problem-Lösungs-Aufgaben – darunter mathematische Probleme, logische Aufgaben und Fragen aus verschiedenen Wissensgebieten – zeigen, dass Gedächtnissysteme die Kollaborationsqualität signifikant verbessern. Diese Verbesserungen äußern sich in höheren Erfolgsquoten bei der Aufgabenbearbeitung, effizienteren Interaktionen und einem reduzierten Aufwand für den Nutzer. Die Analyse der Leistung über mehrere Sitzungen hinweg offenbart eine kontinuierliche Verbesserung, wobei die größten Fortschritte in den frühen Sitzungen erzielt und sich dann allmählich stabilisieren.

    Interessanterweise erreichen Agenten, die Präferenzen durch Interaktion erlernen, eine vergleichbare Leistung wie Agenten, denen die Nutzerpräferenzen von Anfang an explizit bekannt sind. Dies deutet darauf hin, dass das Gedächtnis des Agenten in der Lage ist, reichhaltigere und kontextspezifischere Informationen über Präferenzen zu erfassen, als dies durch eine direkte Vorgabe möglich wäre. Diese Erkenntnisse unterstreichen den Wert des Lernens durch Interaktion.

    Eine zusätzlich durchgeführte Studie mit menschlichen Nutzern bestätigt die Ergebnisse der Simulationen. 19 Teilnehmer arbeiteten in mehreren Sitzungen mit Agenten an Kodierungs-, Schreib- und Problemlösungsaufgaben. Die Ergebnisse zeigen, dass Agenten mit Gedächtnisfunktionen zu einer besseren Benutzererfahrung führten. Die Konversationen waren kürzer, die Präferenzadhärenz und -retention verbesserten sich, und die Zufriedenheit sowie das Vertrauen der Nutzer stiegen über die Sitzungen hinweg. Teilnehmer beschrieben diese Agenten als merklich personalisierter und proaktiver, selbst bei vagen Anfragen.

    Herausforderungen und zukünftige Richtungen

    Trotz der vielversprechenden Ergebnisse bleiben Herausforderungen bestehen. Die Personalisierung zeigte sich in gemischten Domänen als weniger effektiv, was darauf hindeutet, dass die Generalisierung von Präferenzen über verschiedene Anwendungsbereiche hinweg komplex ist. Zudem wurde festgestellt, dass die erlernten Präferenzen des Agenten zwar vorteilhaft waren, aber immer noch weniger wirksam als explizit innerhalb einer Sitzung wiederholte Präferenzen. Dies deutet darauf hin, dass das Gedächtnissystem noch keine vollständige Repräsentation der Nutzerpräferenzen aus den Interaktionen erfasst.

    Zukünftige Forschungsrichtungen umfassen die Entwicklung komplexerer Nutzersimulatoren, die kontextabhängige oder sich entwickelnde Präferenzen abbilden können. Auch die Erfassung impliziter Verhaltenshinweise als Präferenzsignale stellt ein wichtiges Feld dar. Die Verbesserung der Gedächtnisverwaltung und die Sicherstellung, dass Agenten nützliche Informationen bei der Aktualisierung ihrer Erinnerungen nicht vergessen, bleiben ebenfalls wesentliche Forschungsziele.

    Die Fähigkeit von KI-Agenten, Nutzerpräferenzen durch Interaktion zu erlernen und für eine langfristige Zusammenarbeit zu nutzen, ist ein entscheidender Schritt in Richtung adaptiver und benutzerzentrierter KI-Systeme. Diese Entwicklungen sind von großer Bedeutung für B2B-Anwendungen, da sie das Potenzial haben, die Effizienz und Zufriedenheit in der Zusammenarbeit zwischen Mensch und Maschine maßgeblich zu steigern.

    Bibliografie

    - Mehri, S., Kargupta, P., August, T., & Hakkani-Tür, D. (2026). Learning User Preferences Through Interaction for Long-Term Collaboration. arXiv preprint arXiv:2601.02702. - Zhang, L., Shen, D., Kou, Y., & Nie, T. (2024). Multi-perspective learning for enhanced user preferences for session-based recommendation. Knowledge-Based Systems, 298, 111997. - Ji, Z., & Chen, B. (2025). Pref-GUIDE: Continual Policy Learning from Real-Time Human Feedback via Preference-Based Learning. arXiv preprint arXiv:2508.07126. - Calandriello, D., Cassel, A., Hassidim, A., Keller, O., Lang, O., Matias, Y., Munos, R., Noga, H., Piot, B., Rosenberg, A., Shani, L., Szpektor, I., & Zipori, A. (2025). Multi-turn Reinforcement Learning from Preference Human Feedback. Advances in Neural Information Processing Systems, 38. - Wu, S., Galley, M., Peng, B., Cheng, H., Li, G., Dou, Y., Cai, W., Zou, J., Leskovec, J., & Gao, J. (2025). CollabLLM: From Passive Responders to Active Collaborators. arXiv preprint arXiv:2502.00640. - Godavarthy, N., Wang, Y., Ebesu, T., Suthee, U., Xie, M., & Fang, Y. (2022). Learning user preferences through online conversations via personalized memory transfer. Information Retrieval Journal, 25, 306-328. - Qian, C., Liu, Z., Prabhakar, A., Liu, Z., Zhang, J., Chen, H., Ji, H., Yao, W., Heinecke, S., Savarese, S., Xiong, C., & Wang, H. (2025). UserBench: An Interactive Gym Environment for User-Centric Agents. arXiv preprint arXiv:2507.22034. - Xu, M., Yang, X., Liang, W., Zhang, C., & Zhu, Y. (2025). Learning to Plan with Personalized Preferences. arXiv preprint arXiv:2502.00858.

    Artikel jetzt als Podcast anhören

    Kunden die uns vertrauen:
    Arise Health logoArise Health logoThe Paak logoThe Paak logoOE logo2020INC logoEphicient logo
    und viele weitere mehr!

    Bereit für den nächsten Schritt?

    Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
    Herzlichen Dank! Deine Nachricht ist eingegangen!
    Oops! Du hast wohl was vergessen, versuche es nochmal.

    🚀 Neugierig auf Mindverse Studio?

    Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

    🚀 Demo jetzt buchen