OpenAI, das Unternehmen hinter dem bekannten Sprachmodell ChatGPT, hat ein neues Open-Source-Framework namens "Swarm" auf GitHub veröffentlicht. Das Unternehmen beschreibt es als experimentelles Werkzeug zur Erstellung, Orchestrierung und Bereitstellung von Multi-Agenten-Systemen.
Swarm zielt darauf ab, die Koordination und Ausführung von Agenten einfach, kontrollierbar und leicht testbar zu gestalten. Dies wird durch zwei Schlüsselkonzepte erreicht: Routinen und Übergaben (Handoffs).
Eine Routine besteht aus Anweisungen und Werkzeugen. Sie kann jederzeit entscheiden, eine Konversation an einen anderen Agenten zu übergeben. Laut OpenAI können diese grundlegenden Bausteine komplexe Dynamiken zwischen Werkzeugen und Agentennetzwerken ausdrücken.
Das Framework demonstriert auch OpenAIs Konzept der "Agentic AI" - einer Abstraktion, die ein Sprachmodell, spezifische Anweisungen (Systemprompts) und Werkzeuge umfasst. Diese Agenten können interagieren, Aufgaben an andere Agenten übergeben und verfügbare Werkzeuge nutzen.
OpenAI behauptet, dass Swarm es Entwicklern ermöglicht, skalierbare Lösungen für reale Probleme ohne eine steile Lernkurve zu testen. Das Framework läuft größtenteils auf der Client-Seite und speichert keinen Status zwischen den Aufrufen, ähnlich wie die Chat Completions API. Das Unternehmen betont, dass Swarm derzeit ein experimentelles Beispielframework ist, um Schnittstellen für Multi-Agenten-Systeme zu erforschen. Es ist nicht für den Produktionseinsatz gedacht und erhält keinen offiziellen Support.
Das Hauptziel von Swarm ist es, Handoffs und Routinen zu präsentieren, die in einem OpenAI Cookbook beschrieben sind. Handoffs ermöglichen es einem Agenten, die Steuerung der Konversation an einen anderen Agenten zu übertragen, ähnlich wie bei einer Telefonweiterleitung.
Routinen sind natürlichsprachliche Abfolgen von Schritten, die mit den Werkzeugen definiert sind, die zu ihrer Ausführung erforderlich sind. Sie können als Zustandsautomaten betrachtet werden, mit denen Sprachmodelle robust umgehen können.
OpenAI argumentiert, dass dieser Ansatz für die Verwaltung vieler unabhängiger Funktionen und Anweisungen geeignet ist, die sich nur schwer in einem einzigen Prompt kodieren lassen.
Swarm bietet eine leichtgewichtige, skalierbare und anpassbare Alternative zur Assistants API. Während Assistants vollständig gehostete Threads und integriertes Speicher- und Anrufmanagement bietet, richtet sich Swarm an Entwickler, die vollständige Transparenz und detaillierte Kontrolle über Kontext, Schritte und Werkzeugaufrufe wünschen.
OpenAI hat mehrere Beispiele für Swarm-Anwendungsfälle auf GitHub veröffentlicht. Dazu gehören ein einfacher Triage-Agent, ein Wetter-Agent und komplexere Setups wie ein Airline-Kundenservice und ein persönlicher Einkaufsassistent.
Das Swarm Cookbook erklärt die Kernkonzepte und die Verwendung des Frameworks. Dies umfasst das Ausführen von Swarm, das Definieren von Agenten und Funktionen sowie den Umgang mit Streaming und Auswertungen.
OpenAI sieht Multi-Agenten-Systeme als einen Weg zu verbesserten KI-Fähigkeiten im Bereich des logischen Denkens, im Einklang mit der dritten Stufe seiner fünfstufigen Skala zur Messung des Fortschritts in Richtung Allgemeine Künstliche Intelligenz (AGI). Das Unternehmen baut ein Forschungsteam für Multi-Agenten auf, das an zwei Arten von KI-Agenten arbeitet: einer für die Automatisierung komplexer Aufgaben auf Geräten und ein anderer für webbasierte Aufgaben wie Datenerfassung und Flugbuchung.
Obwohl sich Swarm noch in einem frühen Stadium befindet, bietet es einen interessanten Einblick in die Zukunft der KI-Entwicklung. Die Möglichkeit, komplexe Aufgaben auf mehrere spezialisierte Agenten zu verteilen und diese miteinander interagieren zu lassen, eröffnet neue Möglichkeiten für die Lösung komplexer Probleme. Es bleibt abzuwarten, wie sich Swarm und andere Multi-Agenten-Frameworks in Zukunft entwickeln und welchen Einfluss sie auf die Entwicklung und Anwendung von Künstlicher Intelligenz haben werden.
Bibliography: https://www.marktechpost.com/2024/10/11/openai-releases-swarm-an-experimental-ai-framework-for-building-orchestrating-and-deploying-multi-agent-systems/ https://analyticsindiamag.com/ai-news-updates/openai-introduces-swarm-a-framework-for-building-multi-agent-systems/ https://www.youtube.com/watch?v=82FSnDcw72k https://www.reddit.com/r/singularity/comments/1g1ov6j/openai_introduces_swarm_an_experimental_framework/ https://medium.com/@yunwei356/are-multi-agent-systems-the-future-of-ai-a-look-at-openais-swarm-experiment-398c10146ab2 https://dev.to/yunwei37/are-multi-agent-systems-the-future-of-ai-a-look-at-openais-swarm-experiment-44n6 https://www.aibase.com/news/12335 https://github.com/openai/swarm https://twitter.com/Marktechpost/status/1844973726120673622 https://www.aibase.com/news/12330