Chatbots, die menschenähnliche Konversationen führen, haben die Welt bereits in ihren Bann gezogen. Doch die nächste Evolutionsstufe der künstlichen Intelligenz (KI) könnte noch deutlich tiefgreifender sein: Stellen Sie sich vor, Ihre KI übernimmt die Kontrolle über Ihren Computer und erledigt Aufgaben selbstständig, während Sie sich anderen Dingen widmen.
Das Unternehmen Anthropic, ein aufstrebender Konkurrent von OpenAI, hat genau dieses Szenario im Blick. Anthropic hat sein KI-Modell Claude darauf trainiert, eine Reihe von Aufgaben auf Computern auszuführen. Dazu gehören alltägliche Aktionen wie das Durchsuchen des Internets, das Öffnen von Anwendungen und die Texteingabe über Maus und Tastatur, aber auch komplexere Aufgaben wie die Programmierung.
In einer Demonstration, die Jared Kaplan, Chief Science Officer bei Anthropic, dem Magazin WIRED vorführte, plante Claude selbstständig einen Ausflug zur Golden Gate Bridge, um den Sonnenaufgang zu beobachten. Claude öffnete den Webbrowser, recherchierte auf Google den idealen Aussichtspunkt und die optimale Uhrzeit und erstellte anschließend mithilfe einer Kalender-App einen Termin, den es mit einem Freund teilte.
Eine weitere Demonstration zeigte Claude bei der Erstellung einer einfachen Website. Das Modell gab Textbefehle in seine eigene Weboberfläche ein, um den notwendigen Code zu generieren, und nutzte anschließend Visual Studio Code, um die Website zu schreiben. Schließlich startete Claude einen Webserver, um die Website zu testen.
Diese Beispiele zeigen das Potenzial von KI-Agenten, wie Anthropic sie nennt. Das Unternehmen hofft, dass diese Agenten bald in der Lage sein werden, routinemäßige Büroarbeiten zu automatisieren und so die Produktivität der Menschen zu steigern. Mike Krieger, Chief Product Officer bei Anthropic, sieht in der Automatisierung die Chance für Menschen, sich Tätigkeiten zu widmen, die ihnen mehr Spaß machen, wie zum Beispiel dem Gitarrespielen.
Anthropic stellt die neuen Funktionen über eine Programmierschnittstelle (API) für sein leistungsstärkstes multimodalen Sprachmodell, Claude 3.5 Sonnet, zur Verfügung. Gleichzeitig kündigte das Unternehmen eine verbesserte Version seines kleineren Modells, Claude 3.5 Haiku, an.
Obwohl die Demonstrationen der KI-Agenten beeindruckend sind, ist die zuverlässige und fehlerfreie Funktion in der Praxis eine Herausforderung. Aktuelle KI-Modelle können zwar Fragen beantworten und menschenähnliche Gespräche führen, doch die Steuerung von Computern erfordert ein tieferes Verständnis von Software und Interaktionen.
Anthropic ist davon überzeugt, dass Claude in dieser Hinsicht bereits andere KI-Agenten übertrifft. Das Unternehmen beruft sich dabei auf Benchmarks wie SWE-bench, der die Softwareentwicklungsfähigkeiten von KI-Agenten misst, und OSWorld, der die Fähigkeit zur Bedienung eines Computerbetriebssystems bewertet. Laut Anthropic schneidet Claude in diesen Tests besser ab als die Konkurrenz, einschließlich OpenAI's GPT-4.
Mehrere Unternehmen testen die neuen Funktionen von Claude bereits. Canva nutzt die KI zur Automatisierung von Design- und Bearbeitungsaufgaben, während Replit sie für Programmieraufgaben einsetzt. Zu den weiteren frühen Anwendern gehören The Browser Company, Asana und Notion.
Trotz der Fortschritte gibt es noch Herausforderungen. Ofir Press, ein Forscher an der Princeton University, der an der Entwicklung von SWE-bench beteiligt war, weist darauf hin, dass KI-Agenten oft Schwierigkeiten haben, weit im Voraus zu planen und Fehler zu korrigieren. Die zuverlässige Planung komplexer Aufgaben, wie beispielsweise einer Reise mit mehreren Zwischenstopps, stellt die KI noch vor Probleme.
Kaplan räumt diese Herausforderungen ein, betont aber, dass Claude bereits in der Lage ist, einige Fehler selbstständig zu beheben. So konnte das Modell beispielsweise einen Fehler beim Starten eines Webservers korrigieren und erkannte, dass es Pop-ups aktivieren musste, um eine Webseite korrekt darzustellen.
Der Wettlauf um die Entwicklung von KI-Agenten hat längst begonnen. Microsoft, das Milliarden in OpenAI investiert hat, testet Agenten für Windows-Computer. Amazon, ein weiterer großer Investor in Anthropic, untersucht, wie KI-Agenten Kunden Produkte empfehlen und schließlich sogar für sie einkaufen könnten.
Es ist also nur eine Frage der Zeit, bis KI-Agenten Einzug in unseren Alltag halten. Ob sie jedoch das halten, was sie versprechen, bleibt abzuwarten. Sonya Huang, Partnerin bei der Risikokapitalgesellschaft Sequoia, die sich auf KI-Unternehmen konzentriert, warnt vor überzogenen Erwartungen. Derzeit funktioniere die Technologie am besten in eng begrenzten Bereichen, wie beispielsweise der Softwareentwicklung.
Ein großes Problem bei KI-Agenten sind die potenziellen Folgen von Fehlern. Ein Rechtschreibfehler in einem Chatbot-Gespräch ist ärgerlich, ein Fehler bei der Finanztransaktion hingegen kann schwerwiegende Folgen haben. Anthropic hat daher Beschränkungen für Claude eingeführt, beispielsweise die Möglichkeit, mit Kreditkarten einzukaufen.
Sollten die Herausforderungen gemeistert werden, könnten KI-Agenten unsere Sicht auf Computer grundlegend verändern. Press ist davon überzeugt, dass wir uns am Beginn einer neuen Ära befinden, in der KI zu einem unverzichtbaren Bestandteil unseres digitalen Lebens wird.
Bibliographie:
- Wired: https://www.wired.com/story/anthropic-ai-agent/
- CNBC: https://www.cnbc.com/2024/10/22/anthropic-announces-ai-agents-for-complex-tasks-racing-openai.html
- Reuters: https://www.reuters.com/technology/artificial-intelligence/anthropic-releases-ai-automate-mouse-clicks-coders-2024-10-22/
- The Verge: https://www.theverge.com/2024/10/10/24266333/ai-agents-assistants-openai-google-deepmind-bots
- TechRadar: https://www.techradar.com/computing/artificial-intelligence/anthropic-wants-its-ai-assistant-claude-to-be-your-favorite-coworker
- The Verge: https://www.theverge.com/2024/5/30/24167231/anthropic-claude-ai-assistant-automate-tasks
- LinkedIn: https://www.linkedin.com/posts/ehschwartz_anthropic-wants-its-ai-assistant-claude-to-activity-7212203971459907585-BT60
- PCMag: https://www.pcmag.com/news/anthropic-wants-its-claude-ai-to-be-your-new-project-manager
- Techzine: https://www.techzine.eu/news/applications/123638/writers-sue-anthropic-for-stealing-their-work-for-ai-training/
- Fortune: https://fortune.com/2024/09/05/anthropic-enterprise-claude-joins-rival-oepnai-in-targeting-business/