Orchestrierte Intelligenz: Wie Anthropic die KI neu erfindet

KI-Journal Redaktion 4 Min. Lesezeit 7216. Juni 2025

Das Zeitalter der einzelnen KI-Modelle neigt sich dem Ende zu. Der OpenAI-Konkurrent Anthropic aus San Francisco hat eine neue Architektur für künstliche Intelligenz vorgestellt, die auf der Zusammenarbeit mehrerer spezialisierter Agenten basiert. Die detaillierte Blaupause, die das Unternehmen in...

Vom Monolog zum Ensemble

Das neue „Research“-Feature von Claude nutzt ein Multi-Agenten-System, bei dem ein Hauptagent den Forschungsprozess basierend auf Nutzeranfragen plant und dann Tools einsetzt, um parallele Agenten zu erstellen, die gleichzeitig nach Informationen suchen. Diese Architektur bricht mit der linearen Arbeitsweise herkömmlicher KI-Systeme, bei denen eine Anfrage sequenziell abgearbeitet wird.

Das System funktioniert nach dem sogenannten Orchestrator-Worker-Muster: Ein leitender Agent analysiert komplexe Nutzeranfragen und zerlegt sie in mehrere Teilaufgaben. Für jede dieser Aufgaben erzeugt er spezialisierte Unter-Agenten, die parallel und unabhängig voneinander arbeiten. Diese Sub-Agenten nutzen Werkzeuge wie die Websuche, filtern Ergebnisse und fassen die wichtigsten Erkenntnisse für den Haupt-Agenten zusammen.

Die Parallelisierung führt zu dramatischen Leistungssteigerungen. In internen Evaluationen übertraf ein Multi-Agenten-System mit Claude Opus 4 als Hauptagent und Claude Sonnet 4 als Sub-Agenten ein einzelnes Claude Opus 4-System um 90,2 Prozent. Besonders bei Aufgaben, die mehrere unabhängige Recherchewege erfordern, zeigt sich die Überlegenheit des neuen Ansatzes.

Der Preis der Parallelität

Der Leistungssprung hat jedoch seinen Preis. Multi-Agenten-Systeme verbrauchen etwa 15-mal mehr Tokens als normale Chat-Interaktionen, was die Betriebskosten erheblich in die Höhe treibt. Anthropic räumt offen ein, dass solche Systeme nur bei Aufgaben wirtschaftlich tragfähig sind, deren Wert den massiv erhöhten Aufwand rechtfertigt.

Die Analyse des Unternehmens zeigt, dass der Tokenverbrauch allein 80 Prozent der Leistungsvariation erklärt. Multi-Agenten-Architekturen skalieren den Tokenverbrauch effektiv für Aufgaben, die die Grenzen einzelner Agenten überschreiten. Dies bestätigt die Grundthese: Mehr Rechenleistung führt zu besseren Ergebnissen, aber nur bei entsprechend wertvollen Aufgaben.

Grenzen der Parallelisierung

Nicht alle Probleme eignen sich für den Multi-Agenten-Ansatz. Aufgaben, bei denen alle Agenten denselben Kontext teilen müssen oder viele Abhängigkeiten zwischen Agenten bestehen, sind derzeit nicht gut für Multi-Agenten-Systeme geeignet. Insbesondere beim Programmieren, wo Arbeitsschritte häufig voneinander abhängen, zeigt der parallele Ansatz seine Schwächen.

Die Herausforderungen beginnen bereits bei der Koordination. Frühe Versionen des Systems produzierten teils chaotische Ergebnisse: Agenten erzeugten 50 Sub-Agenten für einfache Anfragen, suchten endlos nach nicht existierenden Quellen oder störten sich gegenseitig durch übermäßige Updates.

Prompt-Engineering als Erfolgsfaktor

Die Lösung lag im raffinierten Prompt-Engineering – der Kunst, KI-Systeme durch präzise Anweisungen zu steuern. Der Hauptagent musste lernen, wie ein guter Manager zu delegieren: mit klaren Zielen, exakten Aufgabenbeschreibungen und definierten Grenzen für die Sub-Agenten. Ohne detaillierte Aufgabenbeschreibungen duplizierten Agenten Arbeit, ließen Lücken oder fanden notwendige Informationen nicht.

Besonders kritisch erwies sich das Design der Werkzeuge. Schlechte Tool-Beschreibungen konnten Agenten auf völlig falsche Fährten locken. Anthropic entwickelte sogar einen eigenen KI-Agenten, der Tool-Beschreibungen testete und optimierte. Dieser Prozess zur Verbesserung der Tool-Ergonomie führte zu einer 40-prozentigen Verringerung der Aufgabenbearbeitungszeit für zukünftige Agenten, die die neue Beschreibung verwenden.

Bewertung ohne Blaupause

Die Evaluierung von Multi-Agenten-Systemen stellt eine besondere Herausforderung dar. Anders als bei traditioneller Software, die bei gleicher Eingabe denselben Weg zum Ziel nimmt, können Agenten verschiedene gültige Pfade wählen. Ein Agent durchsucht drei Quellen, ein anderer zehn – beide können zum korrekten Ergebnis kommen.

Anthropic setzt auf „LLM-as-a-Judge“-Bewertungen, bei denen eine KI die Resultate anhand fester Kriterien benotet: Faktentreue, Vollständigkeit, Quellenqualität und Tool-Effizienz. Dennoch bleibt die manuelle Kontrolle durch Menschen unverzichtbar. Menschliche Tester entdeckten etwa, dass frühe Agenten systematisch SEO-optimierte Content-Farmen gegenüber autoritativen, aber schlechter gerankten Quellen wie akademischen PDFs bevorzugten.

Produktionsreife durch neue Technik

Der Übergang vom Prototyp zum produktiven System erforderte neue technische Lösungen. Agenten sind zustandsbehaftet und Fehler verstärken sich. Ein kleiner Systemfehler kann einen Agenten komplett aus der Bahn werfen, weshalb robuste Wiederaufnahme-Mechanismen implementiert wurden.

Für Updates ohne Unterbrechung laufender Prozesse setzt Anthropic auf „Rainbow Deployments“, bei denen alte und neue Systemversionen parallel existieren und der Traffic schrittweise von der alten zur neuen Version verschoben wird.

Ausblick: Die Zukunft der KI-Koordination

Für die wirtschaftliche Tragfähigkeit benötigen Multi-Agenten-Systeme Aufgaben, bei denen der Wert der Aufgabe hoch genug ist, um die erhöhte Leistung zu bezahlen, wie Constellation Research betont. Dies macht deutlich, dass nicht jede Anwendung vom Multi-Agenten-Ansatz profitiert.

Dennoch zeichnet sich ab, dass die Zukunft der KI weniger in größeren Einzelmodellen als in der intelligenten Orchestrierung mehrerer Agenten liegt. Nutzer haben berichtet, dass Claude ihnen half, Geschäftsmöglichkeiten zu finden, die sie nicht in Betracht gezogen hatten, komplexe Gesundheitsoptionen zu navigieren und bis zu mehrere Tage Arbeit zu sparen.

Die Veröffentlichung von Anthropic ist mehr als eine Produktankündigung – sie ist ein Leitfaden für eine neue Ära der KI-Entwicklung. Während einzelne Modelle an ihre Grenzen stoßen, eröffnet die koordinierte Zusammenarbeit spezialisierter Agenten neue Möglichkeiten für die Lösung komplexer Probleme. Der Ansatz zeigt, dass Fortschritt in der künstlichen Intelligenz zunehmend eine Frage der intelligenten Orchestrierung wird – nicht nur der schieren Größe der Modelle.

Quellen: Anthropic Engineering Blog, The Decoder, Constellation Research

Newsletter abonnieren

Erhalte die neuesten KI-News direkt in dein Postfach.

#KI-Agenten#Anthropic#Künstliche Intelligenz#KI-Architektur#Maschinelles Lernen

Orchestrierte Intelligenz: Wie Anthropic die KI neu erfindet

Vom Monolog zum Ensemble

Der Preis der Parallelität

Grenzen der Parallelisierung

Prompt-Engineering als Erfolgsfaktor

Bewertung ohne Blaupause

Produktionsreife durch neue Technik

Ausblick: Die Zukunft der KI-Koordination

Newsletter abonnieren

Wie hat dir dieser Artikel gefallen?

Teilen

Ähnliche Artikel

Die Fankultur auf AO3 befindet sich im offenen Konflikt mit generativer KI

Google setzt bei neuen Smart Speakern auf Gemini-Integration trotz technischer Hürden

Tech-Riesen verfehlen ihre Nachhaltigkeitsziele durch massiven KI-Energiehunger