Zusammenfassung

KI-Agenten werden am besten als zielgerichtete Systeme verstanden, die mehr tun, als nur Text zu generieren: Sie entscheiden, wann Werkzeuge verwendet werden, rufen Wissen ab, koordinieren Teilaufgaben und ergreifen manchmal Aktionen in externer Software oder Infrastruktur. Die OpenAI-eigene Entwicklerdokumentation stellt Agenten als Systeme dar, die „Aufgaben“ über einfache Ziele und komplexe Arbeitsabläufe hinweg ausführen und dabei von Modellen, Toolkits und Überwachungsprimitiven unterstützt werden.

Von 2022 bis 2026 machten drei Schichten „agentische“ Systeme für Mainstream-Teams nutzbar. Erstens verbinden Aufforderungs- und Trainingsmethoden explizit Argumentation mit Aktion und Werkzeugaufruf (z. B. ReAct und Toolformer) und verbessern so die Zuverlässigkeit, wenn ein Agent Dinge nachschlagen oder in interaktiven Umgebungen arbeiten muss. Zweitens haben Plattformen die „Agentenschleife“ (Tools, Speicher, Orchestrierung, Beobachtbarkeit) produziert, sodass Teams Agenten mit Governance und Metriken anstelle von Ad-hoc-Skripten ausliefern können. Drittens verlagerte sich die Sicherheitsdiskussion von allgemeiner „LLM-Sicherheit“ hin zu agentenspezifischen Bedrohungsmodellen, einschließlich Lieferkettenrisiken aus Plug-in- und Skill-Ökosystemen und neuen „agentischen“ Kategorien in Sicherheitsrichtlinien.

Die Preisgestaltung im Maklermarkt ist nicht eindimensional. Die meisten Käufer sind mit einem hybriden Kostenstapel konfrontiert: (1) SaaS-Pläne pro Arbeitsplatz (üblich für Verbraucher- und Arbeitsplatzassistenten), (2) nutzungsbasierte Inferenz (Tokens, Tool-Aufrufe, Nachrichten, Ablaufverfolgungen) und (3) Unternehmens-Governance und -Support (SSO, Prüfprotokolle, Datenresidenz, Entschädigungen), die häufig gebündelt oder individuell angeboten werden. Repräsentative Listenpreise verdeutlichen die Spanne: ChatGPT Go/Plus/Pro für 8 $/20 $/200 $ pro Monat, Claude Pro für 20 $ pro Monat (und Max ab 100 $), Microsoft Copilot Studio für 200 $ pro 25.000 Credits pro Monat oder 0,01 $ pro Nachricht bei nutzungsbasierter Abrechnung, LangSmith für 39 US-Dollar pro Sitzplatz und Monat zuzüglich Spurenüberschreitungen und Perplexity Enterprise Max für 271 $ pro Sitzplatz und Monat bei jährlicher Abrechnung.

OpenClaw verdient besondere Aufmerksamkeit, da es sich an der Schnittstelle zwischen persönlicher Automatisierung und Open-Source-Erweiterbarkeit befindet: Es vermarktet sich selbst als „die KI, die tatsächlich Dinge erledigt“ durch Chat-Apps, bietet persistenten Speicher und Tool-Ausführung und unterstützt einen öffentlichen Marktplatz für Fertigkeiten (ClawHub). Seine Offenheit und sein tiefer Zugriff sind auch die größte Risikofläche: Mehrere Sicherheitsberichte und Nachrichtenuntersuchungen aus dem Jahr 2026 fanden bösartige Fähigkeiten und Missbrauch der Lieferkette im Ökosystem, was zu Reaktionen wie der Integration von VirusTotal-Scans und optionalem Sandboxing und Richtlinienkontrollen in den Dokumenten führte.

Was ist ein KI-Agent und wie hat sich das Konzept entwickelt?

Ein KI-Agent ist im modernen Produkt- und Engineering-Einsatz ein LLM-zentriertes System, das (a) ein Ziel interpretieren, (b) über Zwischenschritte entscheiden, (c) selektiv Tools oder Integrationen verwenden und (d) Ausgaben oder Aktionen mit einer nachvollziehbaren Ausführungsaufzeichnung erzeugen kann. Der Agentenleitfaden von OpenAI betont ausdrücklich Toolkits (AgentKit), Modelle mit „Agentenstärken“ und „Dashboard-Funktionen“ zur Überwachung und Optimierung. Das Claude Agent SDK von Anthropic beschreibt in ähnlicher Weise Produktionsagenten, die autonom Dateien lesen, Befehle ausführen, das Web durchsuchen, Code bearbeiten und Kontext verwalten können.

Ein praktischer Punkt für Entscheidungsträger ist, dass „Agent“ keine binäre Bezeichnung ist. Moderne Systeme umfassen ein Spektrum von chatzentrierten Assistenten bis hin zu hochautonomen Arbeitsabläufen mit delegierten Subagenten und Computernutzungsfunktionen, und der Grad der Autonomie verändert direkt das Risiko, die Beobachtbarkeitsanforderungen und die Kostenvorhersehbarkeit.

Meilensteine ​​der Agentenentwicklung (ausgewählt)

  1. 1966

    ELIZA macht die regelbasierte Gesprächsinteraktion populär.

  2. 1995

    A.L.I.C.E. skaliert Mustervergleichs-Chat über AIML-Communitys.

  3. 2011

    Siri etabliert Sprachassistenten auf Smartphones.

  4. 2022

    ChatGPT beschleunigt die Einführung von LLM-Chat.

  5. 2022

    ReAct formalisiert die Verschachtelung von Argumenten und Aktionen für den Werkzeuggebrauch.

  6. 2023

    Toolformer zeigt selbstüberwachtes Lernen der API-/Tool-Nutzung.

  7. 2023

    AutoGPT Autonome Schleifen im -Stil inspirieren Agenten-Frameworks und Benchmarks.

  8. 2023

    AutoGen verbessert die Konversationsorchestrierung mit mehreren Agenten.

  9. 2025

    OSWorld bewertet offene Computernutzungsaufgaben für multimodale Agenten.

  10. 2025

    OpenAI führt die Responses API und ein Agents SDK für von Entwicklern erstellte Agents ein.

  11. 2025-2026

    Die Richtlinien zur Agentensicherheit sind ausgereift (OWASP-Agentenrisiken).

Die Zeitleiste wird durch primäre und häufig zitierte Referenzen verankert: Weizenbaums ELIZA-Artikel (1966), dokumentierte Geschichten von ALICE (1995) und Siris Mainstream-Einführung (2011), OpenAIs ChatGPT-Start (30. November 2022) und Forschungsmeilensteine ​​ReAct (2022) und Toolformer (2023). Die Zeit des „AutoGPT-Stils“ spiegelt sich im anschließenden Benchmarking und der akademischen Analyse von Auto-GPT-Agenten (2023) sowie in Multiagenten-Frameworks wie AutoGen (2023) wider, die die konversationsbasierte Orchestrierung zwischen spezialisierten Agenten formalisieren. OSWorld (öffentliche Benchmark-Site und Konferenzreferenzen in den Jahren 2024–2025) erfasst den Wandel hin zur Bewertung von Agenten in realen Web- und Desktop-Umgebungen statt rein textueller Aufgaben. Die öffentliche Einführung von APIs und SDKs zur Agentenerstellung durch OpenAI (Responses API + Agents SDK-Abdeckung und Dokumentation) markiert die Kommerzialisierung dieser Ideen auf Entwicklerplattformen.

Definition und Taxonomie von KI-Agenten

Eine nützliche Taxonomie für Beschaffungs- und Architekturprüfungen unterteilt Agenten nach Autonomieniveau, Aufgabenumfang und Koordinationsmuster. Dies steht im Einklang mit der Positionierung der Plattformen (Konsumenten-Chat, Arbeitsplatz-Copiloten, Entwickler-SDKs oder Multi-Agent-Orchestrierung).

Chatbots

Chatbots sind konversationsorientierte Systeme, die sich auf interaktive Fragen und Antworten, Entwürfe und einfache Unterstützung konzentrieren. Sie umfassen möglicherweise Toolfunktionen (Websuche, Dateianalyse), belassen aber im Allgemeinen den Menschen auf dem Fahrersitz und verfügen über eine klare Turn-by-Turn-Kontrolle. In den Planbeschreibungen von ChatGPT werden beispielsweise Nachrichten/Uploads, umfassende Recherche, „Agentenmodus“ und Speicher als abgestufte Funktionen in einem Chat-Produkt hervorgehoben. Claudes Verbraucherpläne fördern in ähnlicher Weise den geräteübergreifenden Chat, die Websuche, die Codeausführung, Dateien, „Speicher über Konversationen hinweg“ und optionale Erweiterungen/Konnektoren.

Aufgabenspezifische Agenten

Aufgabenspezifische Agenten sind engere Systeme, die für einen begrenzten Bereich optimiert sind: Kundensupport-Triage, Rechnungsverarbeitung, Wissensdatenbankabfrage, interner IT-Helpdesk oder Code-Refactoring. Sie verwenden häufig Abruf- und Toolaufrufe, schränken jedoch die Aktionen ein, um das Risiko zu reduzieren und Kostenschwankungen zu kontrollieren. Die Agentenführung von OpenAI stellt AgentKit als Toolkit zum Erstellen von Arbeitsabläufen mit Modellen, Tools, Wissen und Logik in einer einzigen Benutzeroberfläche dar, was ein gängiges Muster für aufgabenbezogene Agenten ist. Microsoft positioniert Copilot Studio-Agenten als eine Möglichkeit, Geschäftsagenten mit Konnektoren, Abläufen und Governance-Richtlinien zu erstellen, einschließlich der Möglichkeit, Wissensquellen, Konnektoren als Tools und Veröffentlichungskanäle über Datenrichtlinien zu blockieren.

Autonome Agenten

Autonome Agenten versuchen, Ziele in Teilaufgaben zu zerlegen und mehrstufige Pläne mit begrenztem oder asynchronem menschlichem Input auszuführen. Sie können Hintergrundjobs ausführen, Ereignisse auslösen und über lange Zeiträume hinweg agieren, was bedeutet, dass sie eine stärkere Beobachtbarkeit, Schutzmaßnahmen und Kostenkontrolle benötigen. Die „Subagenten“-Funktion von OpenClaw unterstützt explizit die Ausführung von Agenten im Hintergrund für parallele Recherchen oder lange Aufgaben und weist auf die Kostenauswirkungen hin, da jeder Subagent seinen eigenen Kontext und seine eigene Token-Nutzung hat. Die breitere Forschungsrichtung (ReAct, Toolformer) untermauert, warum Autonomie praktikabler wurde: Die Verschränkung von Argumentation mit Werkzeugaktionen reduziert Halluzinationen und ermöglicht fundierte Schritte.

Multiagentensysteme

Multiagentensysteme koordinieren mehrere spezialisierte Agenten, die zusammenarbeiten, Ergebnisse delegieren, kritisieren oder überprüfen. Dies verbessert häufig die Robustheit (Selbstprüfung) und den Durchsatz (Parallelität), allerdings auf Kosten einer höheren Orchestrierungskomplexität und eines nichtlinearen Token-Verbrauchs. Das Agents SDK von OpenAI positioniert sich als Framework für die Erstellung von Multi-Agent-Workflows und umfasst integriertes Tracing und ein Traces-Dashboard für Debugging und Überwachung. Die Forschung und Dokumentation von AutoGen beschreibt ein Multi-Agenten-Konversations-Framework, bei dem Agenten LLMs, Tools und menschliche Eingaben über einen automatisierten Agenten-Chat integrieren. In den Dokumenten von OpenClaw werden „Multi-Agent-Routing“ und Sicherheitsprofile pro Agent (Sandbox-Konfiguration und Tool-Einschränkungen) separat beschrieben, was die betriebliche Notwendigkeit widerspiegelt, Rollen in einem Multi-Agent-Setup zu isolieren.

Kernfunktionen und die Referenzarchitektur sollten Entscheidungsträger bewerten

Anbieterübergreifend laufen „Agentenplattformen“ auf einer gemeinsamen Referenzarchitektur zusammen. Bei den Unterscheidungsmerkmalen geht es weniger darum, ob eine Funktion vorhanden ist, sondern eher um Standardeinstellungen, Governance, Ergonomie und darum, was in der Produktion beobachtbar oder überprüfbar ist.

Fähigkeiten und Orchestrierung

Zu den Fähigkeiten gehören Argumentation, Planung und Aktionsauswahl. In der Praxis betten moderne Agenten eine „Agentenschleife“ ein, die zwischen der Entscheidung, was zu tun ist, und der Ausführung von Tools wechselt, was sowohl dem Forschungsrahmen (ReActs Verschränkung von Denken und Handeln) als auch den SDKs der Anbieter entspricht, die diese Schleife für Entwickler bündeln. Zu den Orchestrierungsprimitiven gehören typischerweise (1) Werkzeugauswahl und -ausführung, (2) Übergaben oder Delegierung an spezialisierte Agenten und (3) Fallback-Verhalten wie Wiederholungsversuche, Modell-Fallback-Ketten oder Human-in-the-Loop-Genehmigungen. Die Agent-API-Modelldokumentation von Perplexity unterstützt explizit Modell-Fallback-Ketten für hohe Verfügbarkeit, und OpenClaw bietet Mechanismen zum Spawnen von Subagenten und zum Konfigurieren nicht vertrauenswürdiger Tooloberflächen nach Tiefe und Richtlinie.

Integrationen und Tool-Nutzung

Der Einsatz von Werkzeugen ist das entscheidende Merkmal, das einen gesprächigen Assistenten von einem operativen Agenten unterscheidet. In den Dokumenten von Anthropic wird die Werkzeugnutzung beschrieben, bei der Claude entscheidet, ob Werkzeuge helfen können, strukturierte Werkzeugnutzungsanfragen sendet und vom Kunden erwartet, dass er Werkzeuge ausführt und Ergebnisse zurückgibt. Die Preisgestaltung der OpenAI-Plattform macht deutlich, dass die Tool-Nutzung häufig über separate Messgeräte verfügt (z. B. Web-Suchtool-Aufrufe, Dateisuch-Tool-Aufrufe und Sitzungen zur Ausführung von Container-Code), was für die Budgetierung und die Einheitsökonomie von Bedeutung ist. Das Copilot Studio-Ökosystem von Microsoft basiert stark auf Konnektoren: Die offizielle Dokumentation beschreibt Power Platform-Konnektoren als „Wrapper“ um APIs, die es Copilot Studio (und Power Automate/Apps/Logic Apps) ermöglichen, mit anderen Diensten zu kommunizieren, und beschreibt gleichzeitig Datenrichtlinien zum Blockieren von Konnektoren oder Wissensquellen, um eine Exfiltration zu verhindern.

Ein bemerkenswerter Trend im Zeitraum 2025–2026 ist die „Computernutzung“ (Agenten, die auf die Benutzeroberfläche klicken, tippen und navigieren, wenn keine API vorhanden ist). Mit Copilot Studio von Microsoft wurde die „Computernutzung“ für die Interaktion mit Websites und Desktop-Apps eingeführt, die so positioniert ist, dass sie die Automatisierung auch ohne API ermöglicht. Diese Kategorie erklärt auch, warum Benchmarks im OSWorld-Stil wichtig wurden: Sie messen die Erfolgsraten bei realen Computeraufgaben und nicht bei kuratierten Nur-Text-Tests.

Erinnerung

„Speicher“ umfasst mindestens zwei unterschiedliche Ebenen: den kurzfristigen Gesprächsstatus (was in der aktuellen Sitzung enthalten ist) und die langfristige Persistenz über Sitzungen hinweg (Benutzerpräferenzen, Projektkontext, Wissensdatenbanken). In der Dokumentation von LangGraph wird explizit zwischen Kurzzeitgedächtnis als Thread-bezogenem Zustand, der über Prüfpunkte beibehalten wird, und Langzeitgedächtnis als sitzungsübergreifender Speicher unterschieden, der über Threads hinweg abgerufen werden kann. Die Speichertools von OpenClaw zeigen eine konkrete Implementierung: semantische Suche über Markdown-Speicherdateien, kontrollierte Pfade, lokale vs. Remote-Einbettungsanbieter und optionale Batch-Einbettung für große Indizierungsaufgaben.

Beobachtbarkeit und Bewertung

Agenten scheitern auf eine Weise, die bei Standard-Apps nicht der Fall ist: unsichtbare Schleifen, Missbrauch von Tools, steigende Kosten, Teilerledigung von Aufgaben und subtile Regressionen. Daher behandeln viele Plattformen die Nachverfolgung und Auswertung mittlerweile als erstklassig. Das OpenAI Agents SDK umfasst integrierte Ablaufverfolgung und ein Ablaufverfolgungs-Dashboard, das Ereignisse wie LLM-Generierungen, Tool-Aufrufe, Übergaben und Leitplanken aufzeichnet, wobei die Ablaufverfolgung standardmäßig aktiviert ist. LangSmith setzt diesen Bedarf mit verfolgungsbasierter Abrechnung und Funktionen wie Überwachung, Alarmierung, Bewertungsworkflows und einem „Agent Builder“ direkt um. OpenClaw stellt betriebliche „Kosten- und Nutzungs“-Oberflächen im Chat über Slash-Befehle zur Verfügung, einschließlich Snapshots der Sitzungskosten und Fußzeilen zur Nutzung pro Antwort, was bei verbraucherähnlichen Agentenerlebnissen ungewöhnlich und für die Kostenkontrolle wertvoll ist.

Sicherheit, Schutz und Governance

Bei der Agentensicherheit geht es nicht nur um Modellergebnisse, sondern auch um Werkzeugprivilegien, Identität und Lieferkettenrisiken. In der eigenen Dokumentation von OpenClaw werden Fertigkeiten Dritter als nicht vertrauenswürdiger Code behandelt, Sandboxing empfohlen und hervorgehoben, dass Fertigkeiten für einen Agenten Geheimnisse in den Hostprozess einschleusen können, was Bedenken hinsichtlich der Betriebssicherheit aufkommen lässt. Dies ist nicht theoretisch: In Berichten von Anfang 2026 wurde Malware in OpenClaw-Skills gefunden, die über den ClawHub-Marktplatz verbreitet wurde, und dokumentiert, wie die Erweiterbarkeit von Agenten zu einer Angriffsfläche werden kann.

Die Governance-Geschichte von Microsoft ist eher unternehmensspezifisch: In der offiziellen Dokumentation werden die Sicherheits- und Governance-Kontrollen von Copilot Studio beschrieben, z. B. geografische Datenresidenz, DLP-Richtlinien und Zertifizierungen. und es bietet konkrete Verwaltungsmechanismen zum Blockieren von Konnektoren, Wissensquellen oder Kanälen. Die Sicherheitsrichtlinien der Branche haben auch damit begonnen, „agentische“ Risikokategorien zu formalisieren: Das GenAI-Sicherheitsprojekt von OWASP hat eine Top 10 für Agentenanwendungen eingeführt, die sich auf die einzigartigen Sicherheitsrisiken autonomer, werkzeugverwendender Systeme konzentriert.

Zielgruppen und Kaufkriterien

Dieselbe Plattform kann „teuer“ oder „billig“ aussehen, je nachdem, welche Zielgruppe kauft und welcher Kostenposten vorherrscht (Plätze, Token, Werkzeugzähler, Verwaltungsaufwand oder Vorfälle). Quellen aus den eigenen Planseiten der Anbieter veranschaulichen diese Segmentierung: Verbraucherebenen legen Wert auf Nutzung und Komfort, während Team- und Unternehmensebenen Administratorkontrollen, Konnektoren und Compliance hervorheben.

Entwickler priorisieren typischerweise: API-Ergonomie, Modellflexibilität, Beobachtbarkeitsprimitive, reproduzierbare Auswertungen und die Fähigkeit, lokal oder in ihrer eigenen Infrastruktur ausgeführt zu werden. Die Agents SDK- und AgentKit-Materialien von OpenAI betonen Entwickler-Workflows, Ablaufverfolgung und Bereitstellungsmuster; LangGraph/LangSmith legen Wert auf kontrollierbare Arbeitsabläufe, Speicher, Haltbarkeit und Debugging.

Unternehmen priorisieren: Identität, Zugriffskontrolle, Überprüfbarkeit, Datenresidenz, DLP- und Compliance-Status sowie Anbieterunterstützung. Copilot Studio und Microsoft 365 Copilot von Microsoft legen Wert auf unternehmensweite Kontrollen und eine getaktete Abrechnung im Zusammenhang mit Azure-Abonnements, und offizielle Leitlinien beschreiben die Richtliniendurchsetzung und Compliance-Grundlagen. Perplexity Enterprise bewirbt Sicherheits- und Compliance-Ansprüche (SOC 2 Typ II, HIPAA, DSGVO, PCI DSS) direkt auf seinen Preisseiten, was einen ähnlichen Fokus auf Unternehmenskäufer widerspiegelt.

KMU wünschen sich oft eine „ausreichend gute Governance“, können aber die hohen Integrationskosten nicht verkraften. Sie bevorzugen Tools mit schneller Einrichtung, vorhersehbaren Preisen pro Arbeitsplatz und starken Integrationen. Beispiele hierfür sind ChatGPT Business (pro Arbeitsplatz mit Administratorkontrollen und internen Toolverbindungen), Claude Team (pro Arbeitsplatz mit SSO und Konnektoren) und schlüsselfertige Plattformen wie Replit die den Aufbau und die Bereitstellung mit Credits für die Agentenautomatisierung bündeln.

Verbraucher entscheiden sich im Allgemeinen aufgrund von Komfort, Möglichkeiten und Grenzen, nicht aufgrund der Architektur. Die offiziellen Preis- und Planseiten für ChatGPT und Claude zeigen eine klare Leiterbahn von kostenlosen zu höheren Nutzungsstufen, mit Preispunkten, die praktisch zu Marktankern geworden sind (8 bis 20 US-Dollar bis 100 bis 200 US-Dollar).

Forscher und fortgeschrittene Analysten tendieren zu Tools, die (a) eine umfassende Recherche mit Zitaten unterstützen, (b) Dateien und interne Wissensquellen integrieren können und (c) eine gewisse Anpassung ermöglichen. Perplexity positioniert sich explizit als besser für komplexe Fragen und „Berichtserstellung“, mit tiefergehender Beschaffung einschließlich proprietärer Datenpartner und bietet gleichzeitig eine Agent-API mit tokenbasierter, anbieterdirekter Preisgestaltung.

Preismodelle und Kostentreiber

Die Agentenpreise lassen sich am besten nach Abrechnungseinheiten (Platz, Token, Nachricht, Ablaufverfolgung, Aktion) und danach, was sich im Laufe der Skalierung erweitert (Benutzer, Integrationen, Toolaufrufe, langer Kontext, Aufbewahrung und Governance), analysieren. In den folgenden Abschnitten werden repräsentative Listenpreise von offiziellen Seiten verwendet. Unternehmensrabatte und Mindestverpflichtungen variieren erheblich je nach Anbieter und Kundengröße und sollten als instationäre Inputs behandelt werden.

Typische monatliche Listenpreise für Agentenstufen (USD, repräsentative Beispiele)

Frei 0 $
Eintrag 8 $
Profi 20 $
Team/KMU 30 $
Max 100 $
Ultra 200 $
Unternehmenshoch 271 $

Die Balken sind repräsentative Anker aus weit verbreiteten Plänen: Eintritt 8 $ und Pro 20 $ und Ultra 200 $ entsprechen den Listenpreisen von ChatGPT Go/Plus/Pro; Max. 100 $ entsprechen dem Startpreis von Claude Max; Team/SMB 30 $ entspricht den üblichen Team-Sitzpreisen wie dem monatlichen ChatGPT Business-Preis (30 $ pro Sitzplatz) und ähnlichen Stufen; und Enterprise-High 271 $ entspricht Perplexity Enterprise Max bei jährlicher Abrechnung.

Abonnementpreise

Typische Struktur: feste monatliche oder jährliche Gebühren pro Benutzer (manchmal mit Richtlinien und Drosselungen zur „angemessenen Nutzung“), oft mit Feature-Gating (tiefe Recherche, höhere Argumentation, Speicher) und optionale Add-on-Credits.

Repräsentative Preisspannen (Listenpreise):

Abrechnungseinheiten: Benutzermonat (Sitzplatz), häufig mit jährlichen Verpflichtungen für einen niedrigeren effektiven monatlichen Preis (Claude Pro-Jahresrabatt; angezeigte jährliche Perplexity-Abrechnung).

Hauptkostentreiber:

Nutzungsbasierte Preisgestaltung

Die nutzungsbasierte Preisgestaltung dominiert die Entwicklerplattformen und die dosierten Enterprise-Agent-Funktionen. Es ist in der Regel tokenbasiert (Ein- und Ausgänge) und verfügt über separate Messgeräte für Toolaufrufe, Speicherung und manchmal auch die Containerausführung.

Typische Preisspannen (zur Veranschaulichung, pro 1 Mio. Token):

Abrechnungseinheiten: Eingabe-Token, Ausgabe-Token und manchmal zwischengespeicherte Token zu ermäßigten Preisen (OpenAI listet die Preise für zwischengespeicherte Eingaben auf; Perplexity-Modelltabellen enthalten Cache-Lesepreise; OpenClaws Token-Kostenschätzung unterstützt Cache-Lese-/Schreibkategorien in der Konfiguration).

Hauptkostentreiber:

Abgestufte Plus-Nutzung (Hybrid)

Beim Hybridpreis handelt es sich um ein Basisabonnement mit enthaltenen Credits oder Zulagen und expliziten Überschreitungszählern. Dieses Modell ist weit verbreitet, da Agenten eine stoßweise Nutzung und „unbekannte Unbekannte“ haben und Anbieter sowohl einen vorhersehbaren ARR als auch variable Einnahmen wünschen, die an den tatsächlichen Verbrauch angepasst sind.

Repräsentative Strukturen:

Abrechnungseinheiten: Credits, Traces, Bereitstellungsläufe, Nutzungsguthaben, Nachrichten und andere plattformspezifische Zähler.

Hauptkostentreiber:

Unternehmenslizenzierung und ausgehandelte Verträge

Unternehmenslizenzen bündeln in der Regel Governance-Funktionen (SSO, SCIM, Administratorrollen, Audit-Protokolle, DLP, Datenresidenz, Entschädigungen) und Support-SLAs. Viele Anbieter veröffentlichen keine Listenpreise für ihre höchsten Stufen, einige veröffentlichen jedoch High-End-Stufen pro Sitzplatz (z. B. Perplexity Enterprise Max).

Repräsentative Reichweitensignale von offiziellen Preisseiten:

Abrechnungseinheiten: häufig pro Sitzplatz mit jährlichen Verpflichtungen, manchmal plus Nutzungszähler für Agentenaktionen, Tool-Anrufe oder Add-on-Gutschriften.

Hauptkostentreiber:

Open Source plus Supportkosten

Bei Open-Source-Agent-Stacks ist die Softwarelizenz normalerweise kostenlos, die tatsächlichen Kosten entstehen jedoch durch Infrastruktur, APIs, Sicherheitsarbeit und interne Engineering-Zeit.

Repräsentative Betriebskostensignale aus den eigenen Dokumenten von OpenClaw und den angrenzenden Bereitstellungsleitfäden:

Abrechnungseinheiten: Ihre Cloud-Rechnung (VM-Stunden, Speicher, Bandbreite), API-Tokens und Tool-Aufrufe (von den von Ihnen angeschlossenen Anbietern) zuzüglich Arbeitsaufwand (Technik, Sicherheitsüberprüfung, Reaktion auf Vorfälle).

Hauptkostentreiber:

Plattformvergleich für technische Entscheider

Diese Tabelle fasst die angeforderten Plattformen zusammen und konzentriert sich dabei auf die kommerzielle Form und die Betriebseigenschaften und nicht nur auf die Modellqualität.

Plattform Preismodell Kostenloses Kontingent Primärer Anwendungsfall Integrationen Anpassung Sicherheit/Compliance Bestens geeignet
OpenClaw Open-Source-Software + Bring-Your-Own-Hosting + Bring-Your-Own-Modell-/Tool-APIs; Kostentransparenz über /status- und /usage-Oberflächen Keine Lizenzgebühr; Die Betriebskosten hängen vom Hosting und den angeschlossenen APIs ab Persönliche Automatisierung über Chat-Apps und lokale Tools; fähigkeitsbasierte Erweiterbarkeit Fähigkeiten über ClawHub; Tools für Websuche, Speicher, Exec und mehr Hoch (Selbsthost, konfigurationsgesteuert, Multi-Agent, Sandbox pro Agent und Tool-Richtlinie) Es gibt strenge Kontrollen (Sandboxing, Tool-Richtlinie, Genehmigungen), aber das Risiko ist hoch, wenn sie falsch konfiguriert werden. Ökosystem hat Malware-Vorfälle erlebt Power-User und Builder, die sich selbst hosten können und maximale Automatisierungsfähigkeit mit transparenten Interna wünschen
OpenAI-Agentenplattform (ChatGPT, Kodex) Nutzungsbasierte API (Tokens) plus Werkzeugzähler; Die Entwicklungszeit für den Agent Builder ist bis zum „Ausführen“ kostenlos. Für den ChatKit-Speicher gelten Preise pro GB pro Tag, die über das kostenlose Kontingent hinausgehen Kostenloses Design/Iteration im Agent Builder; begrenztes kostenloses Speicherkontingent für ChatKit-Uploads Erstellen und Bereitstellen von Agenten-Workflows (Tools, Wissen, Bewertungen) Integrierte Tools (Websuche, Dateisuche, Container) mit expliziter Messung; Konnektoren über das AgentKit-Ökosystem Hoch für Entwickler (SDK plus Workflow-Tools); Multi-Agent-Orchestrierung unterstützt Das Tracing-Dashboard zeichnet Werkzeugaufrufe, Übergaben und Leitplanken auf; Unternehmenskontrollen, die als für AgentKit-Funktionen enthalten aufgeführt sind Teams bauen Produktionsagenten mit starker Beobachtbarkeit und einem großen Tool-Ökosystem auf
Claude Agentenplattform (Claude Agent SDK + Claude-Pläne) Abonnementstufen (Einzelperson, Team) plus API-Token-Preise für benutzerdefinierte Builds; Agent SDK ist eine Entwicklerbibliothek Es gibt einen kostenlosen Plan; höhere Nutzung in den Stufen Pro/Max/Team Codierungs- und Produktivitätsagenten (Dateien, Befehle, Web) mit gepackter Agentenschleife Tool-Nutzungs-API; Anschlüsse über MCP; In den Teamplänen werden Slack/Microsoft 365-Konnektoren erwähnt Hoch für Entwickler über SDK; Moderat für Nicht-Entwickler über App-Funktionen Zu den Team-/Unternehmensfunktionen gehören SSO/SCIM/Audit-Protokolle und „standardmäßig keine Schulung zu Inhalten“ für Teampläne Entwicklerteams erstellen Agentencodierung und Wissensworkflows, insbesondere wenn sie SDK-paketierte Autonomie wünschen
Copilot/Agenten (Microsoft Copilot + Copilot Studio) Pro-Benutzer-Lizenzierung für Copilot-Pläne plus gemessene Agentennutzung über Copilot Studio-Credits oder Azure-Zähler; 200 $ pro Paket mit 25.000 Credits; 0,01 $ pro abrechenbarem Nachrichtenzähler Copilot-Chat ist für berechtigte Microsoft 365-Benutzer enthalten, „Agenten“ benötigen jedoch Azure und werden gebührenpflichtig Enterprise-Arbeitsplatzagenten innerhalb von Microsoft 365, Teams und externen Kanälen über Copilot Studio Power Platform-Konnektoren und Agent-Flows; Offizielle Dokumente beschreiben Konnektoren und Datenrichtlinienkontrollen Mäßig bis hoch (Low-Code-Agentenerstellung plus benutzerdefinierte Konnektoren und Abläufe) Governance: DLP, Residenz, Zertifizierungen, Administratorkontrollen; Die Richtlinien zu Compliance und Richtlinien sind in Microsoft Learn umfassend Große Organisationen, die auf Microsoft 365 standardisiert sind und eine kontrollierte Agenten-Rollout- und Integrationsabdeckung anstreben
Ökosystem (LangGraph + LangSmith) Open-Source-LangGraph-Bibliothek (kostenlos) plus platzbasierte und nutzungsbasierte LangSmith-Ablaufverfolgung; 39 $/Sitzplatz/Monat plus Spurenüberschreitungen Der LangSmith-Entwicklerplan kostet 0 $ pro Arbeitsplatz inklusive Trace-Kontingent Erstellen Sie kontrollierbare, zustandsbehaftete Agenten-Workflows mit starker Beobachtbarkeit und Evaluierungstools Lässt sich über Code in viele Modelle und Tools integrieren; starke Gedächtnisprimitive Sehr hoch (Code-First-Graphen, Zustand, Speicher, Human-in-Loop) Compliance-Ansprüche umfassen SOC 2 Typ II, HIPAA, DSGVO; Zu den Unternehmensoptionen gehört Selbsthosting Entwicklungsteams, die maximale Kontrolle über die Orchestrierung mit erstklassiger Nachverfolgung/Auswertung wünschen
AutoGPT Open-Source/selbstgehostet (allgemeines Muster) mit API-Kosten für Drittanbietermodelle; Die „Plattform“-Positionierung variiert je nach Distribution Ja (Selbst gehostet kann kostenlos installiert werden) Experimentieren mit autonomen Zielzerlegungsschleifen Die Werkzeugbestückung variiert je nach Gabel. Zu den gängigen Mustern gehören Webzugriff, Dateispeicher und Plugins Hoch für Hacker; Ecken und Kanten für Produktionseinsätze Der Sicherheitsstatus hängt von der Bereitstellung ab. nicht grundsätzlich unternehmensgesteuert Forscher und Bauherren entwickeln Prototypen autonomer Schleifen, ohne sich auf eine SaaS-Plattform festzulegen
Perplexity Abonnements pro Sitzplatz (Pro- und Enterprise-Stufen) plus API-Token-Preise (Agent API, Sonar usw.) Ja (kostenloses Kontingent vorhanden; Pro und Enterprise sind kostenpflichtig) Recherche, Beschaffung und Berichtserstellung; Enterprise-Wissenssuche in Web- und Arbeits-Apps Der Enterprise-Plan beschreibt die Suche in Teamdateien und Arbeits-Apps. Die API unterstützt Modell-Fallback und mehrere Anbieter Mäßig (starke Benutzeroberfläche, einige Modellauswahl; umfassende Orchestrierung normalerweise über API) Die Preisseite für Unternehmen bewirbt SOC 2 Typ II, HIPAA, DSGVO, PCI DSS; Datenschutzrechtliche Ansprüche sind explizit Wissensarbeiter, die schnelle, zitierte Recherchen und Unternehmensdatenschutz benötigen
Ghost (Ghostwriter) und Replit-Agent Abonnementstufen mit enthaltenem Nutzungsguthaben und nutzungsbasierter Bezahlung; Kern 20 $/Monat jährlich; Teams 35 $/Sitzplatz/Monat jährlich Der Starterplan ist mit täglichen Agentenguthaben kostenlos App- und Website-Erstellung über einen autonomen Codierungsagenten in einer gehosteten IDE Integrationen finden größtenteils „innerhalb von Replit“ statt (erstellen, ausführen, bereitstellen). Credits für KI-Integrationen enthalten Hoch (Sie besitzen Code; Agent wird in der Entwicklungsumgebung ausgeführt) Der Enterprise-Plan bietet SSO/SAML und SCIM; RBAC für Teams Startups und Teams liefern Prototypen schnell in die Produktion, insbesondere für Full-Stack-Builds

OpenClaw Deep Dive: offizielle Funktionen, Preise, Zielbenutzer und Wettbewerbspositionierung

Was OpenClaw ist, basierend auf offiziellen Quellen

OpenClaw positioniert sich als persönlicher KI-Assistent, der „tatsächlich Dinge erledigt“, wie E-Mail- und Kalenderaktionen, über Chat-Kanäle wie WhatsApp und Telegram arbeitet und von einer konfigurierbaren Agentenlaufzeit unterstützt wird. Es vereint drei Produktideen, die strategisch wichtig sind:

  1. Eine lokale oder selbst gehostete Laufzeit mit Tool-Ausführung, einschließlich optionalem Docker-basiertem Sandboxing zur Reduzierung des Explosionsradius.
  2. Persistente Speicherprimitive, einschließlich semantischer Speichersuche über lokale Markdown-Speicherdateien mit kontrollierten Lesepfaden und der Option, Remote-Einbettungen oder lokale Einbettungen zu verwenden.
  3. Ein öffentlicher Kompetenzmarktplatz (ClawHub) zur Verteilung erweiterbarer Fähigkeiten als „Skill-Bundles“.

Die Dokumente von OpenClaw betonen auch die Beobachtbarkeit und das Kostenbewusstsein innerhalb der Chat-UX selbst. In den Referenzen „API-Nutzung und -Kosten“ und „Token-Nutzung und -Kosten“ wird aufgeführt, wo Kosten angezeigt werden (/status, /usage-Fußzeilen), welche Funktionen API-Schlüssel ausgeben können (Kernantworten, Speichereinbettungen, Websuche, Medienverständnis, Fähigkeiten) und wie die Kostenschätzung konfigurierte USD-pro-1-Millionen-Token-Raten pro Modell erfordert.

Preisgestaltung: Was ist „offiziell“ und was ist von Natur aus variabel?

OpenClaw präsentiert sich nicht als traditionelles SaaS pro Arbeitsplatz mit einem veröffentlichten Abonnement für die Kernlaufzeit. In der Praxis lässt sich der „offizielle Preis“ am besten wie folgt beschreiben:

Dadurch ähnelt das Kostenprofil von OpenClaw eher einer Entwicklerplattform als einem Verbraucherassistenten: Ihre Rechnung richtet sich nach der Automatisierungshäufigkeit, den Tool-Aufrufen und der langen Kontextnutzung und nicht nur nach der „Anzahl der Benutzer“.

Zielbenutzer

Die offiziellen Dokumente und Funktionen von OpenClaw implizieren drei Hauptbenutzersegmente:

Vor- und Nachteile: eine evidenzbasierte Sichtweise

Vorteile (starke Unterscheidungsmerkmale):

Nachteile (wesentliche Risiken und Kompromisse):

Das OpenClaw-Team und das Ökosystem haben mit konkreten Maßnahmen auf den Sicherheitsdruck reagiert. OpenClaw kündigte eine Partnerschaft zur Integration des VirusTotal-Scans für Fertigkeiten an, und VirusTotal selbst fügte native Unterstützung für die Analyse von OpenClaw-Fertigkeitspaketen über Code Insight hinzu, um aufkommende Missbrauchsmuster zu erkennen. Dies sind sinnvolle Schritte, aber sie beseitigen nicht grundlegende Agentenrisiken wie Prompt-Injection und Privilegienmissbrauch, was im Einklang mit den umfassenderen Sicherheitsrichtlinien der Branche für Agentensysteme steht.

Wie OpenClaw im Vergleich zu den aufgeführten Konkurrenten abschneidet

Im Vergleich zu OpenAI-Agenten:

Im Vergleich zu Anthropic Claude Agents:

Im Vergleich zu Microsoft Copilot/Agents:

Im Vergleich zu LangChain-basierten Plattformen:

Im Vergleich zu AutoGPT:

Im Vergleich zu Perplexity:

Im Vergleich zu Replit Ghost:

Empfehlungen und Alternativen nach Benutzertyp

Bei den folgenden Empfehlungen wird davon ausgegangen, dass ein Käufer Wert auf Zuverlässigkeit, Sicherheitslage und vorhersehbare Skalierung legt und den „Agenten“ als Produktionssystem und nicht als Demo behandelt.

Für Entwickler, die produktive Agenten erstellen:

Für Unternehmen, die interne Agenten standardisieren:

Für KMUs und Startups (Time-to-Value zählt mehr als perfekte Governance):

Für Verbraucher und Privatpersonen:

Für Forscher und Gutachter:

Share This Page