Was ein KI-Agent 2026 wirklich kostet (der Build ist der billige Teil)

Wichtigste Erkenntnisse
Lernen Sie die Stufen, nicht den Durchschnitt
Support-Chatbots mit Retrieval kosten 8.000 bis 25.000 US-Dollar, ein Agent, der einen Workflow übernimmt, 40.000 bis 80.000 US-Dollar, autonome mehrstufige Agenten 50.000 bis 150.000 US-Dollar und koordinierte Multi-Agent-Systeme ab 200.000 US-Dollar. Autonomie, Integrationen und Compliance bewegen die Zahl stärker als das Modell.
Der Build ist ein Drittel der Rechnung
Über die TCO-Studien hinweg macht die initiale Entwicklung 25 bis 35 % dessen aus, was Sie über drei Jahre ausgeben. Budgets, die Tokens, Wartung und Evaluierung auslassen, liegen 40 bis 60 % unter der Realität.
Tokens sind das neue Hosting, nur sprunghafter
Die Token-Ausgaben in Produktion landen beim 3- bis 5-Fachen der Schätzung aus der Entwicklungsphase. Prompt-Caching (bis zu 90 % Rabatt auf wiederholte Inputs) und Batch-Verarbeitung (50 % Rabatt) sind Engineering-Entscheidungen mit monatlichem Preisschild.
Mieten Sie einen, bevor Sie einen bauen
Lebt der Workflow komplett in einer Plattform, gewinnt meist ein gemieteter Agent. Custom lohnt sich, sobald die Arbeit Systeme überquert, proprietäre Daten berührt oder nah genug an Ihrer Marge sitzt, dass Sie die Logik besitzen wollen.
Fragen Sie drei Agenturen, was ein KI-Agent kostet, und Sie bekommen 12.000, 80.000 und 300.000 US-Dollar für denselben Absatz Briefing. Alle drei können ehrlich gemeint sein. Die Preis-Guides für 2026 reichen von rund 8.000 US-Dollar für einen Support-Chatbot mit Retrieval bis zu 500.000 US-Dollar und mehr für Multi-Agent-Systeme, die in Enterprise-Workflows verdrahtet sind, und die Spanne sagt weniger über die Anbieter als darüber, wie wenig das Wort "Agent" festlegt.
Die allgemeine Version dieses Artikels haben wir letzten Monat veröffentlicht, zur Frage, was individuelle Software 2026 kostet. Das hier ist die agentenspezifische Fortsetzung, weil es inzwischen die häufigste Frage in Erstgesprächen ist, und weil Agenten die übliche Budgetrechnung an einer wichtigen Stelle brechen: Der Baupreis ist die kleinere Hälfte der Geschichte. Über die diesjährigen Cost-of-Ownership-Studien hinweg macht die initiale Entwicklung 25 bis 35 % dessen aus, was Sie über drei Jahre ausgeben. Der Rest sind Tokens, Wartung und die Evaluierungsarbeit, die verhindert, dass ein Agent still und leise falsch abbiegt.
Die Preisstufen 2026, soweit sich überhaupt jemand einig ist
Die veröffentlichten Spannen gruppieren sich in vier Bänder. Ein Support-Chatbot, der Fragen aus Ihren eigenen Dokumenten beantwortet (Retrieval-Augmented Generation, wenn das Angebot teuer klingen soll), kostet 8.000 bis 25.000 US-Dollar. Ein Agent, der einen echten Workflow von Anfang bis Ende übernimmt, Tickets liest, Antworten entwirft, das CRM aktualisiert, liegt zwischen 40.000 und 80.000 US-Dollar. Mehrstufige autonome Agenten, die planen, Tools aufrufen und über mehrere Systeme hinweg handeln, kosten 50.000 bis 150.000 US-Dollar. Und Enterprise-Multi-Agent-Setups, in denen mehrere Agenten unter Audit-Trails und rollenbasierten Kontrollen koordinieren, beginnen bei rund 200.000 US-Dollar und gehen von dort nach oben.
Der Multiplikator, der in diesen Bändern steckt, ist Autonomie. Ein Bot, der Fragen beantwortet, darf billig falschliegen: Der Nutzer verdreht die Augen und formuliert um. Ein Agent, der handelt, der die Erstattung auslöst, den Termin bucht, den Datensatz ändert, braucht Guardrails, Freigabepfade, Rollback und Logging für jede Aktion, die er ausführen darf. Der Schritt von "schlägt vor" zu "macht" kann ein Budget allein verdoppeln. Und das sollte er. Der teure Teil war nie die Intelligenz, sondern die Intelligenz sicher an Systeme anzuschließen, die Geld bewegen.
Der Rest der Bewegung kommt von den üblichen Verdächtigen. Jedes System, mit dem der Agent spricht, bringt rund 2.000 bis 5.000 US-Dollar Integrationsarbeit mit, und Agenten brauchen tendenziell mehr Verbindungen als gewöhnliche Software, weil das Handeln über Systeme hinweg der ganze Pitch ist. Regulierte Daten addieren 10.000 bis 40.000 US-Dollar für Zugriffskontrollen und Audit-Trails; wir bauen HIPAA-regulierte Systeme und können bestätigen, dass diese Zahl kein Polster ist. Und ein vager Scope addiert, was auch immer Ihre Geduld wert ist, denn "ein KI-Agent für Operations" ist keine Spezifikation, sondern ein Wunsch.
Schicken Sie einen konkreten Fall durch die Stufen. Sagen wir, Sie betreiben einen Onlineshop und wollen einen Agenten für den Kundenservice. Version eins beantwortet Fragen zu Bestellstatus und Retouren aus Ihren Hilfedokumenten und der Bestell-API: eine Integration, Nur-Lese-Zugriff, 15.000 bis 25.000 US-Dollar, plus ein paar Hundert US-Dollar Tokens im Monat. Version zwei wickelt die Retouren selbst ab. Sie prüft die Berechtigung, löst die Erstattung über Stripe aus, aktualisiert den Bestelldatensatz und mailt dem Kunden. Aus Sicht des Käufers dieselbe Konversation. Aber jetzt sind es drei Integrationen, Schreibzugriff auf Geld, ein Freigabepfad für die Sonderfälle und ein Evaluierungs-Harness, damit Sie merken, wenn Erstattungsentscheidungen zu driften beginnen. Das ist ein Build für 60.000 bis 90.000 US-Dollar mit einer echten Monatsrechnung dran. Die Lücke zwischen diesen beiden Angeboten ist kein Polster. Autonomie ist der Multiplikator.
Der Zähler startet beim Launch
Das ist es, was Agenten von gewöhnlicher Software trennt: Die Kernschleife läuft über einen Zähler. Eine einzige Nutzeranfrage fächert sich in Planungsaufrufe, Tool-Aufrufe, Retries und eine finale Antwort auf, und jeder Schritt rechnet pro Token ab. Teams stellen regelmäßig fest, dass die Token-Ausgaben in Produktion beim Drei- bis Fünffachen ihrer Schätzung aus der Entwicklungsphase landen, weil Entwicklung auf zehn höflichen Testfällen stattfindet und Produktion auf Ihren echten Kunden.
Die Preisliste 2026 ist immerhin leichter zu lesen als früher. Arbeitspferd-Modelle landen bei rund 3 US-Dollar pro Million Input-Tokens und 15 US-Dollar pro Million Output. Budget-Modelle kosten ein Zehntel davon, die billigsten brauchbaren ein Hundertstel. Prompt-Caching senkt die Kosten wiederholter Inputs um bis zu 90 %, und Batch-Verarbeitung nimmt 50 % von allem, was eine Stunde warten kann. Welches Modell welchen Schritt übernimmt, was gecacht wird und was im Batch läuft, sind Engineering-Entscheidungen, die jeden Monat echtes Geld bewegen. Wenn Ihr Anbieter sie nicht angesprochen hat, sprechen Sie sie selbst an.
Fürs Budget: Ein mittelgroßer Agent mit rund tausend Nutzern am Tag kostet typischerweise 500 bis 15.000 US-Dollar im Monat für Inferenz, Infrastruktur und Monitoring. Ja, die Spanne ist breit. Die Breite ist der Punkt. Wo Sie landen, hängt von Architekturentscheidungen ab, die jemand in Woche zwei trifft, meist ohne dass irgendwer sie als Finanzentscheidungen kennzeichnet.
Die Kosten, die es nicht ins Angebot schaffen
Über die diesjährigen TCO-Analysen hinweg wiederholt sich das Muster: Budgets liegen 40 bis 60 % unter den echten Dreijahreskosten, und der Fehlbetrag konzentriert sich auf dieselben wenigen Stellen.
- Integrationsdrift. Salesforce liefert ein Update aus, eine interne API ändert ihre Form, und der Agent bricht ohne eine Fehlermeldung, die irgendjemand sieht. Budgetieren Sie 1.000 bis 3.000 US-Dollar pro Integration und Jahr, nur um die Rohrleitungen aktuell zu halten.
- Prompt- und Modellwartung. Modelle werden nach dem Zeitplan des Anbieters abgekündigt, nicht nach Ihrem. Prompts verlieren ihre Feinabstimmung, Wissensdatenbanken müssen neu indexiert werden. Planen Sie 10 bis 15 % der Baukosten pro Jahr ein, das ist die normale Software-Wartungsregel, angewandt auf einen schneller drehenden Stack.
- Evaluierung. Der Posten, den Erstkäufer auslassen. Ein Agent braucht ein automatisiertes Harness, das seine Ausgaben gegen bekannte gute Antworten bewertet, damit Sie von einem Dashboard erfahren, dass er nachgelassen hat, und nicht von einem abgewanderten Kunden. Rechnen Sie mit 10 bis 20 % Aufschlag auf die Infrastrukturkosten, und rechnen Sie damit, dass es das bestangelegte Geld im ganzen Budget ist.
Deloittes Emerging-Tech-Umfrage fand nur 11 % der Organisationen mit Agenten in Produktion. Wir haben schon einmal darüber geschrieben, warum Pilotprojekte sterben, und die meisten Gründe sind organisatorisch, nicht technisch. Aber ein ordentlicher Anteil ist genau das hier: Der Pilot wurde budgetiert, die Produktionsposten nicht, und Monat vier ist ein ungünstiger Zeitpunkt, den Unterschied zu entdecken.
Mieten Sie einen, bevor Sie einen bauen
Die ehrliche Vorfrage ist, ob Sie überhaupt bauen sollten. Plattform-Agenten sind dieses Jahr gut geworden: Shopify, Meta und die großen CRM-Anbieter vermieten Ihnen alle einen Agenten, der in ihrem Produkt lebt, gegen ein Abo. Wenn Ihr Workflow komplett in eine Plattform passt, mieten Sie ihn und machen Sie weiter. Custom beginnt zu gewinnen, wenn die Arbeit Systeme überquert, von Daten abhängt, die Sie lieber nicht aus der Hand geben, oder nah genug an Ihrer Marge sitzt, dass das Besitzen der Logik die Strategie ist. Dasselbe Argument haben wir zu Metas WhatsApp Business Agent gemacht, und es gilt für die ganze Kategorie.
Wenn Sie bauen, starten Sie mit einem Workflow, nicht mit einer Plattform. Der 30.000-Dollar-Agent, der 40 % einer Ticketkategorie löst, lehrt Sie, was Ihr Evaluierungs-Harness abfangen muss, wie hoch Ihre Token-Rechnung bei Ihrem Volumen wirklich ist und ob Ihre Daten so bereit waren, wie alle behauptet haben. Die 200.000-Dollar-Plattformversion derselben Idee lehrt Sie dieselben Lektionen zum Mehrfachen des Preises, mit Publikum.
Drei Fragen, die ein Angebot entlarven
- Was kostet mich das pro gelöster Aufgabe bei meinem Volumen? Das zwingt die Token-Rechnung ans Licht. Ein Anbieter, der Ihr Volumen nicht modelliert hat, bepreist den Build und hofft beim Rest.
- Was steckt im Evaluierungs-Harness? Wenn die Antwort "wir testen alles gründlich" lautet, suchen Sie weiter. Sie wollen bewertete Outputs, ein Regressions-Set, Drift-Alerts und einen Namen daran, wer handelt, wenn die Qualität abrutscht.
- Was kostet Monat dreizehn? Wartung, Inferenz, Monitoring und Integrationspflege, mit Zahlen dran. Der Baupreis ist das Eintrittsgeld. Diese Frage ist der schnellste Weg herauszufinden, ob Ihr Anbieter das weiß.
Also die Antwort für 2026: 8.000 bis 25.000 US-Dollar, wenn Sie eine schlaue FAQ wollen, 40.000 bis 150.000 US-Dollar für einen Agenten, der echte Arbeit macht, ab 200.000 US-Dollar, wenn mehrere davon koordinieren müssen. Nehmen Sie dann die Zahl, bei der Sie gelandet sind, und verdoppeln Sie sie über drei Jahre grob für den Teil des Eisbergs, der nicht der Build ist. Agenten können all das wieder einspielen, und die guten tun es. Sie verdienen es nur auf dem Betriebsbudget, nicht auf der Launch-Rechnung, und die Teams, die vorn rauskommen, sind die, die das von Anfang an wussten.
Häufig gestellte Fragen
Was kostet es, 2026 einen KI-Agenten zu bauen?
Ein Support-Chatbot, der aus Ihren Dokumenten antwortet, kostet 8.000 bis 25.000 US-Dollar. Ein Agent, der einen einzelnen echten Workflow übernimmt, liegt zwischen 40.000 und 80.000 US-Dollar. Mehrstufige autonome Agenten, die planen und über Systeme hinweg handeln, kosten 50.000 bis 150.000 US-Dollar, und Enterprise-Multi-Agent-Systeme beginnen bei rund 200.000 US-Dollar. Autonomiegrad, Anzahl der Integrationen und regulierte Daten bewegen die Zahl am stärksten.
Was sind die laufenden Kosten eines KI-Agenten?
Planen Sie je nach Volumen 500 bis 15.000 US-Dollar pro Monat für Inferenz, Infrastruktur und Monitoring ein, plus 10 bis 15 % der Baukosten pro Jahr für Prompt- und Modellwartung. Jede externe Integration braucht rund 1.000 bis 3.000 US-Dollar Pflege pro Jahr, und die Evaluierungsinfrastruktur addiert 10 bis 20 % auf die Betriebskosten. Über drei Jahre macht der initiale Build meist 25 bis 35 % der Gesamtausgaben aus.
Warum gehen Angebote für KI-Agenten so weit auseinander?
Weil "Agent" den Umfang noch weniger festlegt als "App". Ein Bot, der Antworten vorschlägt, und ein Agent, der in Ihren Systemen handelt, brauchen sehr unterschiedlich viel Guardrail-, Freigabe- und Rollback-Engineering. Angebote unterscheiden sich außerdem darin, was sie enthalten: Manche bepreisen die Demo, andere das Produktionssystem mit Evaluierung, Monitoring und Integrationspflege. Beide können ehrliche Angebote für unterschiedliche Liefergegenstände sein.
Ist ein KI-Agent von der Stange billiger als ein eigener Build?
Fast immer, und oft ist es die richtige Wahl. Plattformanbieter vermieten inzwischen fähige Agenten, die in ihren eigenen Produkten leben, gegen ein Abo. Custom gewinnt, wenn der Workflow mehrere Systeme überquert, von proprietären Daten abhängt oder zentral genug für Ihre Marge ist, dass das Besitzen der Logik zählt. Ein üblicher Weg ist, erst zu mieten, zu lernen, was der Agent wirklich tun muss, und dann dort custom zu bauen, wo der gemietete nicht mehr reicht.
Wie kann ich die Kosten eines KI-Agenten-Projekts senken?
Scopen Sie einen Workflow statt einer Plattform, und instrumentieren Sie ihn ordentlich. Wählen Sie das Modell in der richtigen Größe: Arbeitspferd-Modelle für rund 3 US-Dollar pro Million Input-Tokens erledigen den Großteil der Agentenarbeit, und billigere Modelle übernehmen Routing und Klassifikation. Nutzen Sie Prompt-Caching und Batch-Verarbeitung, wo der Workload es erlaubt. Und bezahlen Sie eine kurze Discovery, die Ihre Token-Kosten bei echtem Volumen modelliert, bevor irgendjemand sich auf einen Baupreis festlegt.
Ähnliche Artikel
Meta hat einen KI-Agenten in WhatsApp gesetzt. Mieten oder selbst bauen?
Metas neuer Business Agent beantwortet Fragen, empfiehlt Produkte und vereinbart Termine für die drei Milliarden Menschen, die ohnehin auf WhatsApp sind. Ihn zu mieten ist der schnelle Zug. Hier lesen Sie, wann es der falsche ist.
Die FDA hat ihre KI-Gesundheitsregeln gelockert. Das ist nicht dasselbe wie keine Regeln.
Anfang 2026 hat die FDA eine große Kategorie klinischer Software und Consumer-Wearables aus ihrer Prüfung herausgenommen. Für Gründer, die Gesundheitsprodukte bauen, klingt das nach guten Nachrichten, doch lockerere Bundesaufsicht verlagert die Arbeit meist, statt sie zu beseitigen. Hier steht, was sich tatsächlich geändert hat, was nicht, und wie Sie darauf hin bauen.