88 % der KI-Agenten-Piloten gehen nie in Produktion. Wir haben diesen Film schon gesehen, damals noch ohne Agenten.

YuriiGeschäftsführer und Gründer

Veröffentlicht11. Juni 2026

5 Min. Lesezeit

88% of AI agent pilots never ship. We've watched this movie before, without the agents.

Wichtigste Erkenntnisse

Die Misserfolgsquote ist strukturell, nicht technisch

IDC zufolge erreichen 88 % der Proofs-of-Concept mit KI-Agenten nie die Produktion, und Gartner erwartet, dass bis Ende 2027 über 40 % der agentischen Projekte abgebrochen werden. Die dokumentierten Ursachen: fehlende Erfolgskriterien, blockierter Datenzugriff, kein Qualitätsmonitoring. Nichts davon ist ein Technologieproblem.

Ein Drittel der Belegschaft arbeitet womöglich gegen das Projekt

In einer Umfrage von Writer und Workplace Intelligence unter 2.400 Wissensarbeitern gaben 31 % zu, die KI-Strategie ihres Unternehmens aktiv zu sabotieren. In der Gen Z sind es mehr als vier von zehn. Unternehmen budgetieren die Einführung, während ein Teil der Organisation still in die Gegenrichtung arbeitet.

Der Pilot kann ein Weg sein, Veränderung zu vermeiden

Ein Pilot hat ein sauberes Budget, ein festes Enddatum und am Ende eine Demo. Er liefert das Häkchen "wir machen KI", ohne dass irgendjemand die Legacy-Systeme, die Daten oder die Prozesse anfassen muss, die Produktion erfordern würde.

Die Saboteure verhalten sich rational

Wenn der Erfolg eines Projekts bedeutet, dass der eigene Job sich verändert oder verschwindet, und niemand etwas im Gegenzug angeboten hat, ist Widerstand eine vernünftige Strategie. ROI-Rechnungen, die diese Variable ignorieren, produzieren Piloten, die nach der Abschlusspräsentation leise sterben.

Wir haben ein Jahrzehnt lang digitale Transformation an Unternehmen verkauft, bevor irgendjemand irgendetwas einen Agenten nannte. Hier ist also das, was Berater einander normalerweise nur an der Bar nach der Konferenz erzählen.

Die meistzitierte Zahl des Jahres: 88 % der Piloten mit KI-Agenten schaffen es laut IDC nie in die Produktion. Gartner erwartet, dass bis Ende 2027 mehr als 40 % der agentischen KI-Projekte komplett abgebrochen werden. Und eine Umfrage von Writer und Workplace Intelligence ergab, dass 31 % der Beschäftigten zugeben, die KI-Strategie ihres Unternehmens aktiv zu sabotieren. Unter den Jüngsten sind es mehr als vier von zehn. Man lasse sich diese Kombination kurz auf der Zunge zergehen: Das Unternehmen bezahlt den Rollout, während ein Drittel der Leute darin still dagegen arbeitet.

Forrester hat gescheiterte Agenten-Deployments Ursache für Ursache auseinandergenommen. Keine Erfolgskriterien. Der Agent bekam nie Zugriff auf die Daten, die er brauchte. Niemand schaute nach dem Launch auf die Output-Qualität. Wir haben diese Liste zweimal gelesen und finden keinen einzigen technologischen Grund darauf.

Der Pilot ist ein perfekter Weg, nichts zu verändern

Wir haben dieses Muster Dutzende Male beobachtet, lange bevor es Agenten gab. Ein Pilot ist institutionell bequem. Man stellt ein Budget bereit, holt einen Dienstleister, zeigt dem Vorstand eine Demo und setzt das Häkchen "wir machen KI". Alle Beteiligten bekommen, wofür sie gekommen sind: Der Sponsor bekommt eine Folie, der Anbieter eine Referenz, das Team drei interessante Monate. Nichts daran, wie das Unternehmen tatsächlich arbeitet, muss sich bewegen.

Die Demo funktioniert, weil Demos auf sauberen APIs und sorgfältig vorbereiteten Daten laufen. Produktion ist ein anderes Land. Produktion ist der Legacy-Stack, eine tragende Excel-Datei von 2009 und Viktor aus der Buchhaltung, der einzige lebende Mensch, der weiß, warum der Export donnerstags fehlschlägt. Der Agent überlebt seine erste Begegnung mit Viktor nicht. Das Ergebnis lautet nach unserer Erfahrung meist 0:1 für Viktor.

Gartner liefert noch einen marktweiten Grund dafür, dass die Demos besser aussehen als die Realität: "Agent Washing". Tausende Anbieter haben Chatbots, RPA-Skripte und Assistenten zu Agenten umetikettiert; Gartner schätzt, dass nur rund 130 von ihnen das Echte verkaufen. Ein Pilot auf Basis eines umbenannten Chatbots hätte ohnehin nie die Kreditorenbuchhaltung übernommen, aber in der Demo macht er sich großartig.

Berater werden nicht dafür bezahlt, die Wahrheit zu sagen

Dieser Markt hat ein strukturelles Ehrlichkeitsproblem, und wir sagen das als Teil davon. Ein Pilot verkauft sich leicht: ein überschaubares Budget, drei Monate, am Ende eine schicke Präsentation. Die ehrliche Alternative klingt oft so: "Bevor irgendetwas davon funktionieren kann, braucht es ein Jahr Datenbereinigung und neu geschriebene Prozesse drumherum." Dieser Satz verkauft gar nichts.

Wir haben auf beiden Stühlen gesessen. Manchmal haben wir die Wahrheit gesagt und den Auftrag nicht bekommen. Manchmal haben wir geschwiegen und dann zugesehen, wie der Pilot ein paar Monate nach der schönen Abschlusspräsentation leise starb. Gut angefühlt hat sich beides nicht, aber nur eines davon hat den Kunden etwas gelehrt, und es war nicht das Zweite.

Als Einkäufer lohnt es sich, das zu wissen, denn es bedeutet: Der Markt wird sich nicht von selbst korrigieren. Anbieter werden für Piloten bezahlt, ob es je zur Produktion kommt oder nicht. Gartners Abbruchprognose benennt die Folgen: steigende Kosten, unklarer Geschäftswert, unzureichende Risikokontrollen. Alle drei sind schon in der Vertragsphase sichtbar, sofern irgendjemand im Raum einen Anreiz hat hinzusehen.

Die Saboteure sind keine Bösewichte

Die unbequemste Erkenntnis in den Daten betrifft diese 31 %. Die Sabotage in der Writer-Umfrage ist nicht filmreif. Sie besteht darin, die Tools zu verweigern, sie mit Müll zu füttern, auf nicht freigegebene Alternativen auszuweichen oder absichtlich schwachen Output abzuliefern, damit die KI wirkungslos aussieht. Und als die Forscher nach dem Warum fragten, waren die Antworten alles andere als irrational: 30 % fürchten um ihren Job, 28 % sorgen sich um die Sicherheit, 26 % haben das Gefühl, die Technologie entwerte ihre Arbeit, 26 % halten die Strategie des Unternehmens schlicht für schlecht umgesetzt.

Man versetze sich in diese Lage. Wenn der Erfolg des Projekts bedeutet, dass die eigene Rolle sich verändert oder verschwindet, und niemand etwas im Gegenzug angeboten hat, ist Ausbremsen eine vernünftige Strategie. Nicht bewundernswert, aber vernünftig. Unternehmen rechnen den ROI von Agenten auf zwei Nachkommastellen aus und übersehen, dass die Hauptvariable in der Gleichung Menschen sind, denen dieser ROI nichts Gutes verspricht.

Viktor aus der Buchhaltung ist dieselbe Geschichte von der anderen Seite. Er blockiert den Agenten nicht aus Boshaftigkeit. Er ist der Mensch, der zwanzig Jahre undokumentierter Ausnahmen in sich aufgenommen hat, und der Pilotplan behandelt ihn als Implementierungsdetail. Das Projekt hätte ihn als Co-Autor gebraucht.

Vier Fragen, die das Ergebnis vorhersagen

Wer gerade einen Piloten angeboten bekommt, kann mit vier Fragen vor der Unterschrift vorhersagen, auf welcher Seite der 88 % er landen wird:

Welche Metrik definiert Erfolg, und wer nimmt sie ab? "Die Demo hat den Vorstand beeindruckt" ist keine Metrik. Wenn Erfolg nicht schriftlich feststeht, bevor die Arbeit beginnt, existiert der Pilot, um eine Demo zu sein.
Welche Produktionssysteme und Daten wird der Agent anfassen, und wer gewährt diesen Zugriff? Läuft der Pilot nur auf vorbereiteten Daten, testet man die Folien des Anbieters, nicht die eigene Zukunft.
Wer verantwortet die Output-Qualität nach dem Launch? Ein Agent verschlechtert sich leise. Wenn keine namentlich benannte Person hinschaut und eingreifen darf, erfährt man von der Verschlechterung durch einen Kunden.
Was bekommen die Menschen, deren Arbeit sich verändert? Weiterbildung, eine bessere Rolle, einen Anteil am Ergebnis, irgendetwas. Lautet die ehrliche Antwort "nichts", lohnt ein zweiter Blick auf die Sabotage-Statistik, und das Budget sollte entsprechend geplant werden.

Man beachte: Keine dieser Fragen dreht sich um Modellwahl, Frameworks oder Anbieter. Genau das ist der Punkt. Die Technologie ist der austauschbarste Teil des Projekts.

KI-Projekte scheitern nicht. Organisationen lassen sie scheitern, indem sie hoffen, die Technologie werde sie verändern, ohne dass sie sich selbst verändern müssen. Die 88 % sind kein Urteil über Agenten. Sie sind eine Messung, wie viele Unternehmen einen Piloten gekauft haben statt einer Entscheidung.

Falls jemand im Bekanntenkreis gerade "einen Agenten-Piloten startet": einfach diesen Text weiterleiten. Das ist billiger, als zu den 88 % zu gehören.

Häufig gestellte Fragen

Woher stammt die Zahl von 88 %?

Aus IDC-Untersuchungen zu Proofs-of-Concept mit KI-Agenten in Unternehmen: 88 % schaffen den Sprung in den Produktivbetrieb nie. Das passt zu den übrigen Daten aus dem Feld. Gartner prognostiziert, dass bis Ende 2027 über 40 % der agentischen KI-Projekte komplett abgebrochen werden, und nennt als Gründe steigende Kosten, unklaren Geschäftswert und unzureichende Risikokontrollen.

Sind die Misserfolge wirklich nicht technisch?

Die wiederkehrenden Ursachen in Forresters Analyse gescheiterter Agenten-Deployments: fehlende Erfolgskriterien, Agenten, die nicht an die benötigten Daten kommen, weil diese in Legacy-Systemen eingeschlossen sind, und niemand, der nach dem Launch die Output-Qualität überwacht. Die Integration mit Altsystemen hat eine technische Oberfläche, aber zu entscheiden, was Erfolg bedeutet, Datenzugriff zu gewähren und Qualität zu verantworten, ist Managementarbeit.

Warum sollten Mitarbeitende einen KI-Rollout sabotieren?

In der Writer-Umfrage nannten die Geständigen Angst um den Arbeitsplatz (30 %), Sicherheitsbedenken (28 %), das Gefühl, die Technologie entwerte ihre Arbeit (26 %), und eine schlecht umgesetzte Unternehmensstrategie (26 %). Die Formen reichen von der Verweigerung der Tools bis zu absichtlich schwachen Ergebnissen, damit die KI wirkungslos aussieht. Es ist eine vorhersehbare Reaktion auf ein Projekt, das Menschen bedroht, ohne ihnen etwas zu bieten.

Was sollte vor dem Start eines KI-Agenten-Piloten geklärt sein?

Vier Dinge, schriftlich: die Metrik, die Erfolg definiert, und wer sie abnimmt; auf welche Systeme und Daten der Agent in Produktion zugreift, nicht in der Sandbox; wer nach dem Launch die Output-Qualität verantwortet und was diese Person tut, wenn sie nachlässt; und was die Menschen davon haben, deren Arbeit sich verändert. Bleibt eine der vier Fragen ohne Antwort, produziert der Pilot eine schöne Demo und sonst nichts.