Wat een AI-agent in 2026 echt kost (de build is het goedkope deel)

Belangrijkste inzichten
Ken de tiers, niet het gemiddelde
Supportchatbots met retrieval kosten $8k tot $25k, een agent die één workflow bezit $40k tot $80k, autonome multi-step agents $50k tot $150k, en gecoördineerde multi-agentsystemen $200k en meer. Autonomie, integraties en compliance bewegen het cijfer meer dan het model.
De build is een derde van de rekening
In TCO-studies is de initiële ontwikkeling 25 tot 35 procent van wat je over drie jaar uitgeeft. Budgetten die tokens, onderhoud en evaluatie overslaan, komen 40 tot 60 procent onder de werkelijkheid uit.
Tokens zijn de nieuwe hosting, alleen grilliger
Tokenuitgaven in productie landen op 3 tot 5 keer de schatting uit de ontwikkelfase. Prompt caching (tot 90 procent korting op herhaalde input) en batchverwerking (50 procent korting) zijn engineeringbeslissingen met een maandelijks prijskaartje.
Huur er een voordat je er een bouwt
Leeft de workflow binnen één platform, dan wint een gehuurde agent meestal. Maatwerk begint te lonen wanneer het werk systemen kruist, eigen data raakt, of dicht genoeg bij je marge zit dat je de logica wilt bezitten.
Vraag drie agencies wat een AI-agent kost en je krijgt $12,000, $80,000 en $300,000 voor dezelfde alinea briefing. Alle drie kunnen ze oprecht zijn. De prijsgidsen van 2026 lopen van ongeveer $8,000 voor een supportchatbot met retrieval tot $500,000 en meer voor multi-agentsystemen die verweven zijn met enterprise-workflows, en de spreiding zegt minder over de leveranciers dan over hoe weinig het woord "agent" eigenlijk vastlegt.
Vorige maand publiceerden we de algemene versie van dit artikel, over wat maatwerksoftware in 2026 kost. Dit is het agent-specifieke vervolg, omdat het inmiddels de vraag is die we het vaakst horen in kennismakingsgesprekken, en omdat agents de gebruikelijke begrotingslogica op één belangrijk punt breken: de bouwprijs is de kleinste helft van het verhaal. In de cost-of-ownership-studies van dit jaar is de initiële ontwikkeling 25 tot 35 procent van wat je over drie jaar uitgeeft. De rest is tokens, onderhoud en het evaluatiewerk dat voorkomt dat een agent stilletjes de mist in gaat.
De tiers van 2026, voor zover iemand het erover eens is
De gepubliceerde ranges clusteren in vier banden. Een supportchatbot die vragen beantwoordt uit je eigen documenten (retrieval-augmented generation, als het voorstel duur wil klinken) kost $8,000 tot $25,000. Een agent die één echte workflow van begin tot eind bezit, tickets leest, antwoorden opstelt, de CRM bijwerkt, zit tussen $40,000 en $80,000. Multi-step autonome agents die plannen, tools aanroepen en over meerdere systemen heen handelen, kosten $50,000 tot $150,000. En enterprise multi-agent-opstellingen, waarin meerdere agents samenwerken onder audittrails en rolgebaseerde controles, beginnen rond $200,000 en gaan vandaar omhoog.
De vermenigvuldiger die in die banden verstopt zit, is autonomie. Een bot die vragen beantwoordt, mag goedkoop fout zitten: de gebruiker rolt met de ogen en formuleert de vraag opnieuw. Een agent die handelt, die de terugbetaling uitvoert, het tijdslot boekt, het record wijzigt, heeft guardrails nodig, goedkeuringspaden, rollback en logging voor elke actie die hij mag uitvoeren. De stap van "stelt voor" naar "doet" kan in z'n eentje een budget verdubbelen. En terecht. Het dure deel was nooit de intelligentie, het is die intelligentie veilig aansluiten op systemen die geld verplaatsen.
De rest van de beweging komt van bekende verdachten. Elk systeem waarmee de agent praat voegt ruwweg $2,000 tot $5,000 aan integratiewerk toe, en agents hebben doorgaans meer verbindingen nodig dan gewone software, want handelen over systemen heen is nou juist de pitch. Gereguleerde data voegt $10,000 tot $40,000 toe voor toegangscontroles en audittrails; wij bouwen HIPAA-gereguleerde systemen en kunnen bevestigen dat dat cijfer geen opvulling is. En een vage scope voegt toe wat je geduld waard is, want "een AI-agent voor operations" is geen spec, het is een wens.
Haal een concreet voorbeeld door de tiers. Stel, je runt een webshop en wilt een agent voor klantenservice. Versie één beantwoordt vragen over orderstatus en retouren uit je helpdocumenten en order-API: één integratie, alleen leestoegang, $15,000 tot $25,000, plus een paar honderd dollar per maand aan tokens. Versie twee handelt de retouren zelf af. Hij controleert of de retour in aanmerking komt, voert de terugbetaling uit via Stripe, werkt het orderrecord bij en mailt de klant. Hetzelfde gesprek, vanuit de koper gezien. Maar nu zijn er drie integraties, schrijftoegang tot geld, een goedkeuringspad voor de randgevallen, en een evaluatieharnas zodat je het merkt wanneer terugbetalingsbeslissingen beginnen af te drijven. Dat is een build van $60,000 tot $90,000 met een echte maandelijkse rekening eraan vast. Het gat tussen die twee offertes is geen opvulling. Autonomie is de vermenigvuldiger.
De meter begint te lopen bij de lancering
Dit onderscheidt agents van gewone software: de kernloop is bemeterd. Eén gebruikersverzoek waaiert uit in planningscalls, toolcalls, retries en een definitief antwoord, en elke stap wordt per token afgerekend. Teams zien hun tokenuitgaven in productie geregeld landen op drie tot vijf keer de schatting uit de ontwikkelfase, omdat ontwikkeling gebeurt op tien beleefde testcases en productie op je echte klanten.
De prijslijst van 2026 is tenminste beter leesbaar dan vroeger. Werkpaardmodellen landen rond $3 per miljoen input-tokens en $15 per miljoen output. Budgetmodellen kosten een tiende daarvan, en de goedkoopste bruikbare een honderdste. Prompt caching haalt tot 90 procent van de kosten van herhaalde input af, en batchverwerking 50 procent van alles wat een uur kan wachten. Welk model welke stap afhandelt, wat gecachet wordt en wat in batch draait, zijn engineeringbeslissingen die elke maand echt geld verschuiven. Als je leverancier ze niet ter sprake heeft gebracht, breng ze dan zelf ter sprake.
Voor de begroting: een middelgrote agent die zo'n duizend gebruikers per dag bedient, kost doorgaans $500 tot $15,000 per maand aan inference, infrastructuur en monitoring. Ja, die range is breed. Die breedte is precies het punt. Waar je landt hangt af van architectuurkeuzes die iemand in week twee maakt, meestal zonder dat iemand ze markeert als financiële beslissingen.
De kosten die het voorstel niet halen
In de TCO-analyses van dit jaar herhaalt het patroon zich: budgetten komen 40 tot 60 procent onder de echte driejaarskosten uit, en de misser concentreert zich op dezelfde paar plekken.
- Integratiedrift. Salesforce rolt een update uit, een interne API verandert van vorm, en de agent breekt zonder foutmelding die iemand ziet. Begroot $1,000 tot $3,000 per integratie per jaar, alleen al om het loodgieterswerk actueel te houden.
- Prompt- en modelonderhoud. Modellen worden uitgefaseerd volgens het schema van de provider, niet het jouwe. Prompts raken ontstemd, kennisbanken moeten opnieuw geïndexeerd worden. Reken op 10 tot 15 procent van de bouwkosten per jaar, oftewel de normale onderhoudsregel voor software, toegepast op een sneller bewegende stack.
- Evaluatie. De post die eerste kopers overslaan. Een agent heeft een geautomatiseerd harnas nodig dat zijn output scoort tegen bekende goede antwoorden, zodat je van een dashboard hoort dat hij achteruitging in plaats van van een vertrokken klant. Reken op 10 tot 20 procent extra infrastructuurkosten, en reken erop dat het het best bestede geld in het hele budget is.
Deloittes emerging-tech-survey vond maar 11 procent van de organisaties met agents in productie. We schreven al eerder over waarom pilots sneuvelen, en de meeste redenen zijn organisatorisch in plaats van technisch. Maar een behoorlijk deel is precies dit: de pilot werd begroot, de productieposten niet, en maand vier is een beroerd moment om het verschil te ontdekken.
Huur er een voordat je er een bouwt
De eerlijke voorvraag is of je überhaupt moet bouwen. Platformagents werden dit jaar goed: Shopify, Meta en de grote CRM-leveranciers verhuren je allemaal een agent die in hun eigen product leeft, voor een abonnement. Past je workflow volledig binnen één platform, huur hem dan en ga door met je leven. Maatwerk begint te winnen wanneer het werk systemen kruist, afhangt van data die je liever niet uit handen geeft, of dicht genoeg bij je marge zit dat de logica bezitten de strategie is. We maakten hetzelfde punt over Meta's WhatsApp Business Agent, en het generaliseert naar de hele categorie.
Bouw je wel, begin dan met één workflow, niet met een platform. De agent van $30,000 die 40 procent van één ticketcategorie oplost, leert je wat je evaluatieharnas moet vangen, wat je tokenrekening werkelijk is op jouw volume, en of je data zo klaar was als iedereen beweerde. De platformversie van $200,000 van hetzelfde idee leert je dezelfde lessen tegen een veelvoud van de prijs, met publiek erbij.
Drie vragen die een offerte doorprikken
- Wat gaat dit kosten per opgeloste taak op mijn volume? Dit dwingt de tokenrekensom in de openbaarheid. Een leverancier die jouw volume niet heeft doorgerekend, offreert de build en hoopt over de rest.
- Wat zit er in het evaluatieharnas? Is het antwoord "we testen alles grondig", blijf dan rondkijken. Je wilt gescoorde outputs, een regressieset, driftalerts en een naam bij wie er ingrijpt als de kwaliteit wegzakt.
- Wat kost maand dertien? Onderhoud, inference, monitoring en integratie-onderhoud, met cijfers erbij. De bouwprijs is het entreegeld. Deze vraag is de snelste manier om te ontdekken of je leverancier dat weet.
Dus het antwoord voor 2026: $8,000 tot $25,000 als je eigenlijk een slimme FAQ wilt, $40,000 tot $150,000 voor een agent die echt werk doet, $200,000 en meer wanneer er meerdere moeten samenwerken. Neem vervolgens het cijfer waar je op uitkwam en verdubbel het grofweg over drie jaar, voor het deel van de ijsberg dat niet de build is. Agents kunnen dat allemaal terugverdienen, en de goede doen dat ook. Ze verdienen het alleen terug op het operationele budget, niet op de lanceringsfactuur, en de teams die er goed uitkomen zijn de teams die dat vooraf wisten.
Veelgestelde vragen
Wat kost een AI-agent laten bouwen in 2026?
Een supportchatbot die antwoordt uit je eigen documenten kost $8,000 tot $25,000. Een agent die één echte workflow bezit, zit tussen $40,000 en $80,000. Multi-step autonome agents die plannen en over systemen heen handelen kosten $50,000 tot $150,000, en enterprise multi-agentsystemen beginnen rond $200,000. Autonomieniveau, het aantal integraties en gereguleerde data bewegen het cijfer het meest.
Wat zijn de doorlopende kosten van een AI-agent?
Reken op $500 tot $15,000 per maand voor inference, infrastructuur en monitoring, afhankelijk van het volume, plus 10 tot 15 procent van de bouwkosten per jaar voor prompt- en modelonderhoud. Elke externe integratie vraagt ruwweg $1,000 tot $3,000 per jaar aan onderhoud, en evaluatie-infrastructuur voegt 10 tot 20 procent toe aan de lopende kosten. Over drie jaar blijkt de initiële build meestal 25 tot 35 procent van de totale uitgaven te zijn.
Waarom lopen offertes voor AI-agents zo uiteen?
Omdat "agent" de scope nog minder vastlegt dan "app". Een bot die antwoorden voorstelt en een agent die op je systemen handelt, hebben heel verschillende hoeveelheden guardrail-, goedkeurings- en rollback-engineering nodig. Offertes splitsen ook op wat ze meerekenen: sommige prijzen de demo, andere het productiesysteem met evaluatie, monitoring en integratie-onderhoud. Beide kunnen oprechte offertes zijn voor verschillende deliverables.
Is een kant-en-klare AI-agent goedkoper dan zelf bouwen?
Bijna altijd, en vaak is het de juiste keuze. Platformleveranciers verhuren inmiddels capabele agents die in hun eigen producten leven, voor een abonnement. Maatwerk wint wanneer de workflow meerdere systemen kruist, afhangt van eigen data, of centraal genoeg is voor je marge dat de logica bezitten ertoe doet. Een gangbaar pad is eerst huren, leren wat de agent werkelijk moet doen, en dan maatwerk bouwen waar de gehuurde tekortschiet.
Hoe kan ik de kosten van een AI-agentproject verlagen?
Scope één workflow in plaats van een platform, en instrumenteer die goed. Kies het juiste modelformaat: werkpaardmodellen van rond $3 per miljoen input-tokens doen het meeste agentwerk, en goedkopere modellen doen de routerings- en classificatiestappen. Gebruik prompt caching en batchverwerking waar de workload het toelaat. En betaal voor een korte discovery die je tokenkosten op echt volume doorrekent voordat iemand zich vastlegt op een bouwprijs.
Gerelateerde artikelen
Meta zet een AI-agent in WhatsApp. Huren of zelf bouwen?
Meta's nieuwe Business Agent beantwoordt vragen, beveelt producten aan en boekt afspraken voor de drie miljard mensen die al op WhatsApp zitten. Hem huren is de snelle zet. Hier lees je wanneer het de verkeerde is.
De FDA versoepelde zijn AI-gezondheidsregels. Dat is niet hetzelfde als geen regels.
Begin 2026 haalde de FDA een grote categorie klinische software en consumenten-wearables onder zijn toezicht vandaan. Voor oprichters die gezondheidsproducten bouwen klinkt het als goed nieuws, maar losser federaal toezicht verplaatst het werk vooral, in plaats van het weg te nemen. Dit is wat er daadwerkelijk veranderde, wat niet, en hoe je ervoor bouwt.