AI capaciteit huren: wanneer GPU's en wanneer agents

De vraag "wat kost AI capaciteit per uur" is bijna altijd een verkeerde vraag. De juiste vraag is: "Wat probeer ik op te schalen, mijn compute of mijn mensen?" Dit artikel beschrijft het beslismodel dat wij in intake-gesprekken hanteren. Geen technologische framing, een operationele.

/ 01Vraag

De vraag achter de vraag

Bij elke vraag "hoeveel GPU's hebben we nodig" zit een werkproces dat de directeur sneller of beter wil maken. Voordat we het over GPU's hebben, willen we dat werkproces eerst kennen. Vaak is het antwoord ontnuchterend: "we willen sneller op support reageren" of "ons verkoopteam loopt achter op offerte-prepwerk". Daar lost geen GPU iets aan op. Daar lost een agent-architectuur iets aan op, vaak op bestaande API-compute.

Wat probeer je op te schalen, je compute of je mensen?

De eerste vraag in elk capaciteit-gesprek

/ 02Curves

De twee curves van capaciteit

Er zijn twee manieren waarop AI capaciteit oplevert. Ze hebben heel andere economische profielen.

Compute-curve: meer rekenkracht

Meer GPU's of zwaardere modellen leveren meer rekenkracht per seconde. Dit helpt bij workloads die rekenintensief zijn: video- of beeld-generatie, batch-transcriptie, custom modeltraining, scientific computing. Het is een lineaire curve: meer betalen, meer rekenkracht.

Mens-curve: meer effectieve mensuren

Een goed ingerichte agent vermenigvuldigt wat een mens kan doen. Mail-triage die anders een halve fte kostte wordt in tien procent van de tijd gedaan, met een mens die alleen nog de uitzonderingen beoordeelt. Dit is een veel steilere curve: kleine compute-uitgave, grote impact op effectieve mensuren.

/ 03Beslismodel

Het beslismodel

Een eenvoudig model dat we in elk intake-gesprek hanteren:

Situatie	Beste antwoord
Werkproces met veel routine mailwerk, repeat-vragen of standaard-prepwerk	Agents op normale compute
Documenten doorzoeken voor antwoorden met bronverwijzing	Agents plus RAG op normale compute
Image- of video-generatie als kerntaak	Managed GPU
Batch-transcriptie van veel audio-uren	Managed GPU voor de batch, agents voor de orkestratie
Lokale verwerking van strikt-vertrouwelijke data (sectorale eis)	Eigen hardware
Custom modeltraining op eigen data (specifiek)	Managed GPU voor training, daarna API of self-host voor inferentie

Beslismodel · welk antwoord past bij welk werkproces

/ 04Voorbeelden

Drie praktijkvoorbeelden

Voorbeeld 1: installateurspartij

Werkproces: monteurs op locatie, support-mail en offerte-prepwerk. Vraag: "Hoeveel GPU's?" Antwoord: nul eigen GPU's nodig. Agents bovenop een RAG op productdocumentatie op API-compute. Total cost-of- ownership in vergelijking met een eigen GPU-cluster ongeveer twintig keer lager voor hetzelfde werkproces.

Voorbeeld 2: marketingbureau

Werkproces: image-generatie in brand-stijl voor klanten. Vraag: "Hoeveel GPU's?" Antwoord: managed GPU, want image-generatie is compute-intensief en de business-case ondersteunt het. Hier is de compute-curve relevant. Agents-laag bovenop is wel zinvol voor orkestratie en brand-consistentie.

Voorbeeld 3: zorgorganisatie

Werkproces: dossier-vragen door interne kenniswerkers, strikte privacy. Vraag: "Hoeveel GPU's?" Antwoord: managed GPU of eigen hardware, gemotiveerd door de privacy-eisen. Agents-laag bovenop levert het meeste op, maar de compute-keuze wordt gedreven door compliance, niet door volume.

MKB CASES · NORMALE COMPUTE

EIGEN AGENTS LIVE

COMPUTE-AANDEEL IN COST

SERVERS LOKAAL+CLOUD

Eigen MKB Compute praktijk · stand 2026-06

Voor het volledige dossier over AI capaciteit, zie ons pillar-artikel AI capaciteit en compute voor Nederlandse bedrijven. Voor de bredere context van werkplek-implementatie: AI-werkplek voor het Nederlandse MKB.

De vraag achter de vraag

De twee curves van capaciteit

Compute-curve: meer rekenkracht

Mens-curve: meer effectieve mensuren

Het beslismodel

Drie praktijkvoorbeelden

Voorbeeld 1: installateurspartij

Voorbeeld 2: marketingbureau

Voorbeeld 3: zorgorganisatie

Plan een capaciteits-gesprek van 30 minuten. Binnen 24 uur reactie.

Meer uit AI capaciteit en compute.

AI capaciteit en compute voor Nederlandse bedrijven

Private Document AI voor het Nederlandse MKB

AI-werkplek voor het Nederlandse MKB