AI capaciteit huren: wanneer GPU's en wanneer agents
Het belangrijkste beslismoment in AI capaciteit: vermenigvuldig je compute of vermenigvuldig je mensen. Een eerlijk beslismodel voor MKB.
/ KORT GEZEGD
Het belangrijkste beslismoment in AI capaciteit: vermenigvuldig je compute of vermenigvuldig je mensen. Een eerlijk beslismodel voor MKB.
Onderdeel van
AI capaciteit en computeSPOKE/AI CAPACITEIT
PUBLICATIE·6 JUNI 2026
De vraag "wat kost AI capaciteit per uur" is bijna altijd een verkeerde vraag. De juiste vraag is: "Wat probeer ik op te schalen, mijn compute of mijn mensen?" Dit artikel beschrijft het beslismodel dat wij in intake-gesprekken hanteren. Geen technologische framing, een operationele.
/ 01Vraag
De vraag achter de vraag
Bij elke vraag "hoeveel GPU's hebben we nodig" zit een werkproces dat de directeur sneller of beter wil maken. Voordat we het over GPU's hebben, willen we dat werkproces eerst kennen. Vaak is het antwoord ontnuchterend: "we willen sneller op support reageren" of "ons verkoopteam loopt achter op offerte-prepwerk". Daar lost geen GPU iets aan op. Daar lost een agent-architectuur iets aan op, vaak op bestaande API-compute.
Wat probeer je op te schalen, je compute of je mensen?De eerste vraag in elk capaciteit-gesprek
/ 02Curves
De twee curves van capaciteit
Er zijn twee manieren waarop AI capaciteit oplevert. Ze hebben heel andere economische profielen.
Compute-curve: meer rekenkracht
Meer GPU's of zwaardere modellen leveren meer rekenkracht per seconde. Dit helpt bij workloads die rekenintensief zijn: video- of beeld-generatie, batch-transcriptie, custom modeltraining, scientific computing. Het is een lineaire curve: meer betalen, meer rekenkracht.
Mens-curve: meer effectieve mensuren
Een goed ingerichte agent vermenigvuldigt wat een mens kan doen. Mail-triage die anders een halve fte kostte wordt in tien procent van de tijd gedaan, met een mens die alleen nog de uitzonderingen beoordeelt. Dit is een veel steilere curve: kleine compute-uitgave, grote impact op effectieve mensuren.
/ 03Beslismodel
Het beslismodel
Een eenvoudig model dat we in elk intake-gesprek hanteren:
| Situatie | Beste antwoord |
|---|---|
| Werkproces met veel routine mailwerk, repeat-vragen of standaard-prepwerk | Agents op normale compute |
| Documenten doorzoeken voor antwoorden met bronverwijzing | Agents plus RAG op normale compute |
| Image- of video-generatie als kerntaak | Managed GPU |
| Batch-transcriptie van veel audio-uren | Managed GPU voor de batch, agents voor de orkestratie |
| Lokale verwerking van strikt-vertrouwelijke data (sectorale eis) | Eigen hardware |
| Custom modeltraining op eigen data (specifiek) | Managed GPU voor training, daarna API of self-host voor inferentie |
/ 04Voorbeelden
Drie praktijkvoorbeelden
Voorbeeld 1: installateurspartij
Werkproces: monteurs op locatie, support-mail en offerte-prepwerk. Vraag: "Hoeveel GPU's?" Antwoord: nul eigen GPU's nodig. Agents bovenop een RAG op productdocumentatie op API-compute. Total cost-of- ownership in vergelijking met een eigen GPU-cluster ongeveer twintig keer lager voor hetzelfde werkproces.
Voorbeeld 2: marketingbureau
Werkproces: image-generatie in brand-stijl voor klanten. Vraag: "Hoeveel GPU's?" Antwoord: managed GPU, want image-generatie is compute-intensief en de business-case ondersteunt het. Hier is de compute-curve relevant. Agents-laag bovenop is wel zinvol voor orkestratie en brand-consistentie.
Voorbeeld 3: zorgorganisatie
Werkproces: dossier-vragen door interne kenniswerkers, strikte privacy. Vraag: "Hoeveel GPU's?" Antwoord: managed GPU of eigen hardware, gemotiveerd door de privacy-eisen. Agents-laag bovenop levert het meeste op, maar de compute-keuze wordt gedreven door compliance, niet door volume.
0%
MKB CASES · NORMALE COMPUTE
0+
EIGEN AGENTS LIVE
0%
COMPUTE-AANDEEL IN COST
0
SERVERS LOKAAL+CLOUD
Voor het volledige dossier over AI capaciteit, zie ons pillar-artikel AI capaciteit en compute voor Nederlandse bedrijven. Voor de bredere context van werkplek-implementatie: AI-werkplek voor het Nederlandse MKB.
OVER DE AUTEURS
Milan de Romijn
Oprichter
Bouwt en runt MKB Compute samen met Tom. Verantwoordelijk voor operations, agent-orkestratie en klant-implementatie.
VOLGENDE STAP/AI CAPACITEIT
Plan een capaciteits-gesprek van 30 minuten. Binnen 24 uur reactie.
We luisteren naar je workload, schetsen welke laag het meest oplevert en geven een eerlijke kosten-inschatting.
VERDER LEZEN IN HETZELFDE DOSSIER
Meer uit AI capaciteit en compute.
PILLAR·23 min
AI capaciteit en compute voor Nederlandse bedrijven
Waarom 'AI capaciteit' niet alleen GPU's is, hoe agents en workflow daarbij horen, en hoe je voor jouw werkload kiest tussen API, managed GPU of eigen hardware.
Lees verder →PILLAR·22 min
Private Document AI voor het Nederlandse MKB
Wat het is, wanneer het loont, hoe je het AVG-bewust opzet en wat het in de praktijk oplevert. Een gestructureerd dossier voor beslissers.
Lees verder →PILLAR·21 min
AI-werkplek voor het Nederlandse MKB
Wat een AI-werkplek precies is, in welke vier vormen je hem tegenkomt, hoe je build versus managed kiest en wat hij in 7, 30 en 90 dagen oplevert.
Lees verder →