Spring naar inhoud
MKB Compute.
VELDVERSLAG9 min leestijd

AI capaciteit huren: wanneer GPU's en wanneer agents

Het belangrijkste beslismoment in AI capaciteit: vermenigvuldig je compute of vermenigvuldig je mensen. Een eerlijk beslismodel voor MKB.

6 juni 2026

/ KORT GEZEGD

Het belangrijkste beslismoment in AI capaciteit: vermenigvuldig je compute of vermenigvuldig je mensen. Een eerlijk beslismodel voor MKB.

SPOKE/AI CAPACITEIT

PUBLICATIE·6 JUNI 2026

De vraag "wat kost AI capaciteit per uur" is bijna altijd een verkeerde vraag. De juiste vraag is: "Wat probeer ik op te schalen, mijn compute of mijn mensen?" Dit artikel beschrijft het beslismodel dat wij in intake-gesprekken hanteren. Geen technologische framing, een operationele.

/ 01Vraag

De vraag achter de vraag

Bij elke vraag "hoeveel GPU's hebben we nodig" zit een werkproces dat de directeur sneller of beter wil maken. Voordat we het over GPU's hebben, willen we dat werkproces eerst kennen. Vaak is het antwoord ontnuchterend: "we willen sneller op support reageren" of "ons verkoopteam loopt achter op offerte-prepwerk". Daar lost geen GPU iets aan op. Daar lost een agent-architectuur iets aan op, vaak op bestaande API-compute.

Wat probeer je op te schalen, je compute of je mensen?
De eerste vraag in elk capaciteit-gesprek

/ 02Curves

De twee curves van capaciteit

Er zijn twee manieren waarop AI capaciteit oplevert. Ze hebben heel andere economische profielen.

Compute-curve: meer rekenkracht

Meer GPU's of zwaardere modellen leveren meer rekenkracht per seconde. Dit helpt bij workloads die rekenintensief zijn: video- of beeld-generatie, batch-transcriptie, custom modeltraining, scientific computing. Het is een lineaire curve: meer betalen, meer rekenkracht.

Mens-curve: meer effectieve mensuren

Een goed ingerichte agent vermenigvuldigt wat een mens kan doen. Mail-triage die anders een halve fte kostte wordt in tien procent van de tijd gedaan, met een mens die alleen nog de uitzonderingen beoordeelt. Dit is een veel steilere curve: kleine compute-uitgave, grote impact op effectieve mensuren.

/ 03Beslismodel

Het beslismodel

Een eenvoudig model dat we in elk intake-gesprek hanteren:

SituatieBeste antwoord
Werkproces met veel routine mailwerk, repeat-vragen of standaard-prepwerkAgents op normale compute
Documenten doorzoeken voor antwoorden met bronverwijzingAgents plus RAG op normale compute
Image- of video-generatie als kerntaakManaged GPU
Batch-transcriptie van veel audio-urenManaged GPU voor de batch, agents voor de orkestratie
Lokale verwerking van strikt-vertrouwelijke data (sectorale eis)Eigen hardware
Custom modeltraining op eigen data (specifiek)Managed GPU voor training, daarna API of self-host voor inferentie
Beslismodel · welk antwoord past bij welk werkproces

/ 04Voorbeelden

Drie praktijkvoorbeelden

Voorbeeld 1: installateurspartij

Werkproces: monteurs op locatie, support-mail en offerte-prepwerk. Vraag: "Hoeveel GPU's?" Antwoord: nul eigen GPU's nodig. Agents bovenop een RAG op productdocumentatie op API-compute. Total cost-of- ownership in vergelijking met een eigen GPU-cluster ongeveer twintig keer lager voor hetzelfde werkproces.

Voorbeeld 2: marketingbureau

Werkproces: image-generatie in brand-stijl voor klanten. Vraag: "Hoeveel GPU's?" Antwoord: managed GPU, want image-generatie is compute-intensief en de business-case ondersteunt het. Hier is de compute-curve relevant. Agents-laag bovenop is wel zinvol voor orkestratie en brand-consistentie.

Voorbeeld 3: zorgorganisatie

Werkproces: dossier-vragen door interne kenniswerkers, strikte privacy. Vraag: "Hoeveel GPU's?" Antwoord: managed GPU of eigen hardware, gemotiveerd door de privacy-eisen. Agents-laag bovenop levert het meeste op, maar de compute-keuze wordt gedreven door compliance, niet door volume.

0%

MKB CASES · NORMALE COMPUTE

0+

EIGEN AGENTS LIVE

0%

COMPUTE-AANDEEL IN COST

0

SERVERS LOKAAL+CLOUD

Eigen MKB Compute praktijk · stand 2026-06

Voor het volledige dossier over AI capaciteit, zie ons pillar-artikel AI capaciteit en compute voor Nederlandse bedrijven. Voor de bredere context van werkplek-implementatie: AI-werkplek voor het Nederlandse MKB.

OVER DE AUTEURS

Milan de Romijn

Oprichter

Bouwt en runt MKB Compute samen met Tom. Verantwoordelijk voor operations, agent-orkestratie en klant-implementatie.

VOLGENDE STAP/AI CAPACITEIT

Plan een capaciteits-gesprek van 30 minuten. Binnen 24 uur reactie.

We luisteren naar je workload, schetsen welke laag het meest oplevert en geven een eerlijke kosten-inschatting.