AI in de zorg faalt niet door te weinig data, maar door te weinig structuur. Zo helpt toegepaste statistiek, zoals bij WUR, om zorg-AI echt betrouwbaar te maken.
Waarom slimme statistiek onmisbaar is voor AI in de zorg
Zo’n 90% van alle medische data is pas de laatste paar jaar ontstaan. Huisartsensystemen, EPD’s, wearables, beeldvorming, genetische data: zorginstellingen zwemmen in de informatie, maar halen er vaak maar een fractie uit. Juist daar schuift iemand als prof. dr. Carel Peeters, nieuw hoogleraar Toegepaste Statistiek aan Wageningen University & Research (WUR), aan tafel.
Hij werkt formeel in de agri-food context, maar de statistische problemen waar hij zich op richt – kleine aantallen patiënten, maar duizenden variabelen – zijn één-op-één herkenbaar in de Nederlandse zorg. Wie serieus werk wil maken van AI in de gezondheidszorg, kan niet om dit soort statistiek heen.
In deze blog laat ik zien:
- waarom de curse of dimensionality een dagelijkse realiteit is in ziekenhuizen,
- hoe de aanpak van Peeters direct toepasbaar is op zorgdata,
- wat zorgorganisaties nú kunnen doen om statistiek en AI beter te laten samenwerken,
- en waarom inclusieve opleidings- en onderzoekscultuur hierin het verschil maakt.
De echte bottleneck van AI in de zorg: niet data, maar structuur
De kern: niet het gebrek aan data remt AI in de zorg, maar een gebrek aan begrip van de onderliggende structuur in die data.
Peeters verwoordt het scherp:
“Data may be complex, but the insights should remain clear.”
In de zorg ziet dat er zo uit:
- Je hebt relatief weinig patiënten voor een specifieke aandoening of zeldzame ziekte.
- Voor elke patiënt heb je ontzettend veel variabelen: laboratoriumwaarden, medicatiegeschiedenis, beeldvorming, vragenlijsten, genetische markers, leefstijlfactoren.
- Je wilt met AI betere beslissingen ondersteunen: diagnose, triage, risico-inschatting, behandelkeuze, capaciteit in het ziekenhuis.
Dat leidt direct tot de beruchte curse of dimensionality: hoe meer variabelen, hoe lastiger het wordt om betrouwbare patronen te vinden. In de praktijk betekent dat:
- modellen die op papier 95% nauwkeurig zijn, maar in de kliniek compleet door het ijs zakken;
- systemen die wél goed scoren in een onderzoeksdataset, maar falen bij een ander ziekenhuis of een andere populatie;
- AI-modellen die zo ingewikkeld zijn dat geen enkele arts ze nog vertrouwt.
De aanpak waar Peeters zich op richt – complexe, hoog-dimensionale data terugbrengen tot heldere, interpreteerbare structuren – is precies wat Nederlandse zorg nodig heeft.
Van vloek naar voordeel: wat toegepaste statistiek toevoegt aan zorg-AI
De boodschap is eenvoudig: AI werkt pas echt goed in de zorg als de statistiek eronder klopt. Toegepaste statistiek maakt van die ‘vloek’ van veel variabelen juist een voordeel.
1. Beter ontwerpen en beoordelen van AI-modellen
Peeters richt zich op het kiezen van passende methoden voor datasets met veel variabelen en weinig observaties. Voor de zorg betekent dat bijvoorbeeld:
- kiezen tussen verschillende neurale netwerken, maar óók durven concluderen dat een eenvoudiger model beter is;
- gebruikmaken van technieken als regularisatie, dimensionale reductie en Bayesiaanse methoden om overfitting te beperken;
- eerlijk inschatten hoe goed een model echt presteert bij kleine patiëntgroepen.
Concreet voorbeeld:
- Bij een zeldzame aandoening heb je misschien 150 patiënten en 5.000 variabelen.
- Een standaard deep-learningmodel lijkt fantastisch te presteren.
- Een goede statisticus zal kritisch kijken naar validatie, onzekerheid en generaliseerbaarheid.
- Vaak blijkt: een simpeler model met goede onzekerheidsschattingen helpt de arts beter dan ‘slimme’ black box AI.
2. Betrouwbare voorspellende modellen voor gepersonaliseerde zorg
Wie aan gepersonaliseerde behandeling werkt – bijvoorbeeld in oncologie of cardiologie – herkent dit: kleine aantallen, grote datatabellen.
De statistische vragen zijn dan:
- Welke van de duizenden variabelen dragen écht bij aan de voorspelling van uitkomst X?
- Hoe combineren genetica, leefstijl en behandeling tot een betrouwbaar risicoprofiel?
- Hoe groot is de onzekerheid rond een individuele voorspelling bij één patiënt?
Bayesiaanse statistiek, waar Peeters in promoveerde, is hier bijzonder sterk in. Die maakt het mogelijk om:
- vooraf bestaande medische kennis expliciet te verwerken in het model;
- onzekerheid niet weg te poetsen, maar zichtbaar te maken en te communiceren;
- beslissingen te ondersteunen op basis van kansen en scenario’s, in plaats van absolute waarheden.
Voor AI in de zorg betekent dit meer beslissteun en minder blind vertrouwen op een enkel getal.
3. Complexe interacties ontrafelen: van GxExM naar patiënt x omgeving x zorgpad
Binnen WUR werkt Peeters’ collega Fred van Eeuwijk aan het modelleren van Genotype x Environment x Management (GxExM) interacties bij planten: hoe erfelijke eigenschappen, omgeving en teelt samen gedrag bepalen.
Dat klinkt agrarisch, maar inhoudelijk is het bijna identiek aan de zorgvraag:
- Patiënt (genetica, comorbiditeit)
- Omgeving (sociaal, leefstijl, woonplaats)
- Zorgpad (behandeling, timing, organisatie)
Gevorderde statistische modellen kunnen precies dit soort meervoudige interacties zichtbaar maken:
- waarom therapie A bij patiëntgroep 1 wel werkt en bij groep 2 niet;
- hoe wijk, inkomen of opleidingsniveau subtiel, maar aantoonbaar effect hebben op uitkomsten;
- welke combinaties van interventies bij kwetsbare ouderen echt verschil maken.
Voor AI-systemen in de zorg betekent dit dat ze niet alleen een ‘gemiddelde patiënt’ voorspellen, maar recht doen aan diversiteit en context.
Wat zorginstellingen kunnen leren van Biometris en Peeters’ rol
De manier waarop Peeters zijn leerstoel invult, is een blauwdruk voor hoe zorgorganisaties statistiek en AI kunnen organiseren.
Een open, multidisciplinaire onderzoekscultuur
Bij Biometris (de groep Toegepaste Wiskunde & Statistiek van WUR) ligt de nadruk op samenwerking en een open cultuur. Voor ziekenhuizen en UMC’s zie ik drie lessen:
- Zet statistici en data scientists structureel aan tafel bij ontwerp, uitvoering en evaluatie van AI-projecten, niet alleen ‘voor de analyse achteraf’.
- Werk multidisciplinair: artsen, verpleegkundigen, data scientists, IT en bestuur in één team, met ruimte voor tegengeluid.
- Organiseer langlopende onderzoekslijnen, niet alleen losse pilots. AI-projecten in de zorg stranden vaak na een pilot juist omdat die structurele basis ontbreekt.
Onderwijs als sleutel: artsen en verpleegkundigen moeten beter met data kunnen werken
Peeters benadrukt dat studenten niet alleen moeten kunnen rekenen, maar vooral problemen leren analyseren en oplossen. Dat geldt net zo goed voor coassistenten, AIOS en verpleegkundig specialisten.
Wat werkt in de zorg:
- onderwijs waarin echte patiëntcases worden gecombineerd met dataset-analyses;
- aandacht voor kritisch kijken naar AI-output: wanneer vertrouw je het, wanneer niet?;
- toetsvormen die meer lijken op de praktijk: in teams een casus uitwerken, onzekerheid bespreken, grenzen van een model benoemen.
Zorgorganisaties die hun professionals zo opleiden, hebben straks een groot voordeel:
AI wordt niet ‘iets van de IT-afdeling’, maar een gedeeld instrument in het hele zorgteam.
Inclusieve statistiek en AI: waarom eerste-generatie studenten ertoe doen
Een opvallend aspect uit het profiel van Peeters: hij is eerstegeneratiestudent en zet zich actief in om die groep in de wetenschap te ondersteunen.
Voor AI in de Nederlandse zorg is dat geen detail, maar een randvoorwaarde:
- AI-modellen leren van historische data, en die data zitten vol sociaal bepaalde patronen en ongelijkheden.
- Als de teams die AI ontwikkelen vooral uit één bubbel komen, worden vooroordelen onbewust meegeprogrammeerd.
Door bewust ruimte te maken voor studenten en onderzoekers met uiteenlopende achtergronden, vergroot je de kans dat iemand vroegtijdig zegt:
- “Deze variabele (bijvoorbeeld postcode) lijkt sociaal-economische status te vangen, moeten we dat zo willen?”
- “Deze dataset mist bepaalde groepen patiënten, hoe corrigeren we daarvoor?”
Inclusiviteit in statistiek en AI is dus niet alleen ‘mooi meegenomen’, maar een voorwaarde voor eerlijke, veilige zorg-AI.
Praktische stappen voor zorgorganisaties die slimmer met data willen werken
De realiteit: je hebt als ziekenhuis, GGZ-instelling of VVT-organisatie geen Biometris in huis. Toch kun je vandaag al stappen zetten die aansluiten bij de aanpak van Peeters en zijn collega’s.
1. Begin klein, maar met de juiste vragen
Kies één concreet vraagstuk, bijvoorbeeld:
- heropnames op de cardiologieafdeling verminderen;
- beter voorspellen welke oudere patiënten baat hebben bij revalidatie;
- wachttijd op de SEH slimmer managen.
Formuleer samen met een statisticus of data scientist:
- welke uitkomst je wilt voorspellen of verbeteren;
- welke variabelen daar waarschijnlijk iets mee te maken hebben;
- hoe je die data betrouwbaar en herhaalbaar verzamelt.
2. Organiseer statistische expertise structureel
- Als je die nog niet hebt: huur expliciet statistische expertise in, niet alleen ‘algemene’ data science.
- Richt een klein, stabiel data- en statistiekteam in dat alle AI-initiatieven ondersteunt.
- Leg vast dat elk AI-project een methodologisch verantwoordingsdocument krijgt: hoe is het model gebouwd, getest en gevalideerd?
3. Maak onzekerheid bespreekbaar in het zorgteam
AI en statistiek leveren nooit 100% zekerheid. Peeters’ Bayesiaanse achtergrond onderstreept dat we beter moeten worden in het denken in kansen.
- Laat modellen niet alleen een voorspelling geven, maar ook een mate van onzekerheid.
- Train zorgprofessionals om die onzekerheid mee te wegen in besluitvorming.
- Gebruik MDO’s en overdrachtsmomenten om AI-adviezen kritisch te bespreken: waarom zegt het model dit, en wat vinden wij ervan?
4. Investeer in datakwaliteit vóór je modellen gaat stapelen
Slimme AI kan slechte data niet ‘repareren’. Toegepaste statistiek begint bij betrouwbare, consistente data:
- eenduidige definities van variabelen (wat is precies een ‘heropname’?);
- consequent registreren in het EPD;
- procedures om ontbrekende of vreemde waarden op te sporen.
Wie hier in 2025 serieus in investeert, heeft in 2026–2027 een enorme voorsprong als AI-modellen volwassen worden.
Waarom deze leerstoel relevant is voor AI in de Nederlandse zorg
De benoeming van Carel Peeters tot hoogleraar Toegepaste Statistiek bij WUR lijkt misschien vooral relevant voor landbouw en agri-food. Maar inhoudelijk gaat het over precies dezelfde uitdaging waar de zorg mee worstelt: hoe maak je van complexe data heldere, betrouwbare inzichten die professionals echt helpen?
Voor iedereen die bezig is met AI voor Nederlandse zorg is de les helder:
- zonder stevige toegepaste statistiek blijven AI-projecten hangen in pilots en PowerPoints;
- met de juiste statistische basis worden kleine, complexe zorgdatasets een bron van vooruitgang in diagnose, ziekenhuismanagement en gepersonaliseerde behandeling.
De komende jaren bepalen we in Nederland of AI in de zorg vooral voor extra werk en frustratie zorgt, of juist voor betere beslissingen en meer regie voor professionals en patiënten. Organisaties die nu investeren in statistiek, inclusieve teams en onderwijs rond data en onzekerheid, staan straks vooraan.
De vraag is dus niet óf je statistische expertise nodig hebt, maar met wie je die gaat opbouwen – binnen je eigen organisatie of in samenwerking met partijen die hierin al jaren vooroplopen.