Ionica Smeets

Hoogleraar wetenschapscommunicatie – Universiteit Leiden

  • Het was een mooie nazomerdag in 2012. Mijn moeder en ik zaten in een parkje in Zwolle, mijn zoon van 1,5 scharrelde om ons heen om steentjes te verzamelen. De avond ervoor had ik mijn moeder meegenomen naar de Librije – om nog één keer heel lekker te eten voor zij aan haar chemokuren begon. Ze had borstkanker en haar borst was eerder die zomer weggehaald. Dat was verbazingwekkend soepel gegaan, mijn moeder lag na de operatie grapjes makend in het ziekenhuisbed. En toen de arts een paar dagen later belde om te zeggen dat ze snel een beha moest dragen om te voorkomen dat het gewicht van haar andere borst aan de wond zou trekken, moest ze schaterlachen. Een van de voordelen van een kleine cup A was dat je borst niet zo snel een hinderlijk gewicht werd.

    We waren optimistisch die zonnige dag in Zwolle. Die chemo zou niet leuk worden, maar mijn moeder was net 56 en heel gezond (op die stomme kanker na). Ze zou er vast goed uitkomen. Dat viel tegen. Mijn moeder kreeg tijdens de chemokuren naast alle nare lichamelijke bijwerkingen ook enorme angstaanvallen. De oncoloog zei doodleuk dat zij er was voor het bestrijden van de kanker en niet voor hoe de patiënt zich voelde. Pas jaren later hoorden we dat die angstaanvallen waarschijnlijk een bijwerking waren van medicijnen die ze tijdens de chemo kreeg. Mijn moeder maakte de kuur af – op haar tandvlees. De kanker leek weg, maar ze had veel ingeleverd en de angsten bleven. Ze moest stoppen met haar werk in haar zo geliefde boekhandel. Logeerpartijen van mijn zoon bleken al snel te vermoeiend. Veel vakanties en mooie plannen werden afgeblazen omdat het te zwaar was.

    Maar mijn moeder was er nog en ze maakte volop mooie plannen, ook al zouden die misschien niet allemaal lukken. Ze krabbelde op en 2017 was zowaar een echt goed jaar. Daarna kreeg ze steeds meer vage klachten. Mijn moeder probeerde de ene therapie na de andere – want dit was volgens haar artsen vast iets psychisch. Ze kreeg ook steeds vaker rugpijn – maar dat was vast spanning.

    Tijdens de intelligente lockdown dit voorjaar werd die rugpijn steeds erger. Ik zag hoe mijn moeder vocht tegen tranen van de pijn als ze via Skype haar kleinkinderen voorlas. Ze kreeg steeds meer pijnstillers en zonder dat ze een arts had gezien zat ze op een gegeven moment aan de morfine. Desondanks had ze nog steeds pijn. In juni kon er eindelijk een MRI-scan gemaakt worden. En toen zaten er overal in haar rug uitzaaiingen. De kanker was terug; en waarschijnlijk al een hele tijd. Genezen kon niet meer, hooguit een beetje tijd rekken en de pijn stillen. Inmiddels heeft mijn moeder gekozen voor een palliatief traject: geen behandelingen meer, maar zo goed mogelijk de laatste tijd beleven met degenen die haar lief zijn.

    Ze werd deze augustus 64 en dat is het lievelingsgetal van mijn inmiddels 9-jarige zoon. Mijn moeder gaf hém bij haar verjaardag een schilderijtje dat ze had gemaakt van de steentjes die hij in 2012 in Zwolle verzamelde – al die jaren had zij die liefdevol bewaard. De steentjes vormen het getal 64 als een letterlijk tastbare herinnering aan zijn oma. Zijn lievelingsgetal en waarschijnlijk haar eindpunt. En nu denk ik bij elke 64 die ik zie aan mijn fantastische moeder, mijn zoon, die steentjes en hoe volkomen oneerlijk het leven kan zijn.

    Deze column verscheen op 25 september 2020 in de Volkskrant.

  • Een beruchte denkfout is het onterecht leggen van een verband tussen twee dingen die door hetzelfde veroorzaakt worden. Een klassiek voorbeeld is het verband tussen ijsverkoop en verdrinkingen. Hoe meer ijs er gekocht wordt, hoe meer mensen er verdrinken. Dat komt natuurlijk niet doordat ijs levensgevaarlijk is voor zwemmers. Warm weer veroorzaakt zowel meer behoefte aan ijs als meer zwempartijen en dus verdrinkingen.

    Deze zomer leerde ik dat de omgekeerde denkfout ook bestaat: het onterecht leggen van een verband tussen twee dingen doordat die allebei hetzelfde veroorzaken. Dit klinkt tegen-intuïtief, maar een getallenvoorbeeld laat zien hoe dit kan.

    Stel dat een op de tien mensen de longziekte Argh heeft en een op de vijf de ellendige buikgriep Barf. De twee ziekten zijn onafhankelijk van elkaar en daarmee heeft dus een op vijftig mensen zowel Argh als Barf. In de totale bevolking heb je dus 2 procent mensen met zowel Argh als Barf, 8 procent met alleen Argh, 18 procent met alleen Barf en 72 procent geluksvogels met geen van beide.

    Zowel Argh als Barf veroorzaakt extra doktersbezoeken. Waar slechts 5 procent van de mensen zonder deze ziekten hun huisarts bezoekt, gaat 10 procent van de mensen met Argh en/of Barf naar hun dokter.

    Vervolgens besluiten artsen om data over Argh en Barf te analyseren, waarbij ze kijken naar de gegevens van alle mensen die langskomen.
    stethoscoop
    In een groep van 100.000 mensen die zich keurig volgens de statistieken gedragen (en dat doen ze, want dit is een hypothetisch voorbeeld) zijn dat 200 mensen met zowel Argh als Barf, 800 met alleen Argh, 1.800 met alleen Barf en 3.600 mensen die geen Argh en ook geen Barf hebben.

    Een nieuwsgierige arts onderzoekt of Barf beschermt tegen Argh. Van de in totaal 1.000 patiënten met Argh hebben er 200 ook Barf: dat zijn er (precies zoals in de hele bevolking) een op de vijf. Maar van de in totaal 5.400 patiënten zonder Argh die naar de dokter komen, hebben er 1.800 Barf: dat zijn er dus één op drie. Kortom: deze arts zou uit haar data kunnen concluderen dat mensen met Argh blijkbaar minder kans hebben om ook Barf te krijgen. Terwijl dat niet zo is, artsen zien mensen die Argh noch Barf hebben domweg minder vaak.

    Deze vorm van selectiebias waarbij twee groepen allebei meer kans hebben om geselecteerd te worden en zo schijnverbanden opleveren, heet ook wel Berkson’s paradox, of collider bias.

    Dit verschijnsel duikt in allerlei vormen op. Wiskundige Jordan Ellenberg beschreef ene Alex die alleen uitgaat met mannen waarvan de aardigheid plus de knapheid boven een zeker minimum ligt. Alex zou dan het gevoel kunnen krijgen dat knappe mannen minder aardig zijn, ook als er in het algemeen geen enkel verband is tussen aardigheid en knapheid. Iets soortgelijks kan gelden voor mooie of zeldzame voorwerpen die op een veiling komen of bij Amerikaanse universiteiten die studenten werven die goed zijn in sport of studeren. Veel voorbeelden van dit verschijnsel komen uit de medische hoek, waar gewerkt wordt met data van patiënten in plaats van de hele bevolking.

    En socioloog Tim Morris waarschuwde onlangs dat deze fout een grote bananenschil is waarover veel coronastudies kunnen uitglijden. Argh.

    Deze column verscheen op 21 augustus 2020 in de Volkskrant.

  • Deze week een klassiek raadsel dat, zoals zo vaak bij wiskunde, van toepassing blijkt op de actualiteit.

    In een vijver groeit een bijzondere waterlelie. Deze plant verdubbelt elke dag in grootte. Na vierentwintig dagen is de vijver helemaal bedekt met lelies. Op welke dag is de helft van de vijver bedekt?

    Intuïtief denken veel mensen aan ‘twaalf dagen’ als antwoord. Het gaat over vierentwintig dagen, dus de helft zal dan wel twaalf zijn. Maar het woord verdubbelen geeft het eigenlijk al weg: als de plant zich elke dag verdubbelt, dan heb je met een halfvolle vijver op dag drieëntwintig een compleet bedekte vijver op dag vierentwintig. Dus juiste antwoord is: na drieëntwintig dagen.

    waterlelie

    Weer dezelfde vijver en diezelfde waterlelie die elke dag in grootte verdubbelt waarbij na vierentwintig dagen het complete vijveroppervlak vol zit met waterlelie. Hoeveel procent van de vijver is op dag twaalf bedekt met waterlelies?

    Probeer hierbij eens snel een schatting te maken. Hoeveel procent denk je, zonder al te veel rekenen? Je weet uit de vorige vraag dat vijftig procent in elk geval niet het goede antwoord is.

    Je kunt dit stap voor stap terugrekenen, op dag tweeëntwintig zat je op 25%, de dag daarvoor op 12,5%. Enzovoorts, tot je ziet dat na twaalf dagen slechts 0,024% van het oppervlak van de vijver was bedekt. Ik durf te wedden dat de meeste lezers een stuk hoger zaten met hun eerste gok : deze zogenaamde exponentiële groei is behoorlijk lastig in te schatten.

    Stel je toch eens voor dat dit jouw vijver is. Je ziet op dag één een waterlelie, op dag twee zijn het er twee. Je maakt je geen zorgen. Dit gaat allemaal niet zo hard. Na twaalf dagen is nog 99,98% van je vijver keurig waterlelievrij. Je negeert de vijver ruim anderhalve week en als je weer eens gaat kijken, dan is alles overwoekerd.

    Weer dezelfde vijver, maar nu een waterlelie die elke dag met een factor drie in plaats van een factor twee groeit. Hoe lang duurt het nu voor de vijver helemaal bedekt is?

    Uit de vorige opgaven kun je te terugrekenen dat die eenzame eerste waterlelie 0,000012% van het wateroppervlak bedekt. Nu doe je dit per dag maal drie, dus op dag twee eindig je met 0,000036% bedekte vijver. Zo ga je door en op dag 15 is ruim 57% van de vijver bedekt en al op dag 16 raakt je vijver compleet vol.

    En dan nu de beloofde verbinding met de actualiteit: de berekeningen waar Angela Merkel naar verwees toen zij vorige week uitlegde hoe lastig het is om een goede exit-strategie te bepalen gaan over exponentiële groei als in de vijver (maar dan een stuk ingewikkelder). Merkel legde uit dat Duitsland nu op een besmettingsgetal van één zit, wat betekent dat elke corona-patiënt gemiddeld één iemand besmet en dat de epidemie beheersbaar is. Maar als je maatregelen versoepelt, dan gaat het besmettingsgetal misschien naar 1,1 wat zou betekenen dat het Duitse zorgsysteem in oktober overbelast raakt. Maar stijgt het besmettingsgetal naar 1,2, wat nauwelijks hoger klinkt, dan is het systeem al overbelast in juli.

    Dit soort berekeningen kun je ongetwijfeld ook maken voor Nederland. En de boodschap van Merkel is universeel: een goede exit-strategie luistert heel, heel nauw.

    Deze column verscheen op 24 april 2020 in de Volkskrant.

  • Toen ik las over de vraag of de belastingdienst gebruik heeft gemaakt van etnisch profileren en de discussie over hoe de overheid meer algoritmen kan gebruiken, dacht ik steeds aan zelfversterkende feedback-loops. En hoe daarmee kleine verschillen tussen groepen kunnen worden opgeblazen tot gapende kloven.

    Een fictief voorbeeld. In een ver land bestaat de bevolking uit twee even grote bevolkingsgroepen: de huffelpuffers en de ravenklauwen. Uit de statistieken blijkt dat de huffelpuffers verantwoordelijk zijn voor 51 procent van de misdaden en de ravenklauwen voor 49 procent. Uit nader onderzoek blijkt dat precies 51 procent van de huffelpuffers betrokken is bij criminele activiteiten, ­tegenover 49 procent van de ravenklauwen.

    De politie besluit een nieuw datagedreven beleid in te zetten om criminaliteit op te sporen. Ze gaan elke maand duizend mensen staande houden en controleren. Daarbij zullen ze steeds de criminaliteitscijfers van de vorige maand gebruiken om te bepalen wat de meest ­effectieve manier van controleren is. Zo profileren ze mooi de meest waarschijnlijke criminelen. In dit fictieve voorbeeld nemen we aan dat de criminaliteit onder de bevolkingsgroepen constant blijft en dat het herkennen van criminelen volkomen vlekkeloos verloopt.

    De politie begint met het feit dat 51 procent van de misdrijven gepleegd is door huffelpuffers en 49 procent door ravenklauwen. Die eerste maand houdt de politie daarom 510 huffelpuffers staande – waarvan 51 procent crimineel is, dat levert afgerond 260 misdadigers. Er worden daarnaast 490 ravenklauwen gecontroleerd, daarvan is 49 procent crimineel, dat geeft afgerond 240 misdadigers.

    ‘Zie je wel’, concludeert de politie: ‘Onze methode werkt als een tierelier – we zien dat de afgelopen maand zelfs 52 procent van de 500 gevonden criminelen een huffelpuffer was.’ De volgende maand worden er daarom 520 huffelpuffers en 480 ravenklauwen gecontroleerd. Hoppa, die maand blijkt zelfs 53 procent van de gevonden misdadigers een huffelpuffer.

    Als dit systeem gestaag zo door blijft werken, wordt na twee jaar 73 procent van de criminaliteit toegeschreven aan huffelpuffers. Binnen vijf jaar is dat 90 procent en na zeven jaar worden er per maand nog slechts een stuk of dertig ravenklauwen gecontroleerd tegen zo’n 970 huffelpuffers.

    De groep die bij invoering van het nieuwe systeem ietsje crimineler is, heeft net ietsje meer kans om gecontroleerd te worden. Waardoor ze ietsje vaker in de statistieken opduiken, waardoor ze iets vaker worden staande gehouden. Enzovoort: dit is een zelfversterkende feedback-loop. Terwijl het werkelijke verschil in criminaliteit tussen de twee groepen al die tijd een schamele twee procentpunt blijft: 51 versus 49.

    Nu is dit een fictief voorbeeld. Maar we kennen helaas tal van echte voorbeelden waarbij zelfversterkende feedback-loops verwoestende gevolgen hadden. Cathy O’ Neill geeft in Weapons of Math Destruction een deprimerend overzicht. En laatst zag ik een grafiek voorbijkomen met daarin welke voetgangers de politie in New York staande houdt op basis van ‘redelijke verdenking’. Van elke duizend zwarte jongens van 20 worden er jaarlijks ongeveer 950 staandegehouden. Bij witte jongens van dezelfde leeftijd waren dat er ongeveer 175 van elke duizend. Toen vroeg ik me af hoe fictief mijn voorbeeld precies was.

    Deze column verscheen op 21 juni 2019 in de Volkskrant.