Dit is waarom een correlatie nog geen causaliteit is

This post is also available in Engels.

Wat hebben de uitgaven van de VS aan wetenschap, ruimte en technologie te maken met de hoeveelheid zelfmoorden door ophanging, wurging en verstikking? Helemaal niets natuurlijk, behalve dan dat ze met een score van 99.79% bijna perfect met elkaar correleren. Dit is een mooi voorbeeld van een ‘neppe’ (of spurious) correlatie: Een sterk verwant patroon tussen twee of meer variabelen die verder niet causaal aan elkaar gerelateerd zijn, oftewel niet oorzaak en gevolg van elkaar zijn.

Twee variabelen die sterk met elkaar geassocieerd zijn hoeven niet *causaal* gerelateerd te zijn (verkregen via http://www.tylervigen.com/spurious-correlations; CC BY 4.0)

Nou is het in dit voorbeeld misschien nog wel redelijk duidelijk dat het om een betekenisloze relatie gaat. In de wetenschap zijn er echter ook voorbeelden te vinden van correlaties die makkelijker onterecht als causaal geïnterpreteerd kunnen worden (zie bijvoorbeeld ‘Bewijs dat zwarte-koffiedrinkers psychopaten zijn’). Hoe kunnen we dan wél causaliteit onderzoeken in de wetenschap?

Correlationeel vs. experimenteel onderzoek

Het is misschien verleidelijk om te denken dat je met geavanceerdere statistische methodes causaliteit kan afleiden, maar dit is niet het geval. Als we willen weten of psychopathische symptomen worden veroorzaakt door het drinken van zwarte koffie, moeten we kijken naar de opzet van een studie waarmee we deze relatie onderzoeken.

Grofweg zijn er twee soorten onderzoeken: correlationeel en experimenteel. Alleen in een experimenteel onderzoek kan er worden gesproken van causaliteit en dit zit hem met name in twee aspecten: manipulatie (door middel van een interventie) en randomisatie.

Ik zal dit verduidelijken aan de hand van het ‘zwarte koffie veroorzaakt psychopathie’ onderzoek.

Om dit verband experimenteel te onderzoeken moet er eerst sprake zijn van manipulatie. Dit houdt in dat we (gedurende een lange tijd) de psychopathische symptomen van twee groepen proefpersonen meten, terwijl de ene groep elke dag zwarte koffie drinkt en de andere groep iets anders, bijvoorbeeld thee. Door slechts een enkele factor (in dit geval wat de proefpersoon drinkt) te manipuleren kunnen we zekerder zijn dat verschillen in psychopathie te wijten zijn aan het drinkgedrag. Het is hierbij echter belangrijk dat alle andere factoren (bijv. eigenschappen van de proefpersonen zoals leeftijd en geslacht) hetzelfde zijn voor de twee groepen.

Nou zou je voor dit experiment simpelweg proefpersonen kunnen rekruteren die al aangeven dat ze alleen zwarte koffie of thee drinken, maar dan loop je het risico dat andere factoren mee gaan spelen: misschien zijn zwarte-koffiedrinkers vaker mannen en scoren mannen toevallig gemiddeld hoger op psychopathie.

Om hiervoor te controleren moet er daarom sprake zijn van randomisatie. Proefpersonen moeten vooraf willekeurig worden ingedeeld in een van de twee groepen. Zo kunnen we de invloed van derde variabelen (zoals geslacht) beter uitsluiten.

Praktische haalbaarheid

In een ideaal experiment controleren wij al deze factoren en omstandigheden die invloed kunnen hebben op de uitkomst van het experiment. Om het bovenstaande voorbeeld perfect uit te voeren zouden we bijvoorbeeld de volledige voedsel- en drankinname van beide groepen moeten controleren. Je snapt dat dit praktisch en ethisch gezien niet altijd haalbaar is. Sterker nog, sommige factoren zijn überhaupt niet te manipuleren. Stel je voor dat het lactose-intolerantie zou zijn dat psychopathie veroorzaakt. Om dit te onderzoeken zouden we daarom mensen willekeurig lactose-intolerant moeten maken, maar dit kan natuurlijk niet. We moeten daarom accepteren dat het achterhalen van causaliteit niet altijd mogelijk is, en dat correlationeel onderzoek een belangrijk onderdeel van de wetenschap is.

Sterker nog; juist correlaties worden in de cognitieve neurowetenschap veel gebruikt (bijvoorbeeld om de relatie tussen hersenactiviteit en gedrag te onderzoeken) en kunnen (indien correct toegepast) leiden tot nieuwe inzichten die worden gebruikt om theorieën aan te scherpen en voorspellingen te doen. Die correlaties zijn dus zo slecht nog niet.

Originele taal: Nederlands

Auteur: Felix Klaassen
Buddy: Eva Klimars
Editor: Jill Naaijen
Vertaler: Wessel Hieselaar
Editor vertaling: Christienne Gonzales Damatac

Credit: Uitgelichte afbeelding verkregen van Lukas via Pexels

Felix Klaassen

+ posts

Tags: Wetenschap

Dit is waarom een correlatie nog geen causaliteit is

Correlationeel vs. experimenteel onderzoek

Praktische haalbaarheid

Felix Klaassen

Geef een reactie Reactie annuleren

Categories

Donders Wonders