© h.hofstede (h.hofstede@hogeland.nl)

Linear Mixed Models
       
Stel dat je een heleboel meetgegevens hebt die je zou kunnen groeperen.
Bijvoorbeeld:  je hebt van 5 artsen gegevens van een aantal van hun patiënten. Bijvoorbeeld over hun bloeddruk en hun rookgewoonten.
Dan zou je die patiëntgegevens in vijf groepen kunnen verdelen. Zoiets:
       

       
Hoe moet je die gegevens dan analyseren? Hoe ontdek je verband tussen bloeddruk en rookgewoonten?

Je kunt natuurlijk gewoon alle metingen als losse gevallen bekijken en helemaal geen rekening houden met de artsen. Maar ja, dan mis je misschien wel een aantal factoren. Het zou kunnen dat er verschil is tussen de artsen. Bijvoorbeeld dat de ene arts veel moeilijkere patiënten krijgt dan de andere. Of dat de ene arts een longarts is en de andere een internist.  Of dat de ene arts gewoon veel beter is dan de andere... Noem maar op.... 

Je zou ook simpelweg van elke groep het gemiddelde kunnen nemen, en dan die gemiddelden met elkaar vergelijken. Maar ja, dat betekent dat je in wezen nog maar vijf  "meetpunten" overhoudt. Je vergelijkt dan in feite de vijf artsen met elkaar. Zo gaat er bovendien wel erg veel informatie verloren.

Je zou ook alleen naar correlatie in de afzonderlijke groepen kunnen gaan zoeken. Dus dat je alleen binnen een groep naar verbanden zoekt. Maar ja, dan gebruik je weer niet de informatie uit de andere groepen. Bovendien zouden sommige groepen erg klein kunnen zijn.

"Linear Mixed Model" is een manier om gegevens te analyseren die een beetje een combinatie is van de drie bovenstaande methodes. Dat kan af en toe best verrassende resultaten opleveren.  Bij een onderzoek tussen rookgewoonten en bloeddruk zou je zo'n soort puntenwolk kunnen krijgen:
       

       
Binnen elke artsgroep vind je een negatieve correlatie tussen rookhoeveelheid en bloeddruk, maar over het geheel is er een positieve correlatie!
De theorie van de linear mixed models probeert met beide effecten rekening te houden.
       

© h.hofstede (h.hofstede@hogeland.nl)