Samenvatting CSI Q7 Statistiek
Experimental design
Variantie: Een maat voor verschil. De som van de gekwadrateerde verschillen tov het
gemiddelde gedeeld door de vrijheidsgraden (n-1)
Verklaring van variantie > confounding kan optreden
Experiment: Minstens 2 groepen voor vergelijking > randomisatie (alleen toevallige verschillen tussen
groepen). Er wordt een systematisch verschil gemaakt door de onderzoeker > variantie is dus toe te
wijzen aan de manipulatie/interventie. Geen confounding. Confimatieve toetsing mogelijk.
Parallelle groepen design (zoals veel RCT’s) > meest simpele en gebruikte design.
2 groepen > two sample t test
Alternatieve flexibele/algemene methode:
Lineair model (regressiemodel): om passende lijn door een puntenwolk te trekken bv
Theoretisch: lineair verband, in de praktijk liggen de punten hier niet allemaal op.
Y = b0 + b1 * X b1=hellingshoek en b0 waar de lijn de y-as raakt.
Residu: Het verschil tussen de y-waarde van een punt en de y-waarde van de lijn bij die x-waarde.
De optimale lijn: residuen zo klein mogelijk.
De som van de residuen is nul dus het gemiddelde ook, want de lijn gaat door xgemiddeld,
ygemiddeld (positieve en negatieven waarden vallen tegen elkaar weg) > residuen kwadrateren en
optellen (je kijkt naar variantie in residuen) en je moet hier delen door n-2. Functie zo klein mogelijk,
afgeleiden op nul stellen. Zo krijg je formules voor b0 en b1 > residuvariantie wil je zo klein mogelijk
hebben (kleinere SE)
Het gaat over schattingen, want bij herhalen krijg je andere punten. Beta0 en beta1 zijn schatters
voor de populatie/ware waarde. Deze schatters zijn normaal verdeeld en hebben standaard error.
Lineaire model is erg flexibel voor continue uitkomsten.
Vb. Y = gewicht en X = 0 bij controle en 1 bij experimentele groep (discrete X)
Y = b0 + b1 * X + residu
Controlegroep: Y=b0 + residu (B0 is het gemiddelde van de personen in de controleconditie)
Experimentele groep: Y = b0 + b1 + residu (b0 + b1 is gemiddelde van de personen in de
experimentele conditie)
Experimental design
Variantie: Een maat voor verschil. De som van de gekwadrateerde verschillen tov het
gemiddelde gedeeld door de vrijheidsgraden (n-1)
Verklaring van variantie > confounding kan optreden
Experiment: Minstens 2 groepen voor vergelijking > randomisatie (alleen toevallige verschillen tussen
groepen). Er wordt een systematisch verschil gemaakt door de onderzoeker > variantie is dus toe te
wijzen aan de manipulatie/interventie. Geen confounding. Confimatieve toetsing mogelijk.
Parallelle groepen design (zoals veel RCT’s) > meest simpele en gebruikte design.
2 groepen > two sample t test
Alternatieve flexibele/algemene methode:
Lineair model (regressiemodel): om passende lijn door een puntenwolk te trekken bv
Theoretisch: lineair verband, in de praktijk liggen de punten hier niet allemaal op.
Y = b0 + b1 * X b1=hellingshoek en b0 waar de lijn de y-as raakt.
Residu: Het verschil tussen de y-waarde van een punt en de y-waarde van de lijn bij die x-waarde.
De optimale lijn: residuen zo klein mogelijk.
De som van de residuen is nul dus het gemiddelde ook, want de lijn gaat door xgemiddeld,
ygemiddeld (positieve en negatieven waarden vallen tegen elkaar weg) > residuen kwadrateren en
optellen (je kijkt naar variantie in residuen) en je moet hier delen door n-2. Functie zo klein mogelijk,
afgeleiden op nul stellen. Zo krijg je formules voor b0 en b1 > residuvariantie wil je zo klein mogelijk
hebben (kleinere SE)
Het gaat over schattingen, want bij herhalen krijg je andere punten. Beta0 en beta1 zijn schatters
voor de populatie/ware waarde. Deze schatters zijn normaal verdeeld en hebben standaard error.
Lineaire model is erg flexibel voor continue uitkomsten.
Vb. Y = gewicht en X = 0 bij controle en 1 bij experimentele groep (discrete X)
Y = b0 + b1 * X + residu
Controlegroep: Y=b0 + residu (B0 is het gemiddelde van de personen in de controleconditie)
Experimentele groep: Y = b0 + b1 + residu (b0 + b1 is gemiddelde van de personen in de
experimentele conditie)