Statistiek IV: Multivariate data-analyse - schakeljaar
Inleiding: Verkennen van data
Waarom data-analyse?
• Data-analyse = noodzakelijk voor psychologen
1. Cf. data-analyse in de media correct begrijpen
2. Begrip van + kritische instelling tegenover vakliteratuur, nadruk op data kan verschillen
3. Kunnen verzamelen/analyseren van data
• Het helpt je om:
1. Data te organiseren (grafieken… -> visualisatie)
2. Data te beschrijven (beschrijvende/deductieve statistiek, samenvatten)
3. Interpreteren en uitspraken doen op basis van data (inferentiële/inductieve statistiek,
verklaren)
4. Theorieën te verifiëren en aan te passen
1. Inductieve statistiek
1
, Statistiek IV: Multivariate data-analyse - schakeljaar
1.1. Begrippen
o Theorie -> hypothese -> steekproef -> steekproefgrootheden
o Steekproefgrootheid (statistiek, statistische grootheid): maat gebaseerd op de gegevens van
de steekproef (vb.: rekenkundig gemiddelde, proportie…)
o Steekproefgrootheid = toevalsvariabele met een bepaalde verdeling
» Stel: random steekproef 1 en we berekenen S1, random steekproef 2 (zelfde n) en we
berekenen S2, etc. tot Sn (S1, S2, S3, S4, …, Sn)
» De verdeling van deze steekproefgrootheden = steekproevenverdeling
o Steekproefverdeling (sample distribution)
» Frequentieverdeling van de uitkomsten van de steekproef (slechts 1 steekproef)
» Empirisch, gekend
o Steekproevenverdeling (sampling distribution)
» Kansverdeling van alle mogelijke waarden die een steekproefgrootheid (voor alle
mogelijke verschillende steekproeven) kan aannemen
» Theoretisch, benaderen
» Stel: steekproefgrootheid = 𝑥̅
» Wanneer men herhaaldelijk toevallige steekproeven met grootte n trekt uit een
normaal verdeelde populatie met gemiddelde = en standaardafwijking = dan
is de steekproeven-verdeling van het steekproefgemiddelde normaal verdeeld.
o Centrale limietstelling: wanneer men herhaaldelijk toevallige steekproeven met grootte n
trekt uit een willekeurig verdeelde populatie met gemiddelde = en standaardafwijking =
en indien n voldoende groot (vuistregel: n 30) is, dan benadert de steekproevenverdeling
van het steekproefgemiddelde een normaalverdeling.
2
Inleiding: Verkennen van data
Waarom data-analyse?
• Data-analyse = noodzakelijk voor psychologen
1. Cf. data-analyse in de media correct begrijpen
2. Begrip van + kritische instelling tegenover vakliteratuur, nadruk op data kan verschillen
3. Kunnen verzamelen/analyseren van data
• Het helpt je om:
1. Data te organiseren (grafieken… -> visualisatie)
2. Data te beschrijven (beschrijvende/deductieve statistiek, samenvatten)
3. Interpreteren en uitspraken doen op basis van data (inferentiële/inductieve statistiek,
verklaren)
4. Theorieën te verifiëren en aan te passen
1. Inductieve statistiek
1
, Statistiek IV: Multivariate data-analyse - schakeljaar
1.1. Begrippen
o Theorie -> hypothese -> steekproef -> steekproefgrootheden
o Steekproefgrootheid (statistiek, statistische grootheid): maat gebaseerd op de gegevens van
de steekproef (vb.: rekenkundig gemiddelde, proportie…)
o Steekproefgrootheid = toevalsvariabele met een bepaalde verdeling
» Stel: random steekproef 1 en we berekenen S1, random steekproef 2 (zelfde n) en we
berekenen S2, etc. tot Sn (S1, S2, S3, S4, …, Sn)
» De verdeling van deze steekproefgrootheden = steekproevenverdeling
o Steekproefverdeling (sample distribution)
» Frequentieverdeling van de uitkomsten van de steekproef (slechts 1 steekproef)
» Empirisch, gekend
o Steekproevenverdeling (sampling distribution)
» Kansverdeling van alle mogelijke waarden die een steekproefgrootheid (voor alle
mogelijke verschillende steekproeven) kan aannemen
» Theoretisch, benaderen
» Stel: steekproefgrootheid = 𝑥̅
» Wanneer men herhaaldelijk toevallige steekproeven met grootte n trekt uit een
normaal verdeelde populatie met gemiddelde = en standaardafwijking = dan
is de steekproeven-verdeling van het steekproefgemiddelde normaal verdeeld.
o Centrale limietstelling: wanneer men herhaaldelijk toevallige steekproeven met grootte n
trekt uit een willekeurig verdeelde populatie met gemiddelde = en standaardafwijking =
en indien n voldoende groot (vuistregel: n 30) is, dan benadert de steekproevenverdeling
van het steekproefgemiddelde een normaalverdeling.
2