Statistiek II
Opfriscollege
Doel van inferentie: het doen van uitspraken op basis van statistische gegevens
Gebruiken van een steekproef om iets te schatten over de populatie
Hoe beter je steekproef hoe nauwkeuriger je uitspraak
Hoe homogener je populatie hoe nauwkeuriger je dingen zegt
BHI
BHI bevat met x% zekerheid een onbekende populatie parameter
Als je vaak de studie herhaalt bevat x% van de BHI’s de populatie parameter
Hypothesetoetsen
De kans dat je de huidige uitslag (van H0) of nog opvallender vindt, wanneer deze
kans klein is verwerp je de nulhypothese
De kans dat je dit resultaat in de steekproef vindt als in de populatie H0 waar is
Steekproevenverdeling van een statistic
Stel je trekt 100 keer een steekproef
De verdeling van de scores die hieruit komen is de steekproevenverdeling
De kansverdeling van een bepaalde statistic in de steekproef
- Steekproevenverdeling van steekproefgemiddelde ( μ , σ / √n )
- Is normaal verdeeld als y ook normaal verdeeld is
- Als y niet normaal verdeeld is kunnen we de centrale limietstelling gebruiken: als n
groot is, is steekproefgemiddelde ongeveer normaal verdeeld
- Belangrijk om zo kansen te linken aan een bepaalde waarde uit een steekproef
Significantietoetsen
Formele procedure om geobserveerde data te vergelijken met een hypothese
Doel van een significatie toets is om een nulhypothese te verwerpen
Elke significantietoets is gebaseerd op een toetsingsgrootheid (test statistic)
Test statistic zelfde vorm voor z-tests en t-tests
Test statistic = (schatting – waarde onder nulhypothese) / SEstatistic
p-waarde die bij Z hoort, de kans op de huidige uitkomst of nog extremer als de
nulhypothese waar is
p-waarde vergelijk je met alpha, het significantieniveau
,
Hoe hoger het aantal vrijheidsgraden (n-1), hoe meer je t-verdeling op een
standaardnormale verdeling lijkt
Dus…
Sigma bekend one sample z-toets
Anders schatter s one sample t-toets
Twee groepen two sample t-test
Betrouwbaarheidsintervallen
- BHI = Schatting + margin of error
- Margin of error = kritieke waarde van steekproevenverdeling x SE
- Let op, SE is s / √n of σ / √n
, -
BHI wordt kleiner wanneer
- Betrouwbaarheidsniveau verlaagt
- n groter wordt
- de standard deviatie kleiner wordt, kan je niet veranderen maar populatie wel
Interpretaties BHI
- NIET: er is 95% kans dat de parameter in het BHI zit, want de parameter is vast en het
BHI bevat het of niet, de kans is dus 0 of 100%
- Wel: we zijn 95% zeker dat de parameter tussen a en b ligt
- Als het vaak herhaalt wordt is de kans 95% dat het BHI de parameter bevat
De nulhypothese wordt niet verworpen wanneer de hypothetische waarde binnen het (1-
alpha)% interval ligt
College 1: enkelvoudige lineaire regressie: schatten
Practicum
Twee JASP toetsen 13 oktober en 8 december (18.00-19.00)
Komt ook herkansing voor de JASP toetsen
Tentamen twee delen: theorie vragen en rekenvragen
Alleen voor deel rekenvragen cijfer, dat is eindcijfer
Enkelvoudige lineaire regressie
- Continue onafhankelijke/verklarende variabele (x)
- Continue afhankelijke/voorspellen variabele (y)
- Als er genoeg opties zijn (bijv. score tussen 0-100) dan is het continue variabele
Opfriscollege
Doel van inferentie: het doen van uitspraken op basis van statistische gegevens
Gebruiken van een steekproef om iets te schatten over de populatie
Hoe beter je steekproef hoe nauwkeuriger je uitspraak
Hoe homogener je populatie hoe nauwkeuriger je dingen zegt
BHI
BHI bevat met x% zekerheid een onbekende populatie parameter
Als je vaak de studie herhaalt bevat x% van de BHI’s de populatie parameter
Hypothesetoetsen
De kans dat je de huidige uitslag (van H0) of nog opvallender vindt, wanneer deze
kans klein is verwerp je de nulhypothese
De kans dat je dit resultaat in de steekproef vindt als in de populatie H0 waar is
Steekproevenverdeling van een statistic
Stel je trekt 100 keer een steekproef
De verdeling van de scores die hieruit komen is de steekproevenverdeling
De kansverdeling van een bepaalde statistic in de steekproef
- Steekproevenverdeling van steekproefgemiddelde ( μ , σ / √n )
- Is normaal verdeeld als y ook normaal verdeeld is
- Als y niet normaal verdeeld is kunnen we de centrale limietstelling gebruiken: als n
groot is, is steekproefgemiddelde ongeveer normaal verdeeld
- Belangrijk om zo kansen te linken aan een bepaalde waarde uit een steekproef
Significantietoetsen
Formele procedure om geobserveerde data te vergelijken met een hypothese
Doel van een significatie toets is om een nulhypothese te verwerpen
Elke significantietoets is gebaseerd op een toetsingsgrootheid (test statistic)
Test statistic zelfde vorm voor z-tests en t-tests
Test statistic = (schatting – waarde onder nulhypothese) / SEstatistic
p-waarde die bij Z hoort, de kans op de huidige uitkomst of nog extremer als de
nulhypothese waar is
p-waarde vergelijk je met alpha, het significantieniveau
,
Hoe hoger het aantal vrijheidsgraden (n-1), hoe meer je t-verdeling op een
standaardnormale verdeling lijkt
Dus…
Sigma bekend one sample z-toets
Anders schatter s one sample t-toets
Twee groepen two sample t-test
Betrouwbaarheidsintervallen
- BHI = Schatting + margin of error
- Margin of error = kritieke waarde van steekproevenverdeling x SE
- Let op, SE is s / √n of σ / √n
, -
BHI wordt kleiner wanneer
- Betrouwbaarheidsniveau verlaagt
- n groter wordt
- de standard deviatie kleiner wordt, kan je niet veranderen maar populatie wel
Interpretaties BHI
- NIET: er is 95% kans dat de parameter in het BHI zit, want de parameter is vast en het
BHI bevat het of niet, de kans is dus 0 of 100%
- Wel: we zijn 95% zeker dat de parameter tussen a en b ligt
- Als het vaak herhaalt wordt is de kans 95% dat het BHI de parameter bevat
De nulhypothese wordt niet verworpen wanneer de hypothetische waarde binnen het (1-
alpha)% interval ligt
College 1: enkelvoudige lineaire regressie: schatten
Practicum
Twee JASP toetsen 13 oktober en 8 december (18.00-19.00)
Komt ook herkansing voor de JASP toetsen
Tentamen twee delen: theorie vragen en rekenvragen
Alleen voor deel rekenvragen cijfer, dat is eindcijfer
Enkelvoudige lineaire regressie
- Continue onafhankelijke/verklarende variabele (x)
- Continue afhankelijke/voorspellen variabele (y)
- Als er genoeg opties zijn (bijv. score tussen 0-100) dan is het continue variabele