College 9
Statistiek = de wetenschap van data
- Verzamelen, analyseren, concluderen
- Samenvatten van kwantitatieve gegevens met onnauwkeurigheidsmarges
- Betrouwbaarheidsintervallen, standard errors, effectgroottes, power
Descriptieve statistiek = beschrijven van data in de vorm van grafieken (boxplots, scatterplots, etc.)
en samenvattingsmaten (gemiddelde, standaarddeviatie, mediaan, correlaties, etc.)
Inferentiële statistiek = methodes voor het trekken van conclusies over een populatie aan de hand
van steekproefresultaten
- Betrouwbaarheidsintervallen: schatten van de waarde van een populatieparameter
- Significantietoetsen: bewijs verkrijgen voor een bewering over de populatie
De keuze van de methode is afhankelijk van het aantal en soort afhankelijke en onafhankelijke
variabelen, het soort waarnemingen en de aannames die gemaakt kunnen worden.
Een categorische afhankelijke variabele is een 0/1-variabele, je hebt wel of niet succes.
- Gebruik logistische regressie
- Gebruik generalized linear models
Bijna alle andere methoden voorspellen continue afhankelijke variabelen. Deze gaan over het
modelleren van gemiddelden van de variabele.
De keuze van de methode hangt ook af van de onafhankelijke variabele(n):
- Aantal
- Soort (categorisch, continu of beiden)
- Aantal metingen per subject
Het rode deel wordt voornamelijk besproken bij statistiek 3:
, De parameter wil je voorspellen met een schatter:
- Voor een continue variabele kun je een gemiddelde uitrekenen, of het verschil tussen twee
gemiddelden (twee steekproeven, als de varianties gelijk zijn kun je de pooled two-sample t-
test uitvoeren)
- Voor een categorische variabele kun je naar de proportie kijken, het verschil tussen twee
proporties, of een kruistabel (chi-kwadraat) analyse doen
- Soms moet je naar de standaarddeviatie kijken: hoe gelijk zijn de scores? Wat is de
verhouding? Je deelt de ene door de andere en als ze gelijk zijn aan elkaar moet dit getal
ongeveer 1 zijn
1 continue afhankelijke variabele en 1 onafhankelijke variabele X:
Elk voorbeeld gaat over depressiescores, maar het onderzoeksdesign is net wat anders. Let dus op
wat voor procedure het beste bij je onderzoeksdesign past.
1 continue afhankelijke variabelen en meerdere onafhankelijke variabelen, independent samples:
Statistiek = de wetenschap van data
- Verzamelen, analyseren, concluderen
- Samenvatten van kwantitatieve gegevens met onnauwkeurigheidsmarges
- Betrouwbaarheidsintervallen, standard errors, effectgroottes, power
Descriptieve statistiek = beschrijven van data in de vorm van grafieken (boxplots, scatterplots, etc.)
en samenvattingsmaten (gemiddelde, standaarddeviatie, mediaan, correlaties, etc.)
Inferentiële statistiek = methodes voor het trekken van conclusies over een populatie aan de hand
van steekproefresultaten
- Betrouwbaarheidsintervallen: schatten van de waarde van een populatieparameter
- Significantietoetsen: bewijs verkrijgen voor een bewering over de populatie
De keuze van de methode is afhankelijk van het aantal en soort afhankelijke en onafhankelijke
variabelen, het soort waarnemingen en de aannames die gemaakt kunnen worden.
Een categorische afhankelijke variabele is een 0/1-variabele, je hebt wel of niet succes.
- Gebruik logistische regressie
- Gebruik generalized linear models
Bijna alle andere methoden voorspellen continue afhankelijke variabelen. Deze gaan over het
modelleren van gemiddelden van de variabele.
De keuze van de methode hangt ook af van de onafhankelijke variabele(n):
- Aantal
- Soort (categorisch, continu of beiden)
- Aantal metingen per subject
Het rode deel wordt voornamelijk besproken bij statistiek 3:
, De parameter wil je voorspellen met een schatter:
- Voor een continue variabele kun je een gemiddelde uitrekenen, of het verschil tussen twee
gemiddelden (twee steekproeven, als de varianties gelijk zijn kun je de pooled two-sample t-
test uitvoeren)
- Voor een categorische variabele kun je naar de proportie kijken, het verschil tussen twee
proporties, of een kruistabel (chi-kwadraat) analyse doen
- Soms moet je naar de standaarddeviatie kijken: hoe gelijk zijn de scores? Wat is de
verhouding? Je deelt de ene door de andere en als ze gelijk zijn aan elkaar moet dit getal
ongeveer 1 zijn
1 continue afhankelijke variabele en 1 onafhankelijke variabele X:
Elk voorbeeld gaat over depressiescores, maar het onderzoeksdesign is net wat anders. Let dus op
wat voor procedure het beste bij je onderzoeksdesign past.
1 continue afhankelijke variabelen en meerdere onafhankelijke variabelen, independent samples: