Samenvatting
Data analystics
, Wetenschap & statistiek
- Simpelweg wil men in de wetenschap met een bepaalde mate van zekerheid uitspraken
over de werkelijkheid doen.
- Je wil eigenlijk altijd iets over de populatie zeggen (bijv. Nederlanders zijn gemiddeld
1,75M.) maar die kun je vaak nooit in zijn totaliteit meten -> daarom trekken we een
steekproef.
- Hypotheses geven doorgaans uitdrukking aan onderliggende relaties van factoren.
Door voldoende onderzoek kan dit leiden tot theorievorming, waarin de relaties tussen
factoren uitgedrukt wordt. Dit heet toetsende statistiek : je gaat na of een hypothese
houdbaar is.
- Nut : statistiek is het hulpmiddel in kwantitatief onderzoek om na te gaan :
• Of je onderzoek je hypothese ondersteunt of niet
• Hoe de relaties te waarderen (bijv. zijn de verbanden sterk of zwak)
• Om (nog meer) patronen in je data te ontdekken (bijv. factoranalyse)
• Om je methode te verantwoorden (bijv. kwaliteit van je schalen, power)
• Of om eenduidige omschrijvingen te geven ( IQ scores)
Belangrijke symbolen
Verschil tussen steekproef en populatie
Steekproef Populatie
Gemiddelde ̅ μ
X
Standaarddeviatie s ơ
Aantal waarnemingen n N
Beschrijvende & inferentiele statistiek
- Beschrijvende statistiek : berekening en interpretatie van samenvattende statistische
maten. Bijv. index als BNP, CBS (Geboortecijfers) -> doorgaans gebaseerd op werkelijke
gegevens op populatie niveau.
- Inferentiele (afleidende statistiek) : gebaseerd op een steekproef & kansrekening iets
zeggen over de populatie (afleiden van je steekproef en generaliseren)
Voorbeeld, van alle studenten DBC studenten de lengte meten -> beschrijvende statistiek
want je meet de hele populatie.
Hypotoetsen vs schatten
Hoe groter de steekproef, hoe meer vertrouwen.
Steekproefgrootte
Versie A resulteert in 12% meer conversie dan versie B, is A beter dan B?
Statistisch gezien is dan de vraag of de conversie-rates-significant verschillen : dit hangt
onder andere sterk af van je steekproefgrootte.
- Statistiek is een middel waarmee bepaalde claims gecontroleerd kunnen worden ( in
combinatie met onderzoek natuurlijk)
- Vergelijkbare groepen zijn nodig voor een vergelijking tussen A & B (& C. ect..)
- Hoe groter het verschil, hoe waarschijnlijk dat deze werkelijk is ( geen normale
steekproeven fluctuatie (toeval)
- Hoe groter de groepen, hoe groter het vertrouwen.
Data analystics
, Wetenschap & statistiek
- Simpelweg wil men in de wetenschap met een bepaalde mate van zekerheid uitspraken
over de werkelijkheid doen.
- Je wil eigenlijk altijd iets over de populatie zeggen (bijv. Nederlanders zijn gemiddeld
1,75M.) maar die kun je vaak nooit in zijn totaliteit meten -> daarom trekken we een
steekproef.
- Hypotheses geven doorgaans uitdrukking aan onderliggende relaties van factoren.
Door voldoende onderzoek kan dit leiden tot theorievorming, waarin de relaties tussen
factoren uitgedrukt wordt. Dit heet toetsende statistiek : je gaat na of een hypothese
houdbaar is.
- Nut : statistiek is het hulpmiddel in kwantitatief onderzoek om na te gaan :
• Of je onderzoek je hypothese ondersteunt of niet
• Hoe de relaties te waarderen (bijv. zijn de verbanden sterk of zwak)
• Om (nog meer) patronen in je data te ontdekken (bijv. factoranalyse)
• Om je methode te verantwoorden (bijv. kwaliteit van je schalen, power)
• Of om eenduidige omschrijvingen te geven ( IQ scores)
Belangrijke symbolen
Verschil tussen steekproef en populatie
Steekproef Populatie
Gemiddelde ̅ μ
X
Standaarddeviatie s ơ
Aantal waarnemingen n N
Beschrijvende & inferentiele statistiek
- Beschrijvende statistiek : berekening en interpretatie van samenvattende statistische
maten. Bijv. index als BNP, CBS (Geboortecijfers) -> doorgaans gebaseerd op werkelijke
gegevens op populatie niveau.
- Inferentiele (afleidende statistiek) : gebaseerd op een steekproef & kansrekening iets
zeggen over de populatie (afleiden van je steekproef en generaliseren)
Voorbeeld, van alle studenten DBC studenten de lengte meten -> beschrijvende statistiek
want je meet de hele populatie.
Hypotoetsen vs schatten
Hoe groter de steekproef, hoe meer vertrouwen.
Steekproefgrootte
Versie A resulteert in 12% meer conversie dan versie B, is A beter dan B?
Statistisch gezien is dan de vraag of de conversie-rates-significant verschillen : dit hangt
onder andere sterk af van je steekproefgrootte.
- Statistiek is een middel waarmee bepaalde claims gecontroleerd kunnen worden ( in
combinatie met onderzoek natuurlijk)
- Vergelijkbare groepen zijn nodig voor een vergelijking tussen A & B (& C. ect..)
- Hoe groter het verschil, hoe waarschijnlijk dat deze werkelijk is ( geen normale
steekproeven fluctuatie (toeval)
- Hoe groter de groepen, hoe groter het vertrouwen.