Aantekeningen kwantitatief onderzoek
Het doel van statistiek: inzicht verschaffen in massale gegevensverzamelingen
Maatstaven(locatie maten):
- Gemiddelde
- Modus (meest voorkomende)
- Mediaan (middelste)
- Kwartielen (25%)
- Percentielen (percentages)
Spreidingsmaten:
- Standaarddeviatie (SD) (Het geeft aan hoezeer de geobserveerde waardes afwijken van het
gemiddelde) hoe groter de standaard deviatie hoe groter de spreiding
- Variatie
- Variantie (Hoe meer de data verspreid zijn, des te groter de variantie ten opzichte van het
gemiddelde)
- Kwartielafstand (een kwart van totaal)(Als een helft uit een even aantal bestaat is het
kwartiel het gemiddelde van de middelste 2 getallen)
Het verschil tussen mediaan en gemiddelde is dat het gemiddelde erg gevoelig is voor enkele
uitspringers (outlier) en de mediaan niet.
Range:
Is het verschil tussen de hoogste en laagste waarde (gevoelig voor outliers)
(bijv. 190-140 =50 range = 50) het gaat om de waarde in een grafiek niet om het aantal
Des te groter de SD des te breder de normaalverdeling
− µ = gemiddelde, δ= standaarddeviatie
− Des te groter je steekproef, kleinere SD, smallere verdeling
Nominaal = indelen verschillende klassen er is geen groep die hoger is als de ander (geslacht of
bloedgroepen)
Ordinaal = Verschillen tussen twee waarden (havo en vwo, Leuk neutraal en saai)
ratio = ordenen van getallen (eerste, tweede en derde bijv.)(leeftijden, inkomen in euro’s)(kan niet
onder de 0 komen)
interval = voorbeeld 13:00, 14:00, 15:00
of IQ 100,110,120 (kan onder de 0 komen bijv. bij temperaturen)
steeds de zelfde tussen stap tussen de mogelijkheden
Standaardfout berekenen: standaarddeviatie: wortel van totaal aantal deelnemers
95% van de normale verdeling is gemiddelde aantal + SD1 en ook – SD 1
Tabel of grafiek
Nominaal of ordinaal Frequentie tabel of staafdiagram of taart diagram
Interval of ratio Gecategoriseerde frequentie tabel of histogram
Histogram: Lijnen aan elkaar
, Centrummaten:
- Modus
- Mediaan
- Gemiddelde
Spreidingsmaten:
- Range:
o Laagste waarde en hoogste waarde (afstand hiertussen)
- Standaard deviatie
o Gemiddelde afwijking van het gemiddelde
o Lage waarden dan liggen alle waarden dicht bij elkaar
o Hoge waarden dan liggen waarden erg verspreidt
Populatie:
Hele groep die je onderzoekt
Steekproef:
Deel van de populatie die meedoet aan het onderzoek
Steek proef moet representatief zijn.
Hoe groter de steekproef hoe groter de kans dat ie representatief is
Steekproef is nooit 100% zeker een goede weerspiegeling van de populatie
Betrouwbaarheid = mate waarvan de resultaten afhangen van toeval
Validiteit = mate waarin je meet wat je wil meten
- Generaliseerbaarheid = de mate waarin je de resultaten van je onderzoek kan toepassen op
de werkelijkheid en waardoor de resultaten nog steeds kloppen
Schattingsfout =
− p = percentage elementen met kenmerk X
− q=1–p
− n = aantal steekproef elementen
Als p =60% dan is q = 1 - 0,6
• Wat is het verschil tussen de standaarddeviatie en de standaardfout?
• Standaarddeviatie
− Gemiddelde afwijking van het gemiddelde binnen de steekpoef
Standaardfout
− Waarschijnlijke afwijking van het gemiddelde van de steekproef tov het gemiddelde
in de populatie
Statistische toetsen:
Een manier om te bepalen of een bepaalde veronderstelling (hypothese juist is)
- Is er een verschil tussen variabelen? (is er een verschil tussen groep A en groep B als het gaat
om X) een voorbeeld is: is er een verschil tussen jongens en meisjes als het gaat om studie
succes?
- Een samenhang (is er een relatie tussen X en Y) voorbeeld is: is er een relatie tussen welvaart
en levensverwachting?
Het doel van statistiek: inzicht verschaffen in massale gegevensverzamelingen
Maatstaven(locatie maten):
- Gemiddelde
- Modus (meest voorkomende)
- Mediaan (middelste)
- Kwartielen (25%)
- Percentielen (percentages)
Spreidingsmaten:
- Standaarddeviatie (SD) (Het geeft aan hoezeer de geobserveerde waardes afwijken van het
gemiddelde) hoe groter de standaard deviatie hoe groter de spreiding
- Variatie
- Variantie (Hoe meer de data verspreid zijn, des te groter de variantie ten opzichte van het
gemiddelde)
- Kwartielafstand (een kwart van totaal)(Als een helft uit een even aantal bestaat is het
kwartiel het gemiddelde van de middelste 2 getallen)
Het verschil tussen mediaan en gemiddelde is dat het gemiddelde erg gevoelig is voor enkele
uitspringers (outlier) en de mediaan niet.
Range:
Is het verschil tussen de hoogste en laagste waarde (gevoelig voor outliers)
(bijv. 190-140 =50 range = 50) het gaat om de waarde in een grafiek niet om het aantal
Des te groter de SD des te breder de normaalverdeling
− µ = gemiddelde, δ= standaarddeviatie
− Des te groter je steekproef, kleinere SD, smallere verdeling
Nominaal = indelen verschillende klassen er is geen groep die hoger is als de ander (geslacht of
bloedgroepen)
Ordinaal = Verschillen tussen twee waarden (havo en vwo, Leuk neutraal en saai)
ratio = ordenen van getallen (eerste, tweede en derde bijv.)(leeftijden, inkomen in euro’s)(kan niet
onder de 0 komen)
interval = voorbeeld 13:00, 14:00, 15:00
of IQ 100,110,120 (kan onder de 0 komen bijv. bij temperaturen)
steeds de zelfde tussen stap tussen de mogelijkheden
Standaardfout berekenen: standaarddeviatie: wortel van totaal aantal deelnemers
95% van de normale verdeling is gemiddelde aantal + SD1 en ook – SD 1
Tabel of grafiek
Nominaal of ordinaal Frequentie tabel of staafdiagram of taart diagram
Interval of ratio Gecategoriseerde frequentie tabel of histogram
Histogram: Lijnen aan elkaar
, Centrummaten:
- Modus
- Mediaan
- Gemiddelde
Spreidingsmaten:
- Range:
o Laagste waarde en hoogste waarde (afstand hiertussen)
- Standaard deviatie
o Gemiddelde afwijking van het gemiddelde
o Lage waarden dan liggen alle waarden dicht bij elkaar
o Hoge waarden dan liggen waarden erg verspreidt
Populatie:
Hele groep die je onderzoekt
Steekproef:
Deel van de populatie die meedoet aan het onderzoek
Steek proef moet representatief zijn.
Hoe groter de steekproef hoe groter de kans dat ie representatief is
Steekproef is nooit 100% zeker een goede weerspiegeling van de populatie
Betrouwbaarheid = mate waarvan de resultaten afhangen van toeval
Validiteit = mate waarin je meet wat je wil meten
- Generaliseerbaarheid = de mate waarin je de resultaten van je onderzoek kan toepassen op
de werkelijkheid en waardoor de resultaten nog steeds kloppen
Schattingsfout =
− p = percentage elementen met kenmerk X
− q=1–p
− n = aantal steekproef elementen
Als p =60% dan is q = 1 - 0,6
• Wat is het verschil tussen de standaarddeviatie en de standaardfout?
• Standaarddeviatie
− Gemiddelde afwijking van het gemiddelde binnen de steekpoef
Standaardfout
− Waarschijnlijke afwijking van het gemiddelde van de steekproef tov het gemiddelde
in de populatie
Statistische toetsen:
Een manier om te bepalen of een bepaalde veronderstelling (hypothese juist is)
- Is er een verschil tussen variabelen? (is er een verschil tussen groep A en groep B als het gaat
om X) een voorbeeld is: is er een verschil tussen jongens en meisjes als het gaat om studie
succes?
- Een samenhang (is er een relatie tussen X en Y) voorbeeld is: is er een relatie tussen welvaart
en levensverwachting?