Onafhankelijke variabele = X
Afhankelijke variabele = Y
Kun je statistiek geloven?
- Hoe is informatie verzameld?
- Welke keuzes en definities liggen ten grondslag aan de meting?
- Op welke groep onderzoekseenheden is een bevinding gebaseerd?
- Of vooroordelen of meetfout de resultaten vertekenen
- Hoe is informatie geanalyseerd, geïnterpreteerd en/of gepresenteerd?
- Welke statistische maat of toets kies je voor je rapportage?
- Welke conclusie verbind je aan een getal?
- Hoe visualiseer je je resultaten?
Soorten statistiek
- Beschrijvende statistiek: een groep (steekproef) van onderzoekseenheden beschrijven
- Verklarende statistiek: verbanden (samenhang) tussen 2 of meer kenmerken (variabelen) van
onderzoekseenheden
- Inferentiële statistiek: generaliserende uitspraken doen over populaties op basis van een steekproef
Statistiek: de methodiek en techniek van het verzamelen, bewerken, interpreteren en presenteren
van gegevens
Beschrijvende statistiek
- Doel: een groep beschrijven met gegevens die inzicht geven in trends, patronen, structuur van ruwe
data
- Centrale tendentie
- Gemiddelde
- Mediaan
- Modus
- Spreiding
- Bereik
- Frequentie
- Variantie en standaarddeviatie
Centrale tendentie:
- Gemiddelde
- Modus: de meest voorkomende waarde van een bepaald kenmerk in de steekproef
- Mediaan: de middelste waarde van een bepaald kenmerk in een steekproef
Meetniveaus
- Interval/ratio meetniveau
- Intervallen tussen getallen op een numerieke schaal
- Intervallen zijn gelijk van grootte
- Ordinaal meetniveau
- Rangorde, maar het verschil tussen intervallen is niet gelijk
- Nominaal meetniveau
- Categorieën
- Kwalitatief (geen ‘meer’ of ‘minder’ : binaire variabele)
Spreiding:
- ALTIJD spreken over centrale tendentie EN spreiding
, - Bereik: hoogste score – laagste score
- Interkwartiel afstand: het bereik van de middelste 50% scores: 1 e kwartiel tot 3e kwartiel
(1e kwartiel = 0,25 x aantal variabelen)
(3e kwartiel = 0,75 x aantal variabelen)
- Hoe groter de waarde, hoe groter de spreiding -> geeft geen inzicht in de spreiding van de waarden
tussen de 2 scores in
- Frequentie (frequentietabel)
- Variantie: s2: hoeveel wijken scores in de steekproef af van het gemiddelde? (formule)
- s2 = Σ ¿ ¿
- Standaarddeviatie: s = √ Σ¿ ¿ ¿
Meetniveaus en spreiding
- Variantie en standaarddeviatie
- Variabiliteit rondom het gemiddelde
- Kun je gebruiken bij interval-ratio niveau
- Bereik en interkwartielafstand
- Verschil tussen hoogste en laagste score
- Kun je gebruiken bij interval-ratio en ordinaal niveau
- Frequentie
- Aantal keer dat een score voorkomt
- Kun je gebruiken bij interval-ratio, ordinaal en nominaal niveau
Kenmerken van het gemiddelde: (p.74-76 in boek)
1) Het gemiddelde is de balans tussen alle scores
- Als je het gemiddelde aftrekt van elke score en alle verschillen bij elkaar optelt, is de
uitkomst altijd 0
2) Het gemiddelde minimaliseert de variatie van alle scores
- Het gemiddelde ligt dichtbij alle andere scores dan welke andere centrummaat dan ook
3) Het gemiddelde wordt bepaald door alle scores in de steekproef (en is dus gevoelig voor extreme
waarden)
- De modus en mediaan zijn slechts gebaseerd op een enkele of een paar scores, en zeggen
wellicht minder over de steekproef als geheel
Normaalverdeling
- Gemiddelde = mediaan = modus
- Klokvorm
- Uni modaal, symmetrisch, perfecte vorm, oneindigheid
Scheefheid
- Positive skew: gemiddelde is groter dan mediaan (voorbeeld is inkomen in NL)
- Negative skew: gemiddelde is kleiner dan mediaan
Afhankelijke variabele = Y
Kun je statistiek geloven?
- Hoe is informatie verzameld?
- Welke keuzes en definities liggen ten grondslag aan de meting?
- Op welke groep onderzoekseenheden is een bevinding gebaseerd?
- Of vooroordelen of meetfout de resultaten vertekenen
- Hoe is informatie geanalyseerd, geïnterpreteerd en/of gepresenteerd?
- Welke statistische maat of toets kies je voor je rapportage?
- Welke conclusie verbind je aan een getal?
- Hoe visualiseer je je resultaten?
Soorten statistiek
- Beschrijvende statistiek: een groep (steekproef) van onderzoekseenheden beschrijven
- Verklarende statistiek: verbanden (samenhang) tussen 2 of meer kenmerken (variabelen) van
onderzoekseenheden
- Inferentiële statistiek: generaliserende uitspraken doen over populaties op basis van een steekproef
Statistiek: de methodiek en techniek van het verzamelen, bewerken, interpreteren en presenteren
van gegevens
Beschrijvende statistiek
- Doel: een groep beschrijven met gegevens die inzicht geven in trends, patronen, structuur van ruwe
data
- Centrale tendentie
- Gemiddelde
- Mediaan
- Modus
- Spreiding
- Bereik
- Frequentie
- Variantie en standaarddeviatie
Centrale tendentie:
- Gemiddelde
- Modus: de meest voorkomende waarde van een bepaald kenmerk in de steekproef
- Mediaan: de middelste waarde van een bepaald kenmerk in een steekproef
Meetniveaus
- Interval/ratio meetniveau
- Intervallen tussen getallen op een numerieke schaal
- Intervallen zijn gelijk van grootte
- Ordinaal meetniveau
- Rangorde, maar het verschil tussen intervallen is niet gelijk
- Nominaal meetniveau
- Categorieën
- Kwalitatief (geen ‘meer’ of ‘minder’ : binaire variabele)
Spreiding:
- ALTIJD spreken over centrale tendentie EN spreiding
, - Bereik: hoogste score – laagste score
- Interkwartiel afstand: het bereik van de middelste 50% scores: 1 e kwartiel tot 3e kwartiel
(1e kwartiel = 0,25 x aantal variabelen)
(3e kwartiel = 0,75 x aantal variabelen)
- Hoe groter de waarde, hoe groter de spreiding -> geeft geen inzicht in de spreiding van de waarden
tussen de 2 scores in
- Frequentie (frequentietabel)
- Variantie: s2: hoeveel wijken scores in de steekproef af van het gemiddelde? (formule)
- s2 = Σ ¿ ¿
- Standaarddeviatie: s = √ Σ¿ ¿ ¿
Meetniveaus en spreiding
- Variantie en standaarddeviatie
- Variabiliteit rondom het gemiddelde
- Kun je gebruiken bij interval-ratio niveau
- Bereik en interkwartielafstand
- Verschil tussen hoogste en laagste score
- Kun je gebruiken bij interval-ratio en ordinaal niveau
- Frequentie
- Aantal keer dat een score voorkomt
- Kun je gebruiken bij interval-ratio, ordinaal en nominaal niveau
Kenmerken van het gemiddelde: (p.74-76 in boek)
1) Het gemiddelde is de balans tussen alle scores
- Als je het gemiddelde aftrekt van elke score en alle verschillen bij elkaar optelt, is de
uitkomst altijd 0
2) Het gemiddelde minimaliseert de variatie van alle scores
- Het gemiddelde ligt dichtbij alle andere scores dan welke andere centrummaat dan ook
3) Het gemiddelde wordt bepaald door alle scores in de steekproef (en is dus gevoelig voor extreme
waarden)
- De modus en mediaan zijn slechts gebaseerd op een enkele of een paar scores, en zeggen
wellicht minder over de steekproef als geheel
Normaalverdeling
- Gemiddelde = mediaan = modus
- Klokvorm
- Uni modaal, symmetrisch, perfecte vorm, oneindigheid
Scheefheid
- Positive skew: gemiddelde is groter dan mediaan (voorbeeld is inkomen in NL)
- Negative skew: gemiddelde is kleiner dan mediaan