SPSS Toetsen
Algemene informatie
Variabelen
Onafhankelijke variabele = man/vrouw. Dit is iets vaststaand, dit kan niet variëren door iets
anders.
Afhankelijke variabele = kan veranderen door iets anders (tevredenheid). Hetgene wat je
wil verklaren, wat je beter wil begrijpen.
Wat is afhankelijk van wat?
Meetniveaus
● Nominaal = de waarden zijn slechts een label, het zijn categorieën. Er is geen
rangorde aan te brengen.
● Ordinaal = er zit een rangorde in de getallen, maar de intervallen tussen getallen zijn
niet even groot.
● Interval = er zit een rangorde in de getallen, de intervallen tussen de getallen zijn
even groot maar er is geen vast nulpunt (eens/oneens, temperatuur).
● Ratio = er zit een rangorde in de getallen, intervallen tussen getallen zijn even groot
en er is een vast nulpunt (hoe vaak heb je een delict gepleegd, je kan er makkelijk
mee rekenen)
Schaalvariabele is altijd van interval meetniveau.
Onafhankelijk vs afhankelijke metingen
Onafhankelijke meting Verschillende groepen die op 1
moment/manier zijn gemeten
Afhankelijke meting Dezelfde groep mensen die op meerdere
momenten/manieren zijn gemeten
Parametrisch vs non-parametrisch
Parametrische toets Wanneer er sprake is van een normaal
verdeling
➔ Interval/ratio variabelen met een
grote steekproef (>30).
Niet-parametrische toets Assumptie-vrije toetsen
Wordt hierbij gebruikt gemaakt van ➔ Altijd bij ordinale variabelen die niet-
rangscores in plaats van de werkelijke normaal verdeeld zijn
scores
➔ Interval/ratio variabelen met een
kleine steekproef.
1
,Overig algemeen
● Wanneer N > 30 is bij een interval/ratio variabele, dan mag de normaliteitsassumptie
worden genegeerd = central limit theorem. Maar dit moet wel worden
beargumenteerd.
● Altijd afronden op twee decimalen.
● Zo streng mogelijk toetsen.
● Bij parametrische toetsen wordt gewerkt met rangscores en niet met de werkelijke
scores.
● Unknown rapporteren als missing.
Prevalentie = ja/nee (dichotoom)
Frequentie = hoe vaak (ratio)
Als je wil weten hoeveel mensen en slachtoffer zijn van geweld en van diefstal, dan kan je
als ze dezelfde waarden hebben een nieuwe variabele aanmaken:
1. Compute
2. Variabele 1+ variabele 2
3. Nieuwe frequentietabel opvragen
Significantie = hoe groot is de kans dat dit verband in de steekproef wordt gevonden terwijl
dat verband er in de werkelijkheid niet is: sig x 100%.
Pearson
Wanneer?
2
, ● Samenhang
● Tussen twee of meer variabelen
● Normale verdeling interval/ratio variabele
● Van interval/ratio meetniveau
Maar niet bij:
● Kleine N
● Niet-normale verdeling
● Outliers
Stappenplan
Analyze, Correlate, Bivariate → Voeg variabelen in
Interpretatie
1. Sig. (2-tailed) = significantie
2. Pearson Correlation = R (effectgrootte/positief of negatief verband)
Er wordt een negatief verband gevonden tussen het aantal vormen van overlast en leeftijd.
. Hoe ouder iemand is, hoe minder vormen van overlast men ervaart (r = -0.229, p<0.05).
Effectgrootte
R=
Spearman
Wanneer?
● Samenhang
3
Algemene informatie
Variabelen
Onafhankelijke variabele = man/vrouw. Dit is iets vaststaand, dit kan niet variëren door iets
anders.
Afhankelijke variabele = kan veranderen door iets anders (tevredenheid). Hetgene wat je
wil verklaren, wat je beter wil begrijpen.
Wat is afhankelijk van wat?
Meetniveaus
● Nominaal = de waarden zijn slechts een label, het zijn categorieën. Er is geen
rangorde aan te brengen.
● Ordinaal = er zit een rangorde in de getallen, maar de intervallen tussen getallen zijn
niet even groot.
● Interval = er zit een rangorde in de getallen, de intervallen tussen de getallen zijn
even groot maar er is geen vast nulpunt (eens/oneens, temperatuur).
● Ratio = er zit een rangorde in de getallen, intervallen tussen getallen zijn even groot
en er is een vast nulpunt (hoe vaak heb je een delict gepleegd, je kan er makkelijk
mee rekenen)
Schaalvariabele is altijd van interval meetniveau.
Onafhankelijk vs afhankelijke metingen
Onafhankelijke meting Verschillende groepen die op 1
moment/manier zijn gemeten
Afhankelijke meting Dezelfde groep mensen die op meerdere
momenten/manieren zijn gemeten
Parametrisch vs non-parametrisch
Parametrische toets Wanneer er sprake is van een normaal
verdeling
➔ Interval/ratio variabelen met een
grote steekproef (>30).
Niet-parametrische toets Assumptie-vrije toetsen
Wordt hierbij gebruikt gemaakt van ➔ Altijd bij ordinale variabelen die niet-
rangscores in plaats van de werkelijke normaal verdeeld zijn
scores
➔ Interval/ratio variabelen met een
kleine steekproef.
1
,Overig algemeen
● Wanneer N > 30 is bij een interval/ratio variabele, dan mag de normaliteitsassumptie
worden genegeerd = central limit theorem. Maar dit moet wel worden
beargumenteerd.
● Altijd afronden op twee decimalen.
● Zo streng mogelijk toetsen.
● Bij parametrische toetsen wordt gewerkt met rangscores en niet met de werkelijke
scores.
● Unknown rapporteren als missing.
Prevalentie = ja/nee (dichotoom)
Frequentie = hoe vaak (ratio)
Als je wil weten hoeveel mensen en slachtoffer zijn van geweld en van diefstal, dan kan je
als ze dezelfde waarden hebben een nieuwe variabele aanmaken:
1. Compute
2. Variabele 1+ variabele 2
3. Nieuwe frequentietabel opvragen
Significantie = hoe groot is de kans dat dit verband in de steekproef wordt gevonden terwijl
dat verband er in de werkelijkheid niet is: sig x 100%.
Pearson
Wanneer?
2
, ● Samenhang
● Tussen twee of meer variabelen
● Normale verdeling interval/ratio variabele
● Van interval/ratio meetniveau
Maar niet bij:
● Kleine N
● Niet-normale verdeling
● Outliers
Stappenplan
Analyze, Correlate, Bivariate → Voeg variabelen in
Interpretatie
1. Sig. (2-tailed) = significantie
2. Pearson Correlation = R (effectgrootte/positief of negatief verband)
Er wordt een negatief verband gevonden tussen het aantal vormen van overlast en leeftijd.
. Hoe ouder iemand is, hoe minder vormen van overlast men ervaart (r = -0.229, p<0.05).
Effectgrootte
R=
Spearman
Wanneer?
● Samenhang
3