Aantekeningen LA - Inleiding statistiek 2022
Practicum 1: opdracht 1 (introductie SPSS)
‘Data view’ scherm:
- De kolommen bevatten gegevens (data) over de verschillende variabelen.
- De rijen geven de gevallen aan waartoe de gegevens in elke regel behoren
(bijvoorbeeld ppn 1).
‘Variable view’ scherm:
- Name: Korte (unieke) naam van de variabele.
- Label: Langere beschrijving van de variabele.
- Values: Betekenis van de values (waarden) waarmee je de variabele codeert
(bijvoorbeeld 1 is man en 2 is vrouw).
- Measure: Verwijst naar het level van de variabele.
o Nominaal: categorische data
o Ordinaal: data met rangschikking of geordende waarden.
o Interval en ratio vallen samen in ‘scale’
Practicum 2: opdracht 2 (beschrijvende statistiek)
Beschrijvende statistiek zijn waarden die ons een indruk geven van hoe de gegevens er als
geheel uitzien (bijvoorbeeld: gemiddelde, standaardafwijking, frequenties).
Frequentieverdeling/frequentietabel (frequentie, percentage, valide percentage en cumulatief
percentage
Als je een frequentieverdeling/frequentietabel wil genereren, gebruik de knoppen in deze
volgorde (gebruik het scherm dataview):
Analyze Descriptive Statistics Frequencies Variabelen in box plaatsen Ok
De output wordt getoond in output venster.
Hoeveel ppn: in de tabel bij frequencies kijken naar total
Een frequentietabel/verdeling laat de verdeling zien van de gekozen variabelen; het laat zien
hoe vaak elke waarde van een variabele voorkomt.
Histogram (MEAN, SD en variantie)
Als je van de histogram wil genereren, gebruik je de knoppen in deze volgorde:
Graphs Legacy Dialogs Histogram voer bij variabele in voor welke
variabele je een histogram wil maken aanvinken vakje ‘Display normal curve’
Ok
De output wordt getoond in output venster.
(Estimated) MEAN (gemiddelde) en SD (standaardafwijking) kunnen afgelezen worden naast
histogram
Een histogram helpt ons te zien of de data normaal verdeeld is. Je kunt in de output van het
histogram zien wat het gemiddelde, de standaardafwijking en de ‘N’ is.
, Aantekeningen LA - Inleiding statistiek 2022
Beschrijvende statistieken tabel (aantal participanten, min en max score, gemiddelde, SD,
variantie)
Als je een tabel wil genereren met beschrijvende statistieken, gebruik de knoppen in deze
volgorde:
Analyze Descriptive Statistics Descriptives Variabelen in box plaatsen
options vakje variance aanvinken Ok
De output wordt getoond in output venster.
De variantie aflezen van een variabele in de descriptives tabel. Let op aantal decimalen
waarop je moet afronden!
Errors en sort cases
Beschrijvende statistiek kun je ook gebruiken om te kijken of er ‘errors’ (waardes die buiten
de verwachte waardes vallen) zitten in de data. Je kunt die zoeken door op de volgende
knoppen te klikken:
Data Sort cases Variabelen toevoegen aan de box Ok
Als je een vreemde waarde (die je niet verwacht) ziet, mag je de hele rij selecteren en
verwijderen. Dat doe je door de rij te selecteren door op het grijze rijnummer te klikken links
in het beeld en op ‘clear’ te klikken (door rechtermuisknop)
Opsplitsen proefpersonen
Opsplitsen van proefpersonen in (twee) groepen doe je door op de volgende knoppen te
drukken:
Data split file Compare groups aanvinken vakje compare groups
variabele (waar het om gaat) toevoegen aan de box.
De beschrijvende statistieken laten zien wat er geldt in deze steekproef. Het wil dus niet
zeggen dat je deze resultaten zomaar kunt generaliseren naar de gehele populatie waarin je
geïnteresseerd bent.
Practicum 1: opdracht 3 (missing values- ontbrekende waarden)
Ontbrekende waarden kunnen om allerlei redenen voorkomen (weigeren om antwoord te
geven, de vraag niet begrijpen en daarom geen antwoord geven, een vraag over het hoofd
zien).
Het percentage en valid percentage zijn NIET hetzelfde:
- Het percentage wordt verkregen door de waargenomen frequentie te delen door de
totale N (inclusief respondenten met ontbrekende waarden).
- Valid percentage wordt verkregen door de waargenomen frequentie te delen door het
aantal respondenten met een geldige score. Eerst aantal missing afhalen van totale N.
SPSS beschouwt lege cellen als ‘system missing’ (de gegevens ontbreken). Het is een betere
strategie om codes te gebruiken voor de ontbrekende waarden (bijvoorbeeld met 999). Door
Practicum 1: opdracht 1 (introductie SPSS)
‘Data view’ scherm:
- De kolommen bevatten gegevens (data) over de verschillende variabelen.
- De rijen geven de gevallen aan waartoe de gegevens in elke regel behoren
(bijvoorbeeld ppn 1).
‘Variable view’ scherm:
- Name: Korte (unieke) naam van de variabele.
- Label: Langere beschrijving van de variabele.
- Values: Betekenis van de values (waarden) waarmee je de variabele codeert
(bijvoorbeeld 1 is man en 2 is vrouw).
- Measure: Verwijst naar het level van de variabele.
o Nominaal: categorische data
o Ordinaal: data met rangschikking of geordende waarden.
o Interval en ratio vallen samen in ‘scale’
Practicum 2: opdracht 2 (beschrijvende statistiek)
Beschrijvende statistiek zijn waarden die ons een indruk geven van hoe de gegevens er als
geheel uitzien (bijvoorbeeld: gemiddelde, standaardafwijking, frequenties).
Frequentieverdeling/frequentietabel (frequentie, percentage, valide percentage en cumulatief
percentage
Als je een frequentieverdeling/frequentietabel wil genereren, gebruik de knoppen in deze
volgorde (gebruik het scherm dataview):
Analyze Descriptive Statistics Frequencies Variabelen in box plaatsen Ok
De output wordt getoond in output venster.
Hoeveel ppn: in de tabel bij frequencies kijken naar total
Een frequentietabel/verdeling laat de verdeling zien van de gekozen variabelen; het laat zien
hoe vaak elke waarde van een variabele voorkomt.
Histogram (MEAN, SD en variantie)
Als je van de histogram wil genereren, gebruik je de knoppen in deze volgorde:
Graphs Legacy Dialogs Histogram voer bij variabele in voor welke
variabele je een histogram wil maken aanvinken vakje ‘Display normal curve’
Ok
De output wordt getoond in output venster.
(Estimated) MEAN (gemiddelde) en SD (standaardafwijking) kunnen afgelezen worden naast
histogram
Een histogram helpt ons te zien of de data normaal verdeeld is. Je kunt in de output van het
histogram zien wat het gemiddelde, de standaardafwijking en de ‘N’ is.
, Aantekeningen LA - Inleiding statistiek 2022
Beschrijvende statistieken tabel (aantal participanten, min en max score, gemiddelde, SD,
variantie)
Als je een tabel wil genereren met beschrijvende statistieken, gebruik de knoppen in deze
volgorde:
Analyze Descriptive Statistics Descriptives Variabelen in box plaatsen
options vakje variance aanvinken Ok
De output wordt getoond in output venster.
De variantie aflezen van een variabele in de descriptives tabel. Let op aantal decimalen
waarop je moet afronden!
Errors en sort cases
Beschrijvende statistiek kun je ook gebruiken om te kijken of er ‘errors’ (waardes die buiten
de verwachte waardes vallen) zitten in de data. Je kunt die zoeken door op de volgende
knoppen te klikken:
Data Sort cases Variabelen toevoegen aan de box Ok
Als je een vreemde waarde (die je niet verwacht) ziet, mag je de hele rij selecteren en
verwijderen. Dat doe je door de rij te selecteren door op het grijze rijnummer te klikken links
in het beeld en op ‘clear’ te klikken (door rechtermuisknop)
Opsplitsen proefpersonen
Opsplitsen van proefpersonen in (twee) groepen doe je door op de volgende knoppen te
drukken:
Data split file Compare groups aanvinken vakje compare groups
variabele (waar het om gaat) toevoegen aan de box.
De beschrijvende statistieken laten zien wat er geldt in deze steekproef. Het wil dus niet
zeggen dat je deze resultaten zomaar kunt generaliseren naar de gehele populatie waarin je
geïnteresseerd bent.
Practicum 1: opdracht 3 (missing values- ontbrekende waarden)
Ontbrekende waarden kunnen om allerlei redenen voorkomen (weigeren om antwoord te
geven, de vraag niet begrijpen en daarom geen antwoord geven, een vraag over het hoofd
zien).
Het percentage en valid percentage zijn NIET hetzelfde:
- Het percentage wordt verkregen door de waargenomen frequentie te delen door de
totale N (inclusief respondenten met ontbrekende waarden).
- Valid percentage wordt verkregen door de waargenomen frequentie te delen door het
aantal respondenten met een geldige score. Eerst aantal missing afhalen van totale N.
SPSS beschouwt lege cellen als ‘system missing’ (de gegevens ontbreken). Het is een betere
strategie om codes te gebruiken voor de ontbrekende waarden (bijvoorbeeld met 999). Door