Statistiek 3
ALGEMEEN
Variabelen:
- Numeric = getalwaarden
- String = zonder getalwaarden → dus: hiermee kan je geen numerieke operaties uitvoeren
- Comma/dot = scheidingsteken
Meetniveaus:
1) Nominaal
• = gelijk of verschillend
• Bv. elke politieke partij heeft een getal
• De getallen zelf hebben weinig betekenis en ook bewerkingen hebben weinig zin
2) Ordinaal
• = rangorde
• Hoger/lager, meer/minder
• Bv. 2 is meer dan 1 en minder dan 3
3) Interval
• = de verhouding tss verschillen
• Bv. 20°C is niet dubbel zo warm als 10°C
MAAR: het verschil tss 10°C en 20°C & 30°C en 40°C is even groot
‘scale’ in SPSS
4) Ratio
• = verhoudingen tss getalwaarden
• Bv. lengte en gewicht
• Dit kan je vermenigvuldigen
5) Absoluut
• = getalwaarden op zich
• Bv. hvl mensen aanwezig zijn
Kolom en rij:
- Kolom: ↕
- Rij: ↔
Komma
Getallen na komma in tabel (SPSS)?
= dubbelklik op tabel → celformat
1
,SPSS
Syntax editor
Paste → code selecteren → op ‘play’ drukken (groen driehoekje) → daarna: code aanpassen
Een deel selecteren (of alles) en op play drukken
Andere optie: ‘Run’:
- ‘All’ = alle instructies i/h syntaxbestand worden uitgevoerd
- ‘To end’ = alle instructies worden uitgevoerd, vanaf de plaats waar de cursor staat tot
het einde v/h bestand
Syntax opslaan?
- File → save as
- = voor als je er later op wil terugkomen
Txt-bestand
3 vragen:
1) Staan de variabelennamen op de 1ste rij?
(getallen ≠ variabelennamen)
2) Hoe zijn de kolommen van elkaar gescheiden?
3) Decimaalteken dat gebruik wordt?
In SPPS:
- Predefined format? → no
- Scheiding tss kolommen? → delimited
- Staan variabele namen van boven in de file?
- Decimaal teken? → komma of punt
(als geen decimaal teken, dan maakt het niet uit of je komma of punt kiest)
- Volgende venster = niks aanpassen
- Welk scheidingsteken tss variabelen?
- Namen kunnen aangepast worden, moet niet (data format: automatic)
- Finish
Belangrijk: decimaal teken goed aangeven !
2
, Ontbrekende waarden
Data → sort cases
- 1 voor 1 selecteren OF allemaal en ‘descending’
- Belangrijk: numeric variabelen allemaal samen selecteren hierbij
➔ Worden ze als ‘missing’ erkend door SPSS?
= analyze → descriptive statistics → frequencies → kijken bij ‘missing’ in tabel
➔ Zo niet: ze ingeven als ‘missing’ bij SPSS
= variable view: bij ‘missing’ van de variabele → bij discrete missing values:
• Spatie typen
• Getal typen (bv. 999)
➔ Bij numeric variabelen, wordt een spatie automatisch als ‘missing’ gezien
Onmogelijke waarden
Analyze → descriptive statistics → frequencies
Getallen in eerste grijze kolom bekijken, vallen ze binnen het bereik?
Nee? = dan onmogelijke waarde
Daarna: adhv data view bekijken over welke pp het gaat
Analyze → descriptive statistics → explore → statistics → ‘outliers’
De 5 hoogste en 5 laagste waarden worden gegeven
Wegselecteren van onmogelijke waarden
Data → select cases → variabele aanduiden → ‘if condition is satisfied’ → ‘IF’
Invullen
• Bv.: Ppnr ≈= 10 & …
→ alles wordt hierbij behouden, behalve het deel dat achter ‘≈=’ komt
• Bv.: Sit 5 > 10 & …
Wat wordt ingevuld bij ‘IF’ wordt wel gebruikt bij berekeningen
‘Edit’ → ‘hide excluded cases’ aanvinken om te controleren
3
ALGEMEEN
Variabelen:
- Numeric = getalwaarden
- String = zonder getalwaarden → dus: hiermee kan je geen numerieke operaties uitvoeren
- Comma/dot = scheidingsteken
Meetniveaus:
1) Nominaal
• = gelijk of verschillend
• Bv. elke politieke partij heeft een getal
• De getallen zelf hebben weinig betekenis en ook bewerkingen hebben weinig zin
2) Ordinaal
• = rangorde
• Hoger/lager, meer/minder
• Bv. 2 is meer dan 1 en minder dan 3
3) Interval
• = de verhouding tss verschillen
• Bv. 20°C is niet dubbel zo warm als 10°C
MAAR: het verschil tss 10°C en 20°C & 30°C en 40°C is even groot
‘scale’ in SPSS
4) Ratio
• = verhoudingen tss getalwaarden
• Bv. lengte en gewicht
• Dit kan je vermenigvuldigen
5) Absoluut
• = getalwaarden op zich
• Bv. hvl mensen aanwezig zijn
Kolom en rij:
- Kolom: ↕
- Rij: ↔
Komma
Getallen na komma in tabel (SPSS)?
= dubbelklik op tabel → celformat
1
,SPSS
Syntax editor
Paste → code selecteren → op ‘play’ drukken (groen driehoekje) → daarna: code aanpassen
Een deel selecteren (of alles) en op play drukken
Andere optie: ‘Run’:
- ‘All’ = alle instructies i/h syntaxbestand worden uitgevoerd
- ‘To end’ = alle instructies worden uitgevoerd, vanaf de plaats waar de cursor staat tot
het einde v/h bestand
Syntax opslaan?
- File → save as
- = voor als je er later op wil terugkomen
Txt-bestand
3 vragen:
1) Staan de variabelennamen op de 1ste rij?
(getallen ≠ variabelennamen)
2) Hoe zijn de kolommen van elkaar gescheiden?
3) Decimaalteken dat gebruik wordt?
In SPPS:
- Predefined format? → no
- Scheiding tss kolommen? → delimited
- Staan variabele namen van boven in de file?
- Decimaal teken? → komma of punt
(als geen decimaal teken, dan maakt het niet uit of je komma of punt kiest)
- Volgende venster = niks aanpassen
- Welk scheidingsteken tss variabelen?
- Namen kunnen aangepast worden, moet niet (data format: automatic)
- Finish
Belangrijk: decimaal teken goed aangeven !
2
, Ontbrekende waarden
Data → sort cases
- 1 voor 1 selecteren OF allemaal en ‘descending’
- Belangrijk: numeric variabelen allemaal samen selecteren hierbij
➔ Worden ze als ‘missing’ erkend door SPSS?
= analyze → descriptive statistics → frequencies → kijken bij ‘missing’ in tabel
➔ Zo niet: ze ingeven als ‘missing’ bij SPSS
= variable view: bij ‘missing’ van de variabele → bij discrete missing values:
• Spatie typen
• Getal typen (bv. 999)
➔ Bij numeric variabelen, wordt een spatie automatisch als ‘missing’ gezien
Onmogelijke waarden
Analyze → descriptive statistics → frequencies
Getallen in eerste grijze kolom bekijken, vallen ze binnen het bereik?
Nee? = dan onmogelijke waarde
Daarna: adhv data view bekijken over welke pp het gaat
Analyze → descriptive statistics → explore → statistics → ‘outliers’
De 5 hoogste en 5 laagste waarden worden gegeven
Wegselecteren van onmogelijke waarden
Data → select cases → variabele aanduiden → ‘if condition is satisfied’ → ‘IF’
Invullen
• Bv.: Ppnr ≈= 10 & …
→ alles wordt hierbij behouden, behalve het deel dat achter ‘≈=’ komt
• Bv.: Sit 5 > 10 & …
Wat wordt ingevuld bij ‘IF’ wordt wel gebruikt bij berekeningen
‘Edit’ → ‘hide excluded cases’ aanvinken om te controleren
3