Werkcollege 1
Hoofdstuk 3: introductie tot SPSS
Inleiding
- SPSS: the IBM Statistical Package fort he Social Sciences
- Excell → beschrijvend
- SPSS → descriptieve of inferentiële analyses
SPSS omgeving
- Data view → kolom variabelen
- Variable view → rij variabelen
- Label → vraagverwoording
- Sneltoetsen → alt + onderlijnde letter
- Drie hoofdvensters: data editor, output viewer & syntax editor
Data beheren in Data Editor
Data view
- Variabelen in kolommen (columns)
- Onderzoekseenheden in rijen (cases in rows)
- 1 rij = waarden van 1 respondent voor alle variabelen
Variable view
- Codeboek, overzicht van variabelen
- Variabelen in rijen
- Kenmerken van variabelen in kolommen
- 1 rij = alle kenmerken van één variabele
- Bij categorische variabelen kan je zien hoe de variabelen bevraagd weren én welke
antwoordmogelijkheden er waren (blauwe knop met 3 puntjes) → bij ‘values’
SPSS commando’s uitvoeren via dialoogvensters
- SPSS-commando = opdracht binnen SPSS (via schrijven van coderingen in de Syntax Editor OF via
de tabbladen in de menubalk) → keuze via dialoogvensters vb. Analyze >> Descriptives >>
Frequencies
Output interpreteren in Output Viewer
- Outputs: resultaten commando’s + foutmeldingen → opslaan met .spv extensie
- Via dubbelklikken de output verder aanpassen vb. Chart Editor (H7)
Overzicht bewaren via Syntax Editor
Commando’s uitvoeren
- Optie 1: op OK klikken in dialoogvenster → meteen uitvoeren
- Optie 2: op Paste klikken → commando wordt geplakt in apart venster, de Syntax Editor
(bewaard om later uit te voeren)
- Optie 3: zelf scripts/coderingen uitschrijven in Syntax Editor
Syntax editor openen: op Paste drukken ipv OK of openen via File >> New >> Syntax
1
,Waarom Syntax gebruiken
- Tijdswinst: je kan ze kopiëren, bewerken etc MAAR opletten dat je na elk commando een punt
zet (anders niet uitvoerbaar)
- Overzicht & structuur: je kan tussentitels toevoegen MAAR opletten dat je aan het begin van
elke regel een * zet en op het einde een punt → iedereen kan het controleren
Blauw: hoofdcommando’s
Groen: subcommando’s
Rood: welke opties je invulde per hoofd- of subcategorie
Zwart: welke variabelen op datasets gebruikt zullen worden in de
commando’s
SPSS afsluiten
- Regelmatig opslagen + kopieën opslagen van je originele dataset
Oefeningen
- Boek p. 96-97
- Pivot Table Labeling → Edit >> Opions >> Output
Hoofdstuk 4: databeheer
Inleiding
- Data cleaning: controleren op fouten via frequentietabellen & cases met veel ontbrekende
waarden verwijderen
- Bij manueel invoeren .xlsx of .csv → importeren in SPSS en omzetten naar een SPSS-databestand
met .sav als extentie
Invoeren van data
Data manueel invoeren
- Papieren vragenlijst manueel invoeren in Data Editor via twee stappen
1. Vragen omzetten in variabelen via Variable View
2. Antwoorden omzetten in waarden via Data View
Vragen omzetten in variabelen
- Name: naam vd variabele
- Type: Numeric (numerieke waarden) of String (letters of andere tekens vb. open antwoord)
o Type niet verwarren met Measure, type heeft niets met meetniveau te maken. Op
stringvariabelen kunnen geen analyses worden uitgevoerd
- Width: max aantal karakter dat een waarde kan aannemen (vb. 103 = 3 karakters) Columns:
het estethische – hoeveel karakters getoond worden in de data view aka hoeveel kolommen)
- Decimals: hoeveel decimalen na de komma
- Label: uitgebreide beschrijving van variabele (vb. exacte formulering surveyvraag)
2
,- Values: waarden benoemen bij categorische variabelen (blijft leeg bij metrische variabelen)
- Missing: ontbrekende/ongeldige waarden (hier: user-missing values kiezen)
o Drie types user-missing values: weigering (77, 777, 7777, …), niet van toepassing (88, 888,
8888, …), antwoord niet geweten (99, 999, 9999, …)
o System-missing values: je vult niets in en SPSS plaatst (.)
o User-missing values: opvallende waarden geven om aan te duiden waarom ze ontbreken
(let op dat ze zeker niet kunnen voorkomen vb. 999 bij codering met 0 en 1)
- Align: puur lay-out → uitlijnen van waarden (links, centraal of rechts)
- Measure: meetniveau (Nominal, Ordinal of Scale)
- Role: rol van de variabele (OV, AV of beïnvloedend → laat steeds standaard ‘Input’ staan
Vragen omzetten in variabelen
- 4 vragen = 4 variabelen
- Variable view
Antwoorden omzetten in waarden
- Bij data view
- Per respondent waarden ingeven voor elke variabele
Oefening databestand aanmaken → dia 15- (width, decimals, missing, columns, align & role kunnen
vaak op de standaardopties blijven)
Data importeren
- Vaak bestaande bestanden importeren (soms .xlsx of .csv → importeren in SPSS om het in .sav-
formaat te zetten)
- Meerdere bestanden? Samenvoegen!
- Data uit Excel-bestand importeren: File >> Import Data >> Excel
o Opslaan als .sav-bestand via File >> Save as
o Idem voor CSV-bestand (comma-seperated values)
Data cleaning
Controleren van data via Frequencies
- Altijd eerst frequentietabel (valid, missing, total) opvragen voor het uitvoeren van analyses →
controleren op fouten in data
- Frequentietabel opvragen: Analyze >> Descriptive Statistics >> Frequencies
- Aanpassen weergave tabel: Edit >> Options >>
Output >> Pivot Table Labeling
- Oefening dia 28-30
Foutieve of ontbrekende waarden aanpakken
Foutieve waarden
1. Systematische fouten
o Vb. in codeboek 1=helemaal niet akkoord tem 5=helemaal akkoord maar in datamatrix:
0=helemaal niet akkoord tem 4=helemaal akkoord
o Oplossing: variabele hercoderen (via Recode)
3
, 2. Eenmalige fouten
o Toevallig vb. typfout onderzoeker of vraag verkeerd gelezen door respondent vb. hij geeft
36 in ipv geboortejaar 1984
o Oplossing
• Foute waarde veranderen in user-missing value (vb. 999) → bijvoorbeeld als je in de
frequentietabel ziet dat de waarden 2 & 11 erin voorkomen terwijl enkel 0 (nee) en 1
(ja) mogelijk zijn
➢ Aanduiden als ontbrekend (variable view): via Replace
➢ Aanduiden als ontbrekend (data view): klik op kolomtitel en dan Edit
>> Replace
• Foute waarde veranderen in juiste waarde (enkel wnr 100% zeker!!!)
➢ Corrigeren: via Replace (find 19; replace 2002) – indien onzeker: 999
Ontbrekende waarden
- Willekeurig ontbrekende waarden vb. vermoeidheid, te snel invullen
- Systematisch ontbrekende waarden vb. gevoelige vraag
- Problematisch bij grote aantallen → groot verlies aan informatie
Ontbrekende waarden: oplossingen
1. Imputeren van ontbrekende waarden
o Enkel bij MCAR
o Systematisch ontbrekende waarden niet verwarren met system-missing values!
o Vb. leeftijd maar soms gemiddelde als goede schatter
2. Verwijderen van items
o Goed bij veel systematisch ontbrekende waarden
o In Variable View: rechtermuisklik en Clear
3. Verwijderen van cases
o In Data View: rechtermuisklik en Clear
o Ongedaan maken: Edit >> Undo !!
4. ‘Wil ik liever niet zeggen’ toevoegen (soms omgekeerd effect: meer mensen die x antwoorden)
5. Forced response (andere problemen: willekeurig klikken om verder te kunnen)
Databestanden samenvoegen, filteren of splitsen
Samenvoegen van databestanden via Merge
Samenvoegen van bestanden
- Max 2 bestanden in één keer
- Manieren
1. Toevoegen van cases (Add cases)
2. Toevoegen van variabelen (Add variables)
Toevoegen van cases (Add cases)
- Vb. laattijdige cases toevoegen aan reeds verzamelde cases
- Beide bestanden hebben dezelfde variabelen
- Samenvoegen via Add cases: Data >> Merge files >> Add Cases (beide
bestanden openen!!!)
4
Hoofdstuk 3: introductie tot SPSS
Inleiding
- SPSS: the IBM Statistical Package fort he Social Sciences
- Excell → beschrijvend
- SPSS → descriptieve of inferentiële analyses
SPSS omgeving
- Data view → kolom variabelen
- Variable view → rij variabelen
- Label → vraagverwoording
- Sneltoetsen → alt + onderlijnde letter
- Drie hoofdvensters: data editor, output viewer & syntax editor
Data beheren in Data Editor
Data view
- Variabelen in kolommen (columns)
- Onderzoekseenheden in rijen (cases in rows)
- 1 rij = waarden van 1 respondent voor alle variabelen
Variable view
- Codeboek, overzicht van variabelen
- Variabelen in rijen
- Kenmerken van variabelen in kolommen
- 1 rij = alle kenmerken van één variabele
- Bij categorische variabelen kan je zien hoe de variabelen bevraagd weren én welke
antwoordmogelijkheden er waren (blauwe knop met 3 puntjes) → bij ‘values’
SPSS commando’s uitvoeren via dialoogvensters
- SPSS-commando = opdracht binnen SPSS (via schrijven van coderingen in de Syntax Editor OF via
de tabbladen in de menubalk) → keuze via dialoogvensters vb. Analyze >> Descriptives >>
Frequencies
Output interpreteren in Output Viewer
- Outputs: resultaten commando’s + foutmeldingen → opslaan met .spv extensie
- Via dubbelklikken de output verder aanpassen vb. Chart Editor (H7)
Overzicht bewaren via Syntax Editor
Commando’s uitvoeren
- Optie 1: op OK klikken in dialoogvenster → meteen uitvoeren
- Optie 2: op Paste klikken → commando wordt geplakt in apart venster, de Syntax Editor
(bewaard om later uit te voeren)
- Optie 3: zelf scripts/coderingen uitschrijven in Syntax Editor
Syntax editor openen: op Paste drukken ipv OK of openen via File >> New >> Syntax
1
,Waarom Syntax gebruiken
- Tijdswinst: je kan ze kopiëren, bewerken etc MAAR opletten dat je na elk commando een punt
zet (anders niet uitvoerbaar)
- Overzicht & structuur: je kan tussentitels toevoegen MAAR opletten dat je aan het begin van
elke regel een * zet en op het einde een punt → iedereen kan het controleren
Blauw: hoofdcommando’s
Groen: subcommando’s
Rood: welke opties je invulde per hoofd- of subcategorie
Zwart: welke variabelen op datasets gebruikt zullen worden in de
commando’s
SPSS afsluiten
- Regelmatig opslagen + kopieën opslagen van je originele dataset
Oefeningen
- Boek p. 96-97
- Pivot Table Labeling → Edit >> Opions >> Output
Hoofdstuk 4: databeheer
Inleiding
- Data cleaning: controleren op fouten via frequentietabellen & cases met veel ontbrekende
waarden verwijderen
- Bij manueel invoeren .xlsx of .csv → importeren in SPSS en omzetten naar een SPSS-databestand
met .sav als extentie
Invoeren van data
Data manueel invoeren
- Papieren vragenlijst manueel invoeren in Data Editor via twee stappen
1. Vragen omzetten in variabelen via Variable View
2. Antwoorden omzetten in waarden via Data View
Vragen omzetten in variabelen
- Name: naam vd variabele
- Type: Numeric (numerieke waarden) of String (letters of andere tekens vb. open antwoord)
o Type niet verwarren met Measure, type heeft niets met meetniveau te maken. Op
stringvariabelen kunnen geen analyses worden uitgevoerd
- Width: max aantal karakter dat een waarde kan aannemen (vb. 103 = 3 karakters) Columns:
het estethische – hoeveel karakters getoond worden in de data view aka hoeveel kolommen)
- Decimals: hoeveel decimalen na de komma
- Label: uitgebreide beschrijving van variabele (vb. exacte formulering surveyvraag)
2
,- Values: waarden benoemen bij categorische variabelen (blijft leeg bij metrische variabelen)
- Missing: ontbrekende/ongeldige waarden (hier: user-missing values kiezen)
o Drie types user-missing values: weigering (77, 777, 7777, …), niet van toepassing (88, 888,
8888, …), antwoord niet geweten (99, 999, 9999, …)
o System-missing values: je vult niets in en SPSS plaatst (.)
o User-missing values: opvallende waarden geven om aan te duiden waarom ze ontbreken
(let op dat ze zeker niet kunnen voorkomen vb. 999 bij codering met 0 en 1)
- Align: puur lay-out → uitlijnen van waarden (links, centraal of rechts)
- Measure: meetniveau (Nominal, Ordinal of Scale)
- Role: rol van de variabele (OV, AV of beïnvloedend → laat steeds standaard ‘Input’ staan
Vragen omzetten in variabelen
- 4 vragen = 4 variabelen
- Variable view
Antwoorden omzetten in waarden
- Bij data view
- Per respondent waarden ingeven voor elke variabele
Oefening databestand aanmaken → dia 15- (width, decimals, missing, columns, align & role kunnen
vaak op de standaardopties blijven)
Data importeren
- Vaak bestaande bestanden importeren (soms .xlsx of .csv → importeren in SPSS om het in .sav-
formaat te zetten)
- Meerdere bestanden? Samenvoegen!
- Data uit Excel-bestand importeren: File >> Import Data >> Excel
o Opslaan als .sav-bestand via File >> Save as
o Idem voor CSV-bestand (comma-seperated values)
Data cleaning
Controleren van data via Frequencies
- Altijd eerst frequentietabel (valid, missing, total) opvragen voor het uitvoeren van analyses →
controleren op fouten in data
- Frequentietabel opvragen: Analyze >> Descriptive Statistics >> Frequencies
- Aanpassen weergave tabel: Edit >> Options >>
Output >> Pivot Table Labeling
- Oefening dia 28-30
Foutieve of ontbrekende waarden aanpakken
Foutieve waarden
1. Systematische fouten
o Vb. in codeboek 1=helemaal niet akkoord tem 5=helemaal akkoord maar in datamatrix:
0=helemaal niet akkoord tem 4=helemaal akkoord
o Oplossing: variabele hercoderen (via Recode)
3
, 2. Eenmalige fouten
o Toevallig vb. typfout onderzoeker of vraag verkeerd gelezen door respondent vb. hij geeft
36 in ipv geboortejaar 1984
o Oplossing
• Foute waarde veranderen in user-missing value (vb. 999) → bijvoorbeeld als je in de
frequentietabel ziet dat de waarden 2 & 11 erin voorkomen terwijl enkel 0 (nee) en 1
(ja) mogelijk zijn
➢ Aanduiden als ontbrekend (variable view): via Replace
➢ Aanduiden als ontbrekend (data view): klik op kolomtitel en dan Edit
>> Replace
• Foute waarde veranderen in juiste waarde (enkel wnr 100% zeker!!!)
➢ Corrigeren: via Replace (find 19; replace 2002) – indien onzeker: 999
Ontbrekende waarden
- Willekeurig ontbrekende waarden vb. vermoeidheid, te snel invullen
- Systematisch ontbrekende waarden vb. gevoelige vraag
- Problematisch bij grote aantallen → groot verlies aan informatie
Ontbrekende waarden: oplossingen
1. Imputeren van ontbrekende waarden
o Enkel bij MCAR
o Systematisch ontbrekende waarden niet verwarren met system-missing values!
o Vb. leeftijd maar soms gemiddelde als goede schatter
2. Verwijderen van items
o Goed bij veel systematisch ontbrekende waarden
o In Variable View: rechtermuisklik en Clear
3. Verwijderen van cases
o In Data View: rechtermuisklik en Clear
o Ongedaan maken: Edit >> Undo !!
4. ‘Wil ik liever niet zeggen’ toevoegen (soms omgekeerd effect: meer mensen die x antwoorden)
5. Forced response (andere problemen: willekeurig klikken om verder te kunnen)
Databestanden samenvoegen, filteren of splitsen
Samenvoegen van databestanden via Merge
Samenvoegen van bestanden
- Max 2 bestanden in één keer
- Manieren
1. Toevoegen van cases (Add cases)
2. Toevoegen van variabelen (Add variables)
Toevoegen van cases (Add cases)
- Vb. laattijdige cases toevoegen aan reeds verzamelde cases
- Beide bestanden hebben dezelfde variabelen
- Samenvoegen via Add cases: Data >> Merge files >> Add Cases (beide
bestanden openen!!!)
4