Statistiek: data-analyse
Les 1 intikken en beschrijven
Kennisclip 1: inleiding SPSS en intikken v data
SPSS bestaat uit 2 tabbladen (links onderaan): dataview en variable view.
Dataview = data ingeven
Variabele view = variabelen en karakteristieken benoemen
> Label extra info
> Values betekenissen cijfers toekennen
> Missing codes voor missing values definiëren
Kolommen = variabelen
Rijen = observaties (= proefpersonen)
! alle data v 1 persoon worden op 1 rij ingegeven dezelfde variabele v verschillende
personen komen in een kolom
! zoveel mogelijk omzetten in cijfers (bv: geslacht)
Kwalitatieve variabelen = categorieën
Kwantitatieve variabelen = getallen
Missing values = lege waarden
In SPSS kunnen we missing values op 2 manieren definiëren:
vak open laten
code ingeven bij variable view
Select cases = deel vd data analyseren
> data > select cases > if condition is satisfied > if … (bv: geslacht = 1)
! opnieuw aanpassen voor volledige analyse: > data > select cases > all cases
Split file = data opsplitsen om te analyseren
> data > split file > organise output by groups > groups based on …
! opnieuw aanpassen voor volledige analyse: data > split file > analyse all cases
Kennisclip 2: data transformeren
RECODE
omzetten v oorspronkelijke categorien in een beperkt aantal nieuwe categorieen
het omscoren v testitems die negatief geformuleerd werden in positieve scores.
recode in to same variable
recode into diffrent variabele (voorkeur)
> transform > recode into diffrent variables > input variabele verschuiven > output variabele
benoemen (R voor/na naam oorspronkelijke variabele) > change > old en new values
definieren
, COMPUTE
= nieuwe variabele die het resultaat is v een berekening v oorspronkelijke var
> transform > compute variable > target variable (= nieuwe naam) > nummeric expression
- som: var1 + var2 + var3 + … (! houdt geen rekening met missing values)
- som: SUM(var1,var2,var3,…) (! houdt wel rekening met missing values)
- gemiddelde: SUM(var1,var2,var3,…)/aantal variabelen
- gemiddelde: SUM(var1, var2,var3,…)/Nvalid(var1,var2,var3) (! houdt rekening
met missing values)
- gemiddelde: MEAN(var1,var2,var3,…)
- logaritme: LG10(niet normaal verdeelde var)
Kennisclip 3: beschrijvende statistiek opvragen
Karaktristieken (frequenties, percentages, gemiddelde, standaarddeviatie,…) worden per
variabele opgevraagd. Dit kan via SPSS op 3 manieren:
FREQUENTIES
> analyse > descriptive statistics > frequenties > alle variabelen naar rechts verplaatsen >
statistics (> mean/median/modus/som/ standaard deviatie/skewness/kwartielen/min/max/
variance/range/… opvragen) > output wordt geopend:
Statistics: tabel met overzicht valide en missing values (+ opgevraagde gegevens)
Frequencies: frequentietabellen per variabele (! nuttig om intypfouten na te gaan)
DESCRIPTIVES
> analyse > descriptive statistics > descriptives > kwantitiatieve variabelen naar rechts
verplaatsen > options > gemiddelde/som/standaard deviatie/min/max/range/standard error
of the mean/… opvragen > output wordt geopend:
Descriptives: tabel met de opgevraagde beschrijvers van de kwantitatieve variabelen
EXPLORE
> analyse > descripitve statistics > explore > kwantitatieve variabelen naar recht verplaatsen
(> statistics > extra outliers en percentielen opvragen) > output wordt geopend:
Explore: tabel met overzicht valide en missing values + tabel met hele reeks beschrijvers van
de variabelen + grafieken (kennisclip 4)
MEEST VOLLEDIGE OPTIE
Kennisclip 4: beschrijvende grafieken
Grafieken geven een visuele indruk vd uitkomsten vd variabelen. Er bestaan verschillende
soorten grafieken en de keuze van de grafiek is afhankelijk van het type variabele (kwalitatief
of kwantitatief) en je doel.
Les 1 intikken en beschrijven
Kennisclip 1: inleiding SPSS en intikken v data
SPSS bestaat uit 2 tabbladen (links onderaan): dataview en variable view.
Dataview = data ingeven
Variabele view = variabelen en karakteristieken benoemen
> Label extra info
> Values betekenissen cijfers toekennen
> Missing codes voor missing values definiëren
Kolommen = variabelen
Rijen = observaties (= proefpersonen)
! alle data v 1 persoon worden op 1 rij ingegeven dezelfde variabele v verschillende
personen komen in een kolom
! zoveel mogelijk omzetten in cijfers (bv: geslacht)
Kwalitatieve variabelen = categorieën
Kwantitatieve variabelen = getallen
Missing values = lege waarden
In SPSS kunnen we missing values op 2 manieren definiëren:
vak open laten
code ingeven bij variable view
Select cases = deel vd data analyseren
> data > select cases > if condition is satisfied > if … (bv: geslacht = 1)
! opnieuw aanpassen voor volledige analyse: > data > select cases > all cases
Split file = data opsplitsen om te analyseren
> data > split file > organise output by groups > groups based on …
! opnieuw aanpassen voor volledige analyse: data > split file > analyse all cases
Kennisclip 2: data transformeren
RECODE
omzetten v oorspronkelijke categorien in een beperkt aantal nieuwe categorieen
het omscoren v testitems die negatief geformuleerd werden in positieve scores.
recode in to same variable
recode into diffrent variabele (voorkeur)
> transform > recode into diffrent variables > input variabele verschuiven > output variabele
benoemen (R voor/na naam oorspronkelijke variabele) > change > old en new values
definieren
, COMPUTE
= nieuwe variabele die het resultaat is v een berekening v oorspronkelijke var
> transform > compute variable > target variable (= nieuwe naam) > nummeric expression
- som: var1 + var2 + var3 + … (! houdt geen rekening met missing values)
- som: SUM(var1,var2,var3,…) (! houdt wel rekening met missing values)
- gemiddelde: SUM(var1,var2,var3,…)/aantal variabelen
- gemiddelde: SUM(var1, var2,var3,…)/Nvalid(var1,var2,var3) (! houdt rekening
met missing values)
- gemiddelde: MEAN(var1,var2,var3,…)
- logaritme: LG10(niet normaal verdeelde var)
Kennisclip 3: beschrijvende statistiek opvragen
Karaktristieken (frequenties, percentages, gemiddelde, standaarddeviatie,…) worden per
variabele opgevraagd. Dit kan via SPSS op 3 manieren:
FREQUENTIES
> analyse > descriptive statistics > frequenties > alle variabelen naar rechts verplaatsen >
statistics (> mean/median/modus/som/ standaard deviatie/skewness/kwartielen/min/max/
variance/range/… opvragen) > output wordt geopend:
Statistics: tabel met overzicht valide en missing values (+ opgevraagde gegevens)
Frequencies: frequentietabellen per variabele (! nuttig om intypfouten na te gaan)
DESCRIPTIVES
> analyse > descriptive statistics > descriptives > kwantitiatieve variabelen naar rechts
verplaatsen > options > gemiddelde/som/standaard deviatie/min/max/range/standard error
of the mean/… opvragen > output wordt geopend:
Descriptives: tabel met de opgevraagde beschrijvers van de kwantitatieve variabelen
EXPLORE
> analyse > descripitve statistics > explore > kwantitatieve variabelen naar recht verplaatsen
(> statistics > extra outliers en percentielen opvragen) > output wordt geopend:
Explore: tabel met overzicht valide en missing values + tabel met hele reeks beschrijvers van
de variabelen + grafieken (kennisclip 4)
MEEST VOLLEDIGE OPTIE
Kennisclip 4: beschrijvende grafieken
Grafieken geven een visuele indruk vd uitkomsten vd variabelen. Er bestaan verschillende
soorten grafieken en de keuze van de grafiek is afhankelijk van het type variabele (kwalitatief
of kwantitatief) en je doel.