Susan van den Broek
Numerieke variabelen = getallen, string variabelen = tekst
Meetniveaus:
Kwalitatief (catagorische variabelen):
1. Nominaal: categorieën (bij 2 categorieën = dichotoom)
2. Ordinaal: rangorde
Kwantitatief (continue variabelen):
1. Interval: betekenisvolle verschillen
2. Ratio: absoluut nulpunt
Statistische analysse: relaties tussen variabelen
- Univariate analyse: beschrijven van één enkele variabele (geen relaties)
- Bivariate analyse: beschrijven samenhang/relatie tussen twee variabelen
- Multivariate analyse: beschrijven van samenhang/relatie van meer dan twee variabelen
(Trivariate analyse: drie variabelen)
1. Beschrijvend of toetsend? (bij deze cursus = beschrijvend)
2. Univariaat, bivariaat of trivariaat?
3. Grafisch of numeriek? (numerieke analysses zijn het meest eenduidig)
4. Welk meetniveau?
Kwalitatief (nominaal/ordinaal) Kwantitatief (interval/ratio)
Grafisch beschrijven - Staafdiagram - Histogram
- Taartdiagram - Boxplot
- Boxplot
Numeriek beschrijven Frequentietabel + Frequentietabel +
Centrum-en spreidingsmaten
Diagrammen in SPSS: Graphs legacys dialogs Centrum- en spreidingsmaten
(voor nominaal alleen modus)
(Percenteren: dubbelklikken op figuur elements show data labels percent)
Centrummaat: zegt iets over de locatie van de groep
- Modus: welke waarde heef de hoogste frequentie/ komt het vaakst voor (geldt bij alle
meetniveaus)
- Mediaan: middelste score in de waarnemingen/het punt waarop 50% bereikt is (geldt bij
ordinaal, interval of ratio meetniveau)
- Gemiddelde: evenwichtspunt van de verdeling (geldt bij interval en ratio meetniveau)
is gevoelig voor extreme cases/uitschieters
Spreidingsmaten: zegt iets over de variatie/spreiding van de groep
- Bereik/range: verschil tussen maximum en minimum: dus Max. – Min. (geldt bij ordinaal,
interval en ratio meetniveau) zeer gevoelig voor uitschieters
- Interkwartielafstand: IQR = Q3 – Q1 (geldt bij ordinaal, interval en ratio meetniveau)
- Standaardeviatie: in hoeverre wijkt iemands score af van het groepsgemiddelde? (geldt bij
interval en ratio meetniveau)
- Variantie: s2 de gemiddelde gekwadrateerde afstand tot het gemiddelde (interval en ratio)
Sums of Squared Errors (SS) = gekwadrateerde deviatiescores optellen!
1
, Susan van den Broek
Empirische regel: Bij een heuvelvormige/symmetrische verdeling
Centrum- en spreidingsmaten in SPSS:
Analysze Descriptive Statistics
Frequencies Statistics
Frequenties berekenen in Excel:
= COUNTIF (B1:B40;3)
Nu worden het aantal 3’en uit de
Regel van Chebysshev: bij scheve verdelingen
kolommen berekend. Vastzeten door
er $B$1:$B$40 van te maken
Als het gemiddelde lager is dan de mediaan heb je met een links-scheve verdeling te maken
Als het gemiddelde hoger is dan de mediaan heb je met een rechts-scheve verdeling te maken
Maten voor de relatieve locatie: percentielscore en z-score
Percentielscore (ordinaal/interval/ratio)
= het indelen van onderzoekseenheden in 10 subgroepen van gelijke groote (percentielen) de score
is dan het % respondenten dat zelfde of een lagere waarde scoort
SPSS: frequencies descriptive statistics statistics percentiles
Via frequentietabel: cumulatieve % (naar beneden afronden!)
x−gemiddelde
Z-score (interval/ratio) Z =
S
SPSS: Analysze Descriptive Statistics Descriptives Save standardized values as variables
Larger portion = hoeveel scoort lager? .93699 = 93,699%
Als een negatieve z-score hebt kan je ook naar de positieve z-score kijken maar dan moet je
omgekeerd redeneren en naar de Smaller portion kijken i.p.v. de Larger portion.
Boxplot maken in Excel: (=quartile.inq) eerst berekenen: min, Q1, mediaan, Q3, max. Dan mean
(average) en range (max – min) en IQR (Q3 – Q1). Dan alle frequenties selecteren
recommended charts box & whisker. Met muis op de box gaan staan: Format data series
inclusive median.De boxplot kan je dan checken door te kijken of het overeenkomt met je
berekeningen. 2
Numerieke variabelen = getallen, string variabelen = tekst
Meetniveaus:
Kwalitatief (catagorische variabelen):
1. Nominaal: categorieën (bij 2 categorieën = dichotoom)
2. Ordinaal: rangorde
Kwantitatief (continue variabelen):
1. Interval: betekenisvolle verschillen
2. Ratio: absoluut nulpunt
Statistische analysse: relaties tussen variabelen
- Univariate analyse: beschrijven van één enkele variabele (geen relaties)
- Bivariate analyse: beschrijven samenhang/relatie tussen twee variabelen
- Multivariate analyse: beschrijven van samenhang/relatie van meer dan twee variabelen
(Trivariate analyse: drie variabelen)
1. Beschrijvend of toetsend? (bij deze cursus = beschrijvend)
2. Univariaat, bivariaat of trivariaat?
3. Grafisch of numeriek? (numerieke analysses zijn het meest eenduidig)
4. Welk meetniveau?
Kwalitatief (nominaal/ordinaal) Kwantitatief (interval/ratio)
Grafisch beschrijven - Staafdiagram - Histogram
- Taartdiagram - Boxplot
- Boxplot
Numeriek beschrijven Frequentietabel + Frequentietabel +
Centrum-en spreidingsmaten
Diagrammen in SPSS: Graphs legacys dialogs Centrum- en spreidingsmaten
(voor nominaal alleen modus)
(Percenteren: dubbelklikken op figuur elements show data labels percent)
Centrummaat: zegt iets over de locatie van de groep
- Modus: welke waarde heef de hoogste frequentie/ komt het vaakst voor (geldt bij alle
meetniveaus)
- Mediaan: middelste score in de waarnemingen/het punt waarop 50% bereikt is (geldt bij
ordinaal, interval of ratio meetniveau)
- Gemiddelde: evenwichtspunt van de verdeling (geldt bij interval en ratio meetniveau)
is gevoelig voor extreme cases/uitschieters
Spreidingsmaten: zegt iets over de variatie/spreiding van de groep
- Bereik/range: verschil tussen maximum en minimum: dus Max. – Min. (geldt bij ordinaal,
interval en ratio meetniveau) zeer gevoelig voor uitschieters
- Interkwartielafstand: IQR = Q3 – Q1 (geldt bij ordinaal, interval en ratio meetniveau)
- Standaardeviatie: in hoeverre wijkt iemands score af van het groepsgemiddelde? (geldt bij
interval en ratio meetniveau)
- Variantie: s2 de gemiddelde gekwadrateerde afstand tot het gemiddelde (interval en ratio)
Sums of Squared Errors (SS) = gekwadrateerde deviatiescores optellen!
1
, Susan van den Broek
Empirische regel: Bij een heuvelvormige/symmetrische verdeling
Centrum- en spreidingsmaten in SPSS:
Analysze Descriptive Statistics
Frequencies Statistics
Frequenties berekenen in Excel:
= COUNTIF (B1:B40;3)
Nu worden het aantal 3’en uit de
Regel van Chebysshev: bij scheve verdelingen
kolommen berekend. Vastzeten door
er $B$1:$B$40 van te maken
Als het gemiddelde lager is dan de mediaan heb je met een links-scheve verdeling te maken
Als het gemiddelde hoger is dan de mediaan heb je met een rechts-scheve verdeling te maken
Maten voor de relatieve locatie: percentielscore en z-score
Percentielscore (ordinaal/interval/ratio)
= het indelen van onderzoekseenheden in 10 subgroepen van gelijke groote (percentielen) de score
is dan het % respondenten dat zelfde of een lagere waarde scoort
SPSS: frequencies descriptive statistics statistics percentiles
Via frequentietabel: cumulatieve % (naar beneden afronden!)
x−gemiddelde
Z-score (interval/ratio) Z =
S
SPSS: Analysze Descriptive Statistics Descriptives Save standardized values as variables
Larger portion = hoeveel scoort lager? .93699 = 93,699%
Als een negatieve z-score hebt kan je ook naar de positieve z-score kijken maar dan moet je
omgekeerd redeneren en naar de Smaller portion kijken i.p.v. de Larger portion.
Boxplot maken in Excel: (=quartile.inq) eerst berekenen: min, Q1, mediaan, Q3, max. Dan mean
(average) en range (max – min) en IQR (Q3 – Q1). Dan alle frequenties selecteren
recommended charts box & whisker. Met muis op de box gaan staan: Format data series
inclusive median.De boxplot kan je dan checken door te kijken of het overeenkomt met je
berekeningen. 2