Statistiek
STATISTIEK
1. Univariate beschrijvende statistiek
1.1. Basisconcepten
° Onderzoekelementen of eenheden: onderdelen waarop onderzoek betrekking heeft
- Moet je definiëren / afbakenen
- Moet je meten (vragen)
° Onderzoekspopulatie: verzameling van alle elementen
- Moet je definiëren / afbakenen
- Beperkt je uitslag (tijd & ruimte)
° Analyse, statistische eenheid: eenheid waarop analyse / onderzoek gebeurt
° Kenmerk: eigenschap van element of eenheid
° Variabele: kenmerk dat varieert over de eenheden
° Uitkomstenverzameling: verzameling van alle mogelijke uitkomsten van variabele
° Meten: waarde van kenmerk bij bepaald element
- 1: Nauwkeurigheid
Manier van meten zal je meer of minder info geven
Exactheid
- 2: Betrouwbaarheid
Consistentie
Blijven antwoorden hetzelfde?
- 3: Validiteit
Mate van overeenkomst tussen indicator & concept
Denken iets gemeten te hebben, dat je niet hebt
Bv: hoeveel keer naar (kunst)‘museum’ gegaan
Mensen vermelden ook andere musea, resultaat is niet correct
° Waarde: resultaat van meten
Alle bovenstaande zaken in gegevens set, dataset, datamatrix
° Meetniveau (hoeveelheid van info) van variabelen
Hierdoor bepaalde zaken toegestaan of verboden
- 1. Kwalitatieve / Categorische variabelen
o 1.1. Nominale kenmerken: volledig (exhaustieve) & niet overlappende (exclusieve)
classificatie
Geslacht, haarkleur (weinig info)
o 1.2. Ordinale kenmerken: Mogelijk om te ordenen
Opleidingsniveau
- 2. Kwantische / Metrische variabelen
o 2.1. Intervalvariabelen: afstand tussen waarden & betekenis geven
Leeftijd (iemand van 20 ouder dan 18)
o 2.2. Ratiovariabelen: Absoluut nulpunt aanwezig
Intervalvariabelen met nulpunt
1
, Statistiek
Leeftijd niet onder nul (veel info)
° Nominaal < Ordinaal < Interval < Ratio
° Transformatie tussen meting & analyse
- Meting op ratio
- Analyse op ordening
° Andere classificatie o.b.v. uitkomstenverzameling
- 3. Continue variabelen
o Tussen 2 mogelijke uitkomsten een 3de ligt
Oneindige uitkomstenverzameling (reële getallen)
Exacte leeftijd (tot seconden)
!!! klassen moeten exclusief zijn [25 – 50[ & [50 – 75[
!!! weergegeven (25 – 50) & werkelijk (24,5 – 49,5)
° Werkelijke klassengrenzen afhankelijk van meetprocedure
- 4. Discrete variabele
o Eindige uitkomstenverzameling
Aantal kinderen
1.2. Frequentieverdelingen
1.2.1. Frequenties, klassenindelingen
a. Absolute & Relatieve frequentie
° Absolute frequentie: # elementen met bepaalde waarde
- fi
o i: waarde, met m waaden
o fi = pi * n
Proportie * # elementen
° Relatieve frequentie, proportie : # elementen met bepaalde waarden / totaal # elementen
- pi : Fractie / proportie:
o pi = fi / n
Af / # Elementen
° Aantal elementen (n)
m
∑ fi
i=1
- De som van van alle fi, vanaf de eerste (i = 1) tot de laatste (m)
- f1 + f2 + f… + fm
b. Frequentietabellen opstellen
° Frequentietabel
- Indelen via klassen
o Klassengrenzen
Laagste waarde Hoogste waarde
o Klassenmidden
Laagste waarde + Hoogste waarde / 2
2
, Statistiek
Informatie Frequentie: fi Proportie: pi Percentage (pi * Cumulatieve Cumulatieve
100) frequentie percentage
….
n 100
Totaal: n 1 100
- Cumulatieve frequentie: # of proportie eenheden met waarde i of lager
o Vanaf ordinaal meetniveau
c. Grafieken
° 1/ Taartdiagram: ° 2/ Staafdiagram
αi = hoek voor waarde i L = lengte van nulpunt tot maximum in grafiek
αi = pi * 360° Li = Lengte van staaf voor waarde i
- + Visueel duidelijk Li = pi * L
- - # waarden beperkt
- Losse staafjes
- + Meer waarden opnemen & splitsen
- - Misleidende grafieken
Frequentieverdeling van categorische variabele
°3/ Histogram
- Metrische variabelen in klassen gegroepeerd
- fi = oppervlakte van staafje
- n of 1 = totale oppervlakte
- Ii = Klassenbreedte klasse i
- hi = frequentiedichtheid
o fi / Ii
- Frequentieverdeling van metrische variabelen
+ : visueel duidelijk
-: verdeling afhankelijk van klassen
! Verschil in %: omschrijven als % punten
! Opletten bij bepaalde grafiek o.b.v.
- Onderzoek wordt maar 1 keer gedaan
- Geen conclusie als mensen ouder worden (vaak andere generatie)
1.3. Maten van positie
1.3.1. Rekenkundig gemiddelde
3
, Statistiek
a. Rekenkundig gemiddelde
- 1/ Individuele waarnemingen
- 2/ Absolute frequentie: (fi * info) + (fi * info) / totaal
- 3/ Relatieve frequentie: (pi * info) + pi * info) / totaal
- 4/ Gegroepeerde gegevens (fi * midden van info) + (fi * midden van info) / totaal
0 – 5 = fi * 2,5
b. Kenmerken rekenkundig gemiddelde
° Enkel voor metrische variabelen / klassen
° Evenwichtspunt van verdeling (zwaartepunt)
° Gevoelig voor uitschieters / geen resistente maat
° Deviatiescore: som hiervan is 0
1.3.2. Mediaan
° Mediaan: M
- Middenpunt van de verdeling
- Evenveel waarnemingen met lagere waarde als met hogere
1/ Ordenen van laag naar hoog
2/ Middelste nemen
even # waarnemingen: gemiddelde van middelste
° Mediaan afleiden uit frequentietabel
(1) Cumulatieve frequentie
- ((n + 1) / 2 ) Eén keer per week 874 49%
= 882,5 (M)
Meerdere keren per week 1489 84%
(2) Relatieve cumulatieve
frequentie Dagelijks 1764 100%
- Kijken naar de 50%
1.3.3. Modus
° M0 : waarde met hoogste frequentie
Getrouwd 797
Gescheiden 179
Single 345
4
STATISTIEK
1. Univariate beschrijvende statistiek
1.1. Basisconcepten
° Onderzoekelementen of eenheden: onderdelen waarop onderzoek betrekking heeft
- Moet je definiëren / afbakenen
- Moet je meten (vragen)
° Onderzoekspopulatie: verzameling van alle elementen
- Moet je definiëren / afbakenen
- Beperkt je uitslag (tijd & ruimte)
° Analyse, statistische eenheid: eenheid waarop analyse / onderzoek gebeurt
° Kenmerk: eigenschap van element of eenheid
° Variabele: kenmerk dat varieert over de eenheden
° Uitkomstenverzameling: verzameling van alle mogelijke uitkomsten van variabele
° Meten: waarde van kenmerk bij bepaald element
- 1: Nauwkeurigheid
Manier van meten zal je meer of minder info geven
Exactheid
- 2: Betrouwbaarheid
Consistentie
Blijven antwoorden hetzelfde?
- 3: Validiteit
Mate van overeenkomst tussen indicator & concept
Denken iets gemeten te hebben, dat je niet hebt
Bv: hoeveel keer naar (kunst)‘museum’ gegaan
Mensen vermelden ook andere musea, resultaat is niet correct
° Waarde: resultaat van meten
Alle bovenstaande zaken in gegevens set, dataset, datamatrix
° Meetniveau (hoeveelheid van info) van variabelen
Hierdoor bepaalde zaken toegestaan of verboden
- 1. Kwalitatieve / Categorische variabelen
o 1.1. Nominale kenmerken: volledig (exhaustieve) & niet overlappende (exclusieve)
classificatie
Geslacht, haarkleur (weinig info)
o 1.2. Ordinale kenmerken: Mogelijk om te ordenen
Opleidingsniveau
- 2. Kwantische / Metrische variabelen
o 2.1. Intervalvariabelen: afstand tussen waarden & betekenis geven
Leeftijd (iemand van 20 ouder dan 18)
o 2.2. Ratiovariabelen: Absoluut nulpunt aanwezig
Intervalvariabelen met nulpunt
1
, Statistiek
Leeftijd niet onder nul (veel info)
° Nominaal < Ordinaal < Interval < Ratio
° Transformatie tussen meting & analyse
- Meting op ratio
- Analyse op ordening
° Andere classificatie o.b.v. uitkomstenverzameling
- 3. Continue variabelen
o Tussen 2 mogelijke uitkomsten een 3de ligt
Oneindige uitkomstenverzameling (reële getallen)
Exacte leeftijd (tot seconden)
!!! klassen moeten exclusief zijn [25 – 50[ & [50 – 75[
!!! weergegeven (25 – 50) & werkelijk (24,5 – 49,5)
° Werkelijke klassengrenzen afhankelijk van meetprocedure
- 4. Discrete variabele
o Eindige uitkomstenverzameling
Aantal kinderen
1.2. Frequentieverdelingen
1.2.1. Frequenties, klassenindelingen
a. Absolute & Relatieve frequentie
° Absolute frequentie: # elementen met bepaalde waarde
- fi
o i: waarde, met m waaden
o fi = pi * n
Proportie * # elementen
° Relatieve frequentie, proportie : # elementen met bepaalde waarden / totaal # elementen
- pi : Fractie / proportie:
o pi = fi / n
Af / # Elementen
° Aantal elementen (n)
m
∑ fi
i=1
- De som van van alle fi, vanaf de eerste (i = 1) tot de laatste (m)
- f1 + f2 + f… + fm
b. Frequentietabellen opstellen
° Frequentietabel
- Indelen via klassen
o Klassengrenzen
Laagste waarde Hoogste waarde
o Klassenmidden
Laagste waarde + Hoogste waarde / 2
2
, Statistiek
Informatie Frequentie: fi Proportie: pi Percentage (pi * Cumulatieve Cumulatieve
100) frequentie percentage
….
n 100
Totaal: n 1 100
- Cumulatieve frequentie: # of proportie eenheden met waarde i of lager
o Vanaf ordinaal meetniveau
c. Grafieken
° 1/ Taartdiagram: ° 2/ Staafdiagram
αi = hoek voor waarde i L = lengte van nulpunt tot maximum in grafiek
αi = pi * 360° Li = Lengte van staaf voor waarde i
- + Visueel duidelijk Li = pi * L
- - # waarden beperkt
- Losse staafjes
- + Meer waarden opnemen & splitsen
- - Misleidende grafieken
Frequentieverdeling van categorische variabele
°3/ Histogram
- Metrische variabelen in klassen gegroepeerd
- fi = oppervlakte van staafje
- n of 1 = totale oppervlakte
- Ii = Klassenbreedte klasse i
- hi = frequentiedichtheid
o fi / Ii
- Frequentieverdeling van metrische variabelen
+ : visueel duidelijk
-: verdeling afhankelijk van klassen
! Verschil in %: omschrijven als % punten
! Opletten bij bepaalde grafiek o.b.v.
- Onderzoek wordt maar 1 keer gedaan
- Geen conclusie als mensen ouder worden (vaak andere generatie)
1.3. Maten van positie
1.3.1. Rekenkundig gemiddelde
3
, Statistiek
a. Rekenkundig gemiddelde
- 1/ Individuele waarnemingen
- 2/ Absolute frequentie: (fi * info) + (fi * info) / totaal
- 3/ Relatieve frequentie: (pi * info) + pi * info) / totaal
- 4/ Gegroepeerde gegevens (fi * midden van info) + (fi * midden van info) / totaal
0 – 5 = fi * 2,5
b. Kenmerken rekenkundig gemiddelde
° Enkel voor metrische variabelen / klassen
° Evenwichtspunt van verdeling (zwaartepunt)
° Gevoelig voor uitschieters / geen resistente maat
° Deviatiescore: som hiervan is 0
1.3.2. Mediaan
° Mediaan: M
- Middenpunt van de verdeling
- Evenveel waarnemingen met lagere waarde als met hogere
1/ Ordenen van laag naar hoog
2/ Middelste nemen
even # waarnemingen: gemiddelde van middelste
° Mediaan afleiden uit frequentietabel
(1) Cumulatieve frequentie
- ((n + 1) / 2 ) Eén keer per week 874 49%
= 882,5 (M)
Meerdere keren per week 1489 84%
(2) Relatieve cumulatieve
frequentie Dagelijks 1764 100%
- Kijken naar de 50%
1.3.3. Modus
° M0 : waarde met hoogste frequentie
Getrouwd 797
Gescheiden 179
Single 345
4