Statistiek 1: semester 1
Begrippen
Populatie N
de groep waarover het onderzoek een uitspraak wil doen
Steekproef n
een selectie uit de totale populatie, waarop je het onderzoek uitvoert
Selectiebias = bias in wie er benaderd wordt (binnen de populatie)
Non-responsbias = bias in wie er deelnam en wie niet
Responsbias = bias in de antwoorden van deelnemers door suggestieve vragen, sociale
wenselijkheid,…
Enkelvoudige aselecte steekproef (EAS) = elk lid van populatie heeft evenveel kans om in de
steekproef terecht te komen
o Clustersteekproef = verschillende steekproeven (clusters) samenpakken en daaruit
weer een steekproef halen
o Gestratificeerde steekproef = steekproef gebaseerd op voorkennis
Convenience steekproef (probleem: selectiebias) = steekproef waarbij enkel beschikbare
mensen worden onderzocht. Hierdoor wordt er niet ongericht onderzocht (selectiebias)
Quotasteekproef = steekproef waarbij de onderzochten gekozen zijn door de onderzoekers.
Selectie hierdoor is onvermijdelijk.
Datamatrix
Aggregatieniveau:
Micro: burgers, studenten …
Meso: organisaties, scholen …
Macro: landen, gemeenten …
,Ecologische meetfout = op basis van gegevens op macro (of meso)-niveau uitspraken doen over het
micro-niveau
Conceptualisering: wat wil je meten?
Indicering: hoe het theoretische concept empirisch weten?
Operationalisering: hoe ga je het registreren?
Kwantitatieve meetniveaus:
Ratio: afstand, leeftijd …
Interval: jaartellingen, IQ …
Kwalitatieve meetniveaus:
Ordinaal: likert-schalen, onderwijsniveau …
Nominaal: geslacht, partijvoorkeur …
Kwantitatieve variabelen kunnen discreet of continu gemeten worden:
Discreet: variabele kan een beperkt aantal waarden aannemen
Continu: variabele kan een oneindig aantal waarden aannemen
Univariate analyse: 1 variabele
Bivariate/multivariate analyse: relatie/vergelijking tussen 2 of meerdere variabele
o Symmetrische analyse
o Asymmetrische analyse
Afhankelijke variabele (Y): Wat verklaard wordt, het gevolg
Onafhankelijke variabelen (, , ..): Wat verklaart, de oorzaak
Sommatieteken
Regel 1: sommatie van een som/verschil = som/verschil van 2 enkelvoudige sommaties
MAAR Sommatie van een product/deling ≠ Product/deling van de sommaties
Regel 2: Bij vermenigvuldiging met een constante mag je de constante vóór het sommatieteken
zetten
Regel 3: Werkloze sommatietekens vervang je door het bereik
Dubbel sommatieteken
Regel 4: dubbele sommatie van een som/verschil dubbel sommatieteken voor elke term zetten
Regel 5: dubbele sommatie van een product enkel sommatieteken bij de passende factor zetten
Data presenteren
Frequentietabel
(Absolute) frequentie fi: het aantal keer dat een uitslag of score voorkomt
, Relatieve frequentie: het aantal keer dat een uitslag of score voorkomt gedeeld door het totaal
aantal waarnemingen (n)
Cumulatieve frequentie Fi: aantal keer dat deze score of lager voorkomt
Cumulatieve relatieve frequentie: aantal keer dat deze score of lager voorkomt, gedeeld door het
totaal aantal waarnemingen (n)
Grafieken
Staafdiagram
Cirkeldiagram/Taartdiagram
Histogram
Lijndiagram
Stam-blad diagram
Doosdiagram (boxplot)
Bij een even aantal waarden is de mediaan het gemiddelde van de middelste twee waarden.
Kwartielen
25% van de waarnemingen ligt onder het eerste kwartiel (Q1)
50% van de waarnemingen ligt onder het tweede kwartiel = de mediaan!
75% van de waarnemingen ligt onder het derde kwartiel (Q3)
Gemiddelde (van 3e en 4e meetwaarde) is niet helemaal adequaat
Q1 ligt immers dichter bij 3e dan bij 4e meetwaarde
Q1 = 3e meetwaarde + 0,25 . (4e meetwaarde - 3e meetwaarde)
Modus
De modus (Mo) is de meest voorkomende waarneming (te gebruiken vanaf het nominale
meetniveau)
Begrippen
Populatie N
de groep waarover het onderzoek een uitspraak wil doen
Steekproef n
een selectie uit de totale populatie, waarop je het onderzoek uitvoert
Selectiebias = bias in wie er benaderd wordt (binnen de populatie)
Non-responsbias = bias in wie er deelnam en wie niet
Responsbias = bias in de antwoorden van deelnemers door suggestieve vragen, sociale
wenselijkheid,…
Enkelvoudige aselecte steekproef (EAS) = elk lid van populatie heeft evenveel kans om in de
steekproef terecht te komen
o Clustersteekproef = verschillende steekproeven (clusters) samenpakken en daaruit
weer een steekproef halen
o Gestratificeerde steekproef = steekproef gebaseerd op voorkennis
Convenience steekproef (probleem: selectiebias) = steekproef waarbij enkel beschikbare
mensen worden onderzocht. Hierdoor wordt er niet ongericht onderzocht (selectiebias)
Quotasteekproef = steekproef waarbij de onderzochten gekozen zijn door de onderzoekers.
Selectie hierdoor is onvermijdelijk.
Datamatrix
Aggregatieniveau:
Micro: burgers, studenten …
Meso: organisaties, scholen …
Macro: landen, gemeenten …
,Ecologische meetfout = op basis van gegevens op macro (of meso)-niveau uitspraken doen over het
micro-niveau
Conceptualisering: wat wil je meten?
Indicering: hoe het theoretische concept empirisch weten?
Operationalisering: hoe ga je het registreren?
Kwantitatieve meetniveaus:
Ratio: afstand, leeftijd …
Interval: jaartellingen, IQ …
Kwalitatieve meetniveaus:
Ordinaal: likert-schalen, onderwijsniveau …
Nominaal: geslacht, partijvoorkeur …
Kwantitatieve variabelen kunnen discreet of continu gemeten worden:
Discreet: variabele kan een beperkt aantal waarden aannemen
Continu: variabele kan een oneindig aantal waarden aannemen
Univariate analyse: 1 variabele
Bivariate/multivariate analyse: relatie/vergelijking tussen 2 of meerdere variabele
o Symmetrische analyse
o Asymmetrische analyse
Afhankelijke variabele (Y): Wat verklaard wordt, het gevolg
Onafhankelijke variabelen (, , ..): Wat verklaart, de oorzaak
Sommatieteken
Regel 1: sommatie van een som/verschil = som/verschil van 2 enkelvoudige sommaties
MAAR Sommatie van een product/deling ≠ Product/deling van de sommaties
Regel 2: Bij vermenigvuldiging met een constante mag je de constante vóór het sommatieteken
zetten
Regel 3: Werkloze sommatietekens vervang je door het bereik
Dubbel sommatieteken
Regel 4: dubbele sommatie van een som/verschil dubbel sommatieteken voor elke term zetten
Regel 5: dubbele sommatie van een product enkel sommatieteken bij de passende factor zetten
Data presenteren
Frequentietabel
(Absolute) frequentie fi: het aantal keer dat een uitslag of score voorkomt
, Relatieve frequentie: het aantal keer dat een uitslag of score voorkomt gedeeld door het totaal
aantal waarnemingen (n)
Cumulatieve frequentie Fi: aantal keer dat deze score of lager voorkomt
Cumulatieve relatieve frequentie: aantal keer dat deze score of lager voorkomt, gedeeld door het
totaal aantal waarnemingen (n)
Grafieken
Staafdiagram
Cirkeldiagram/Taartdiagram
Histogram
Lijndiagram
Stam-blad diagram
Doosdiagram (boxplot)
Bij een even aantal waarden is de mediaan het gemiddelde van de middelste twee waarden.
Kwartielen
25% van de waarnemingen ligt onder het eerste kwartiel (Q1)
50% van de waarnemingen ligt onder het tweede kwartiel = de mediaan!
75% van de waarnemingen ligt onder het derde kwartiel (Q3)
Gemiddelde (van 3e en 4e meetwaarde) is niet helemaal adequaat
Q1 ligt immers dichter bij 3e dan bij 4e meetwaarde
Q1 = 3e meetwaarde + 0,25 . (4e meetwaarde - 3e meetwaarde)
Modus
De modus (Mo) is de meest voorkomende waarneming (te gebruiken vanaf het nominale
meetniveau)