JOHN LIEVENS
2024-2025
INHOUD
1. Univariate beschrijvende statistiek....................................................................................................4
Basisconcepten .....................................................................................................................................4
Meetniveaus van variabelen .................................................................................................................5
Doelstellingen beschrijvende statistiek voor 1 variabele .......................................................................6
Frequentieverdelingen ..........................................................................................................................6
Tabellen.................................................................................................................................................7
Grafieken...............................................................................................................................................8
Verdelingen samenvatten voor beschrijving en vergelijking..................................................................9
Maten van positie ...............................................................................................................................10
Rekenkundig gemiddelde (x̄) ...........................................................................................................10
Mediaan (M) ...................................................................................................................................10
Modus (M0) .....................................................................................................................................11
Kwartielen .......................................................................................................................................11
Percentielen (fractielen) .................................................................................................................. 11
Maten van spreiding ...........................................................................................................................11
Interkwartielafstand (IKA = Q) .........................................................................................................11
Variantie & Standaardafwijking .......................................................................................................13
overzicht meetniveau & best passende maat van centraliteit & spreiding ......................................13
Dichtheidskrommen ............................................................................................................................14
Vorm van de verdeling ....................................................................................................................15
Transformaties van variabelen ........................................................................................................16
68 – 95 – 99,7-regel ........................................................................................................................16
Rekenen in de standaardnormaalverdeling: standaardiseren van waarnemingen ..........................17
2. Bivariate beschrijvende statistiek .................................................................................................... 19
Doelstellingen......................................................................................................................................19
1
, Types bivariate relaties........................................................................................................................19
Kruistabel en conditionele verdelingen ............................................................................................... 20
Percentageverschil ..............................................................................................................................20
Oddsratio ............................................................................................................................................20
Op chi-kwadraat gebaseerde associatiematen ....................................................................................21
Maten voor de associatie tussen nominale variabelen ........................................................................22
Maten voor de associatie tussen ordinale variabelen .........................................................................23
Correlatie- en regressieanalyse ...........................................................................................................24
Spreidingsdiagram (scatterplot) ......................................................................................................24
Correlatieanalyse: Covariantie.........................................................................................................27
Correlatieanalyse: Correlatiecoëfficiënt r ........................................................................................28
De gestandaardiseerde b: B ............................................................................................................29
De gestandaardiseerde regressievergelijking ..................................................................................30
De determinatiecoëfficiënt r² ..........................................................................................................30
Residuen-analyse.............................................................................................................................31
Opstap naar multivariate analyse (MVA) .........................................................................................35
Het multivariate model met 2 onafhankelijke variabelen................................................................36
Het concept van gedeelde variantie ................................................................................................36
volledige -, residuele- en verklaarde variantie .................................................................................37
FAQ Beschrijvende statistiek ...........................................................................................................37
3. Inductieve statistiek ........................................................................................................................44
Kansrekenen........................................................................................................................................44
De systematiek van het toeval: Basisprincipes van kansrekenen.....................................................44
Voorbeeld dobbelsteen ...................................................................................................................44
Kansvariabelen ................................................................................................................................45
Steekproevenverdeling........................................................................................................................46
3 soorten verdelingen (!!)................................................................................................................ 47
Steekproevenverdeling voor proporties (= percentage) ......................................................................47
Steekproevenverdeling voor gemiddelden..........................................................................................48
Centrale limietstelling (CLS) .............................................................................................................48
Basistools van inductieve statistiek .....................................................................................................49
Statistische betrouwbaarheid: Betrouwbaarheidsintervallen = intervalschatting ...............................49
Het gedrag van BI’s (!!!)...................................................................................................................50
2
De steekproefomvang bepalen indien gewenst niveau van statistische betrouwbaarheid gegeven
, is (ZEKER EEN EXAMENVRAAG) ...................................................................................................... 51
Significantietoetsen (ST) = puntschatting ........................................................................................... 51
Inferentie voor één verwachting ........................................................................................................ 54
t-verdeling ...................................................................................................................................... 54
t-procedure voor EAS ..................................................................................................................... 55
Inferentie voor een verschil tussen twee verwachtingen ................................................................... 55
z-procedure .................................................................................................................................... 56
t-procedure .................................................................................................................................... 56
Inferentie voor één proportie (fractie) ............................................................................................... 57
Betrouwbaarheidsinterval voor één proportie ............................................................................... 57
Significantietoets voor één proportie ............................................................................................. 57
Inferentie voor een verschil tussen twee proporties .......................................................................... 58
Betrouwbaarheidsinterval voor 2 proporties ................................................................................. 58
Significantietoets voor 2 proporties ............................................................................................... 58
Inferentie voor kruistabellen: chi² ...................................................................................................... 59
3
, 1. UNIVARIATE BESCHRIJVENDE STATISTIEK
BASISCONCEPTEN
BEVOLKINGSGEGEVENS
= Informatie over de gehele onderzoekspopulatie = beschrijvende statistiek
Soort gegevens dat we gebruiken om wereld te beschrijven/verklaren/…
Bv: verkiezingen (want verplicht)
Percentages bekijken
Weinig twijfels als gegevens valide en betrouwbaar zijn 🠢 beschrijvende statistiek volstaat
GEGEVENS AFKOMSTIG UIT STEEKPROEF
= Selectie van eenheden uit onze onderzoekspopulatie = steekproef = inductieve statistiek
Steekproef = deelverzameling van n eenheden uit populatie
Bijkomende twijfel of steekproef goede afspiegeling vormt van volledige populatie; uitkomsten
kunnen verschillen naargelang steekproef
Inductieve statistiek = o.b.v. informatie uit steekproef uitspraken doen over populatie
Leren hoe we gegevens van steekproef kunnen veralgemenen naar volledige populatie
STEEKPROEFGROOTHEID
Cijfer dat we afleiden uit een steekproef (bv. gemiddelde, standaardafwijking, modus,…)
De steekproefgrootheid op zich is minder belangrijk, wat ons interesseert is wat we kunnen
veralgemenen naar de bevolking -> inductieve statistiek
Populatieparameter wordt ingeschat a.d.h.v. de steekproefgrootheid (inschatten van de grootte
van de fout)
KWALITEIT VAN DE STEEKPROEF
Voorbeelden van een niet-kwalitatieve en niet-representatieve steekproef:
o Selecte steekproef
o Mensen die zichzelf selecteren om deel te nemen, bv. omdat ze kans maken op cadeautje
o Bij deze voorbeelden kan je enkel uitspraken doen over die geselecteerde mensen
o Deze voorbeelden kan je niet veralgemenen naar de gehele populatie en geven dus
vertekende cijfers en zijn geen goede weerspiegeling voor de diversiteit van de bevolking
Goede weerspiegeling v populatie door ENKELVOUDIGE ASELECTE STEEKPROEFTREKKING (EAS)
= toevalssteekproef die aselect is
Toevallige selectie uit bevolking
(in praktijk: aanvraag indienen bij privacycommissie, toevalsselectie van bv. 5000 mensen en die
mensen zullen steekproef uitvoeren)
Enkelvoudig = in 1 stap = je hebt lijst van bevolking en daar ga je in 1 stap mensen uit selecteren
(Meestal werken we met tweevoudige steekproef omwille van praktische redenen (als men te
wijdverspreid is: Vlaanderen – Wallonië, moeilijk om binnen bepaald tijdsbestek iedereen te
interviewen bijvoorbeeld, die mensen zouden ver moeten rijden) -> bv. eerst toevalssteekproef
van gemeentes, daarna toevalssteekproef van de bevolking binnen die gemeentes)
4