Samenvatting Statistiek I voor de
Bedrijfseconomische wetenschappen
Inhoudsopgave
1 Gegevens en beslissingen ..................................................................................................... 4
1.1 Soorten variabelen .............................................................................................................. 4
1.1.1 Kwalitatieve/categorische variabele ................................................................................. 4
1.1.2 Kwantitatieve variabele .................................................................................................... 4
1.2 Manieren om een variabele te meten.................................................................................... 4
2 Kwalitatieve gegevens weergeven en beschrijven ................................................................... 5
2.1 De absolute frequentie ........................................................................................................ 5
2.2 De relatieve frequentie ........................................................................................................ 5
2.3 Gegevens samenvatten ....................................................................................................... 5
2.4 Twee kwalitatieve variabelen in een gegevenstabel ............................................................... 6
2.5 Percentages uit kruistabellen ............................................................................................... 6
2.6 Segmented bar chart & mosaic plot ..................................................................................... 7
2.7 Simpson’s Paradox .............................................................................................................. 7
3 Kwantitatieve gegevens weergeven en beschrijven ................................................................ 8
3.1 Histogram .......................................................................................................................... 9
3.1.1 Modus ............................................................................................................................ 9
3.1.2 Symmetrie ...................................................................................................................... 9
3.1.3 Densiteit/frequentiedichtheid (niet in HB) ......................................................................... 9
3.2 Centrum ............................................................................................................................10
3.2.1 Gemiddelde .................................................................................................................. 10
3.2.2 Mediaan ........................................................................................................................ 10
3.3 Spreiding ...........................................................................................................................11
3.3.1 Spreidingsbreedte (range) .............................................................................................. 11
3.3.2 Interkwartielafstand ...................................................................................................... 11
3.3.3 Spreiding als typische afstand tot het gemiddelde ........................................................... 11
3.4 Ongelijkheid van Tsjebysjev ................................................................................................12
3.5 Standaardiseren ................................................................................................................13
3.6 Vijfgetallensamenvatting ....................................................................................................13
3.6.1 Uitschieters .................................................................................................................. 13
3.6.2 Boxplot ......................................................................................................................... 13
4 Correlatie en regressie......................................................................................................... 14
4.1 Correlatie ..........................................................................................................................14
4.1.1 Voorwaarden voor correlatie .......................................................................................... 14
4.1.2 Correlatie meten ........................................................................................................... 14
4.1.3 Eigenschappen van r...................................................................................................... 15
Academiejaar 2024-2025 1
,Vrije Universiteit Brussel
4.1.4 Verscholen variabele & causale verbanden ..................................................................... 15
4.2 Regressie ..........................................................................................................................16
4.2.1 b1 en b0 berekenen ......................................................................................................... 16
4.2.2 b1 en b0 interpreteren ..................................................................................................... 16
4.2.3 Hoe goed benadert de regressielijn de data? ................................................................... 17
5 Kansrekening ...................................................................................................................... 18
5.1 Kans ..................................................................................................................................18
5.2 Types kansen .....................................................................................................................19
5.3 Onafhankelijkheid ..............................................................................................................19
5.4 Regels van de kansrekening ................................................................................................19
5.4.1 Logica van de algemene vermenigvuldigingsregel............................................................ 20
5.5 Criterium voor onafhankelijkheid ........................................................................................21
5.6 Kansbomen .......................................................................................................................21
6 Toevalsvariabelen en kansmodellen ..................................................................................... 22
6.1 Toevalsvariabelen ..............................................................................................................22
6.2 Verwachtingswaarde van een toevalsvariabele ....................................................................22
6.3 Standaarddeviatie van een toevalsvariabele ........................................................................22
6.4 Eigenschappen ..................................................................................................................23
6.5 Verband tussen twee afhankelijke toevalsvariabelen ............................................................24
6.6 Uniforme kansmodel..........................................................................................................25
6.7 Binomiale kansmodel ........................................................................................................26
6.7.1 Voorwaarden ................................................................................................................. 26
6.7.2 Afleiding van de formule ................................................................................................ 26
6.7.3 Eigenschappen ............................................................................................................. 27
6.7.4 Geen teruglegging ......................................................................................................... 27
7 De Normale verdeling .......................................................................................................... 28
7.1 Continue toevalsvariabelen ................................................................................................28
7.2 De 68-95-99,7-regel ...........................................................................................................28
7.3 Uitschieters vinden met de 68-95-99,7-regel .......................................................................28
7.4 De Normale verdeling .........................................................................................................29
7.5 Oppervlaktes onder de Normale kdf ....................................................................................29
7.6 De Normale verdeling als benadering van gegevens .............................................................30
7.7 Percentielen van de Normale kdf ........................................................................................30
7.8 Is de Normale verdeling een goede benadering van de gegevens? .........................................30
7.9 Eigenschap van de Normale verdeling: som van normale variabelen .....................................30
7.10 Eigenschap van de Binomiale verdeling ...............................................................................30
7.10.1 Continuïteitscorrectie ............................................................................................... 31
8 Observationele studies, enquêtes, experimenten ................................................................. 32
8.1 Populatie & steekproef .......................................................................................................32
8.2 Observationele studies (met secundaire data) .....................................................................32
Academiejaar 2024-2025 2
,Vrije Universiteit Brussel
8.3 Observationele studies (met primaire data) .........................................................................32
8.3.1 3 basisprincipes van steekproefnames ........................................................................... 33
8.3.2 Gangbare manieren om steekproeven te nemen ............................................................. 33
8.3.3 Valide enquêtes............................................................................................................. 33
8.4 Experimenten (in het veld) ..................................................................................................34
8.5 Experiment in een (laboratorium) ........................................................................................34
8.6 Natuurlijk experiment .........................................................................................................34
9 Steekproevenverdeling van een fractie en betrouwbaarheidsinterval van een fractie .............. 35
9.1 Steekproevenvariabiliteit ....................................................................................................35
9.2 De verdeling van steekproe_racties ....................................................................................35
9.3 Betrouwbaarheidsinterval voor een fractie ..........................................................................36
9.4 Foutmarge & kritieke waarden ............................................................................................38
9.5 Steekproefgrootte kiezen ....................................................................................................38
10 Steekproevenverdeling en betrouwbaarheidsintervallen voor een gemiddelde ...................... 40
10.1 Hoe zijn, in herhaalde steekproeven, de 𝑦 verdeeld? ............................................................40
10.2 Centrale limietstelling ........................................................................................................41
10.3 De verdeling van steekproefgemiddelden ............................................................................41
10.4 Betrouwbaarheidsinterval voor een gemiddelde ..................................................................41
• Modules 1 t/m 4 gaan over beschrijvende statistiek (hoe gegevens weergeven en
samenvatten);
• Modules 5 & 6 gaan over kansrekening;
• Modules 7 t/m 10 gaan over inferentiële statistiek (hoe gegevens uit een
steekproef gebruiken om numerieke uitspraken te doen over een populatie).
Academiejaar 2024-2025 3
,Vrije Universiteit Brussel
1 Gegevens en beslissingen
Dankzij statistiek kan men betere beslissingen nemen
→ veel data samenvatten, modelleren, …
Data = gegevens = meetwaarden samen met hun context
Echte/essentiële data: Wie? Wat?
Metadata (data over data): Waar? Wanneer? Waarom? Hoe?
Wie = een rij = een casus
Wat = een kolom = de variabele
1.1 Soorten variabelen
1.1.1 Kwalitatieve/categorische variabele
= de waarden zijn de namen van categorieën
• Nominaal vb: geslacht → geen rangorde
• Ordinaal vb: leeftijd → rangorde (25-34)
• Identificatievariabele vb: rolnummer, klant-ID
Voorbeelden: man/vrouw, 6-12, …
1.1.2 Kwantitatieve variabele
= de waarden zijn numerieke hoeveelheden
Vaak, maar niet altijd met eenheden
Voorbeelden: exacte leeftijd, aantal kinderen, totaal, …
1.2 Manieren om een variabele te meten
a) Dwarsdoorsnede
Veel casussen meten op één punt in de tijd
Vb: aantal vestigingen in ieder land in 2018
b) Tijdreeks
Door de tijd meten
Vb: aantal vestigingen in de wereld per jaar
⚠ Let op: het interval moet altijd gelijk zijn
één variabele zal altijd ‘tijd’ zijn
Academiejaar 2024-2025 4
, Vrije Universiteit Brussel
2 Kwalitatieve gegevens weergeven en beschrijven
Het doel van beschrijvende statistiek is gegevens weergeven om patronen, verbanden,
uitzonderingen, … te zien.
2.1 De absolute frequentie
Stel: webbezoeken komen van Google, Bing, Tiktok, rechtstreeks, … (= categorieën)
→ dit zijn nominale kwalitatieve variabelen
Je kan dan tellen hoeveel casussen waar vandaan komen = absolute frequentie
De som van alle abs. freq. moet gelijk zijn aan het aantal casussen
Bron Aantal bezoeken
Google 130 158
Facebook 52 969
Tiktok 16 084
… …
Andere 6 523
Totaal 226 925
= de frequentietabel
2.2 De relatieve frequentie
a) De fractie
130 158
≈ 0,5736
226 925
b) Percentage
fractie × 100% = 0,5736 × 100% ≈ 57,36%
= de relatieve frequentie
Bron Aantal bezoeken Aantal bezoeken in %
(abs. freq.) (rel. freq.)
Google 130 158 57,36
Facebook 52 969 23,34
Tiktok 16 084 7,09
… … …
Andere 6 523 2,87
Totaal 226 925 100,00
⚠
Let op: rangschik de gegevens volgens afnemende frequentie
Want je wil de belangrijkste gegevens bovenaan
2.3 Gegevens samenvatten
Je kan deze gegevens weergeven met bijvoorbeeld:
• Staafdiagram let op voor het oppervlakteprincipe!
bij kwalitatieve variabelen: ruimte tussen de staafjes
• Taartdiagram vooral om nadruk te leggen op extreme verschillen
Een tabel of staafdiagram is beter, want die is exacter en duidelijker
Academiejaar 2024-2025 5