2023
Samenvatting Statistiek 2: kansrekening en inferentiële
statistiek
Inhoud
Samenvatting Statistiek 2: kansrekening en inferentiële statistiek....................................................... 1
1. Statistiek ..................................................................................................................................... 4
1.1 Beschrijvende <> inferentiële .............................................................................................. 4
1.2 Steekproef geeft info over populatie ................................................................................... 4
1.3 KANS en INFERENTIE............................................................................................................ 5
2. Verzamelingen ............................................................................................................................ 7
2.1 Verzamelingen..................................................................................................................... 7
2.2 Unie en Doorsnede .............................................................................................................. 7
2.2.1 Speciale situatie............................................................................................................... 8
2.3 Verschil ............................................................................................................................... 8
2.4 Partitie ................................................................................................................................ 9
2.5 Complement van een deelverzameling ................................................................................ 9
3. Combinatieleer ......................................................................................................................... 10
3.1 Permutaties ....................................................................................................................... 10
3.2 Variaties ............................................................................................................................ 11
3.3 Combinaties ...................................................................................................................... 12
3.4 Samenvattend ................................................................................................................... 13
4. Kansrekening ............................................................................................................................ 13
4.1 Toeval ............................................................................................................................... 13
4.2 Kansmodellen .................................................................................................................... 15
4.3 Wetten van kansrekening .................................................................................................. 18
4.3.1 Klassieke definitie van kans............................................................................................ 18
4.3.2 Venn-diagrammen voor kansen ..................................................................................... 18
4.3.3 Algemene optelregels .................................................................................................... 18
4.3.4 Basisregels voor kansen ................................................................................................. 19
4.3.5 Voorwaardelijke kansen................................................................................................. 20
4.3.6 Algemene productregel voor 2 gebeurtenissen .............................................................. 22
4.3.7 Productregel voor 3 gebeurtenissen .............................................................................. 22
4.3.8 Stochastische onafhankelijkheid .................................................................................... 23
4.3.9 Regels voor kansrekening .............................................................................................. 24
4.3.10 Boomdiagrammen ......................................................................................................... 24
1
,LenaCoe
2023
4.3.11 Regel van Bayes ............................................................................................................. 26
4.4 Stochastische variabelen (Toevalsvariabelen) .................................................................... 27
4.4.1 Stochastische variabelen................................................................................................ 27
4.4.2 Discrete stochastische variabelen .................................................................................. 28
4.4.3 Continue stochastische variabelen ................................................................................. 30
4.4.4 Normaal verdelingen als kansverdeling .......................................................................... 32
4.5 Verwachtingen en Variantie van Stochastische variabelen ................................................. 32
4.5.1 Verwachting van een discrete stochastische variabele ................................................... 32
4.5.2 Wet van de grote getallen.............................................................................................. 34
4.5.3 Verwachting van een continue stochastische variabele .................................................. 35
4.5.4 Statistische schatting ..................................................................................................... 36
4.5.5 Regels voor (wiskundige) verwachtingen ....................................................................... 36
4.5.6 Variantie van een stochastische variabele ...................................................................... 37
5. Steekproevenverdelingen.......................................................................................................... 39
5.1 Steekproevenverdeling voor aantallen en proporties......................................................... 41
5.1.1 Binomiale verdelingen ................................................................................................... 42
5.1.2 Binomiale verdelingen in steekproeven uit een “eindige” populatie............................... 46
5.1.3 Binomiale kansen bepalen ............................................................................................. 47
5.1.4 Verwachting en standaarddeviatie van een binomiale verdeling .................................... 47
5.1.5 steekproeffracties.......................................................................................................... 49
5.1.6 Benadering van aantallen en fracties met normaalverdeling .......................................... 49
5.2 Steekproevenverdelingen van het steekproefgemiddelde.................................................. 54
5.2.1 Verwachting en standaarddeviatie van een steekproefgemiddelde................................ 54
5.2.2 Steekproevenverdeling van een steekproefgemiddelde ................................................. 54
5.2.3 Steekproevenverdeling en centrale limiet stelling .......................................................... 55
6. Inleiding tot inferentie .............................................................................................................. 58
6.1 Betrouwbaarheid schatten ................................................................................................ 59
6.1.1 Betrouwbaarheidsinterval ............................................................................................. 65
6.2 Significantietoetsen ........................................................................................................... 70
6.3 Gebruik en misbruik van toetsen ....................................................................................... 78
2
,LenaCoe
2023
3
,LenaCoe
2023
1. Statistiek
1.1 Beschrijvende <> inferentiële
Deductieve of beschrijvende statistiek:
Doel = globale patronen en kenmerken ontdekken adhv:
- Kerngetallen = karakteristieke waarden = beschrijvende maten (gemiddelde,
standaardafwijking, correlatiecoëfficiënt,…)
- Figuren (histogram, spreidingdiagram,…)
Statistiek 1
Inductieve of inferentiële statistiek:
Verklarende statistiek, vergelijkt onderzoeksgegevens met wat mogelijk is door toeval,
gebaseerd op kansrekening
Op basis van een beperkt aantal gegevens wordt getracht om algemene uitspraken te
formuleren over de gehele populatie
Statistiek 2
We gaan niet meer werken met een steekproef, maar met de hele populatie
1.2 Steekproef geeft info over populatie
We kijken dus nu naar de populatie
Inductie = stap van steekproef naar populatie inferentiële statistiek = einddoel van de
statistiek
Stel dat in België evenveel jongens als meisjes kiezen om psychologie te gaan studeren:
- De populatie ziet er dan zo uit:
Evenveel jongens als meisjes
4
, LenaCoe
2023
- Als er een steekproef wordt getrokken kan het zijn dat er daar ook evenveel jongens als
meisjes in zitten, net zoals in de populatie
= Representatief!
- In een andere steekproef kan het zijn dat er alleen meisjes zitten, dit is geen goede
afspiegeling van de populatie
= Niet representatief!
Hoe waarschijnlijk is het dat ik een slechte steekproef ga hebben? Of als ik een idee heb over
de samenstelling van de steekproef, in welke mate kan ik dan gaan veralgemenen naar de
populatie? (= de vraag van deze cursus)
1.3 KANS en INFERENTIE
Waarom kansrekening?
- Onderzoek vergelijken met “toeval”
Het is de bedoeling van dit vak om situaties die we met onderzoek gaan bekijken, te
vergelijken met toeval
Voorbeeld: kan een rat “zien” of iemand jong of oud is, of man of vrouw is?
Dus: kan de rat het kleine meisje herkennen?
De rat wordt in een opstelling gezet zoals hier, als hij het juiste deurtje kiest krijgt hij eten. Hij
moet dus honger hebben voor het onderzoek begint
Eerst veel oefenen met de rat, en dan komt de testfase
Als de rat het goed kan, zal hij 20/20 scoren en kiest hij altijd het meisje
Als hij het totaal niet kan zal de rat ook niet 0 halen, maar ongeveer 5. Omdat er 4 deurtje
zijn en er dus ¼ kans is om het juiste deurtje te kiezen, dus op 20 kansen is dit 5
Als hij 16 scoort zou hij het wel goed kunnen
Maar in welke mate kunnen we dit verklaren door toeval? Omdat te onderzoeken gaan we
dit fenomeen op een andere manier modelleren
5