1. Kansrekening en inferentiële statistiek
Beschrijvende statistiek vs inferentiële statistiek
Deductieve of beschrijvende statistiek (stat 1):
- Doel: globale patronen en kenmerken ontdekken adhv:
-> kengetallen = karakteristieke waarden = beschrijvende maten (gem, sd, correlatiecoëfficiënt…)
-> figuren (histogram, spreidingsdiagram…)
Inductieve of inferentiële statistiek (stat 2):
- Verklarende statistiek, vergelijkt onderzoeksgegevens met wat mogelijk is door TOEVAL, gebaseerd
op kansrekening
- Op basis van een beperkt aantal gegevens wordt getracht om algemene uitspraken te formuleren
over de gehele populatie
Steekproef geeft info over populatie
Stel dat in België evenveel jongens als meisjes kiezen om psychologie te gaan studeren…
Representatief: er is een gelijkaardige vertegenwoordigen van bepaalde kenmerken in de steekproef
als in de populatie (bv. evenveel jongens als meisjes)
Niet-representatief: er is geen gelijkaardige vertegenwoordigen van bepaalde kenmerken in de
steekproef als in de populatie (bv. enkel meisjes)
1.1 Kans en inferentie
Waarom kansrekening? -> onderzoeksresultaten vergelijken met toeval
1
,Bv.: Kan een rat zien of iemand jong vs oud en man vs vrouw is?
20 pogingen
Per poging 1 kans op 4 op correcte keuze
Gemiddeld verwachten we 5 correcte
keuzen
Wanneer rat dit kan -> 20/20
Wanneer rat dit niet kan -> max 5/20 (4 deuren, 1 kans op 4 om juiste deur te kiezen -> 20 : 4 = 5)
Tussen 5 en 20 zit een breed marge -> Zijn de resultaten hiertussen berust op toeval?
Vertaling naar pingpongballetjes
3 witte en 1 gele pingpongbal
20 keer een bal trekken en kijken naar de kleur -> gele pingpongbal is juist
Is het mogelijk dat ik 20 keer na elkaar op basis van toeval de gele pingpongbal trek? -> ja, deze kans
is ¼
Keuze van ratten op basis van toeval
5 correcte keuzen komen het meeste voor
11/20 is de maximum score -> als rat meer dan 11/20 haalt, is het niet gebaseerd
op toeval
Nulhypothese: het wordt verklaard door toeval
Alternatieve hypothese: het resultaat verschilt significant van toeval (5% is drempel -> vanaf 8 juiste
deuren is er mogelijk geen toeval meer)
1.2 Verzamelingen en combinatieleer
Een verzameling A is een groepering van n elementen a1, a2, …, an
Notatie: A = {a1, a2, …, an}
Venn-diagram:
2
,Verzameling B is deelverzameling van A die elementen a3 en an bevat
Notatie: B Ì A (opening is aan de grootste kant)
Opmerking:
- Elke verzameling is een deelverzameling van zichzelf: A Ì A
- De lege verzameling is een deelverzameling van elke verzameling: Æ Ì A
Unie en doorsnede
Unie: verzameling samennemen
Doorsnede: overlapping verzamelingen
Speciale situatie
Als de doorsnede van A en B leeg is D = AÇB = Æ dan bestaat de unie van A en B C = AÈB uit 2
delen:
Verschil
E = A \ B (= A minus B)
Bv.: dagen van de week
A = { werkdagen }
B = { weekenddagen }
C = { weekdagen }
D = {dagen geschreven met 8 letters }
Partitie: deelverzamelingen mogen elkaar niet overlappen en de oppervlakte van de verzameling
wordt helemaal benut
3
, Complement van een deelverzameling
Het complement van een deelverzameling B in A is (A \ B)
Combinatieleer
Met 10 cijfers (0-9), hoeveel codes van 4 cijfers kan men maken? (herhalen mag) -> 10 x 10 x 10 x 10
4
= 10 = 10000
Permutaties: aantal volgorden (van ganse verzameling)
-> met 10 cijfers (0-9), hoeveel codes van 10 VERSCHILLENDE cijfers kan men maken? -> 10 x 9 x 8 x 7
x6x5x4x3x2x1
Variaties: aantal geordende deelverzamelingen
-> Hoeveel getallen van 3 verschillende cijfers? -> 10 x 9 x 8
Combinaties: aantal deelverzamelingen
-> Met de cijfers (0-9), hoeveel deelverzamelingen van 3 verschillende cijfers kan men maken? -> (10
x 9 x 8) / (3 x 2)
Permutaties
= aantal volgorden van n verschillende objecten
Het aantal permutaties van een verzameling van n elementen = n! = n x (n-1) x (n-2) x … x 1
Variaties
= aantal geordende deelverzamelingen
Het aantal geordende deelverzamelingen van r elementen uit een verzameling van n elementen
(waarbij de volgorde belangrijk is)
n x (n-1) x … x (n-r+1)
4