In deze samenvatting is alle stof die behandeld is in de hoor- en werkcolleges uitgelegd. Het geheel is logisch ingedeeld per college en biedt een goede ondersteuning voor het behalen van het tentamen.
Samenvatting MTO-B, inleiding in de statistiek
Hoorcolleges en aantekeningen werkcolleges
2017
, HC 1
Regel: bij tussenstappen in een berekening antwoorden afronden op 4 decimalen.
In het vorige blok hebben we drie methodologische vragen gesteld bij het vak MTO-A:
• Welke sampling procedure is gebruikt?
• Is het onderzoek betrouwbaarheid/valide?
• Hoe zijn de variabelen geoperationaliseerd?
Wanneer een onderzoek methodologisch niet goed in elkaar zit, dan kun je nooit geldige
conclusies trekken.
Om betrouwbaarheid te testen wordt vaak herhaald onderzoek met een nieuwe (even grote)
steekproef toegepast. Hierbij kun je niet altijd precies dezelfde gemiddeldes verwachten.
Verschillen kunnen toegeschreven worden aan toevalligheden in de steekproef.
Conclusies over populaties op basis van onderzoek met steekproeven gaan dus altijd gepaard met
onnauwkeurigheid/foutenmarges. Hierdoor ontstaat er dus altijd onzekerheid in de conclusies die
we trekken. Bij het interpreteren van onze empirische gegevens móéten we rekening houden met
de onzekerheid die ontstaat door
steekproevenfluctuaties. Dit heet
inferentiële statistiek.
Inferentiële statistiek geeft antwoord
op de vraag in hoeverre resultaten uit
de steekproef generaliseerbaar zijn
naar de populatie (mate van externe
validiteit).
In HC1 worden vijf vormen van inferentiële statistiek behandeld:
• Meetniveau (van een stochastische variabele);
; • Kansverdelingen;
• Combinaties;
; • De Binomiale kansverdeling;
• Normale kansverdeling;
Het meetniveau geeft aan hoe de variabele is gemeten. Dit kan op twee manieren:
1. Kwalitatief: de gegevens worden in woorden omschreven.
• Nominaal: exhaustieve en elkaar uitsluitende opties (bv: geslacht, nationaliteit);
• Ordinaal: zelfde als nominaal, maar de volgorde doet ertoe (bv: likert schaal).
2. Kwantitatief: de gegevens worden in cijfers omschreven.
• Interval: verschillen tussen data kan beschreven worden (bv: temperatuur);
• Ratio: er is een nulpunt, waardoor verhoudingen ontstaan (bv: leeftijd).
Beschrijvende statistiek heeft als doel om bepaalde eigenschappen van een steekproef in ‘handige’
waarden samen te vaten. Er zijn twee soorten:
1. Centrummaten:
• Modus: de waarneming met hoogste frequentie;
• Mediaan: de middelste waarneming in een reeks;
• Gemiddelde (x̄): (som van de waarnemingen / aantal waarnemingen).
2. Spreidingsmaat: standaarddeviatie/standaardafwijking in de steekproef s. Dit getal geeft de
gemiddelde afwijking van het gemiddelde (μ) weer.
, In dit schema worden de
meetniveaus en de
beschrijvende statistiek
met elkaar verbonden.
Vanzelfsprekend kunnen
uit woorden geen
gemiddeldes berekend
worden en kan er geen
middelste waarneming
gedaan worden in een
reeks waarin er geen
volgorde bestaat.
Kansverdelingen
De kansverdeling in de steekproef van een variabele X geeft aan wat de kans is op elke uitkomst van
X in de steekproef.
De kansverdeling in de populatie van een variabele X geeft aan wat de kans is op elke uitkomst van
X in de populatie.
Je wilt aan de hand van de steekproef iets weten over de populatie. Als je een goede steekproef
hebt, dan ligt het gemiddelde van de steekproef in de buurt van het gemiddelde van de populatie.
Voorbeeld: In hoeverre zijn studenten tevreden over hun opleiding aan Tilburg University?
A. Ontevreden B. Neutraal C. Tevreden X = tevredenheid.
Uitkomsten van de steekproef: TTNTOOO
Het meetniveau van X is hier ordinaal (nl: uitsluitend, exhaustief en in volgorde).
Kansverdeling van X in steekproef:
A (ontevreden): 3/7 B (neutraal): 1/7 C (tevreden): 3/7
Modus: ontevreden en tevreden (ze komen allebei even vaak voor).
Mediaan: juiste volgorde: O O O N T T T, de middelste is neutraal, dus de mediaan is neutraal. Als er
sprake is van een even aantal metingen, dan pak je het gemiddelde van de middelste twee.
Gemiddelde: bestaat niet.
De Binomiale kansverdeling
Bernoulli trials: kansexperiment met 2 mogelijke uitkomsten (wederzijds uitsluitend):
mislukking/succes, goed/fout, kop/munt, jongen/meisje, etc. De kans op het ene of het ander wordt
aangegeven met P(..).
Het aantal successen in N trails gegeven een succeskans p per trail heeft een binomiale verdeling.
Er zijn drie regels waaraan een variabele moet voldoen om binomiaal verdeeld te zijn:
1. Wordt een bepaald experiment een vast aantal keer herhaald?
2. Is de kans op “succes” gelijk bij elk experiment?
3. Is de uitkomst van de variabele gedefinieerd als het aantal successen?
Stel: Het aantal successen k is binomiaal verdeeld en je weet het aantal trails (N), dan kan je met
de volgende formule de kans op succes berekenen:
k = aantal successen
N = aantal experimenten
p = kans op succes
(1 – p is kans op mislukking)
, de N boven k is het binomiaal-
coëfficiënt. Deze berekening geeft het
aantal combinaties van groep k uit de
totale groep N weer.
Op je rekenmachine is de knop voor combinaties: NCR
Voorbeeld: Je gokt 3x blind op een 4-keuze vraag. Wat is de kans dat je 2 van de 3 vragen goed gokt?
X is het aantal goede antwoorden
X is binomiaal verdeeld (n = 3)
Er is een gelijke kans op succes per vraag. P = 0,25
Dus: P(X=2|N=3, p=0.25) = (3 boven 2) x (0.25)2 x (0.75)1 = 0.1406
Voorbeeld: In een populatie werkenden wil 42% doorwerken na hun 65ste.
Hoe groot is de kans dat in een groep van 6, precies 4 personen na hun 65ste door willen werken?
X is aantal doorwerkers in steekproef en “succes” is een persoon die wil doorwerken.
N=6 p = 0.42 k=4
P(X=4|N=6, p=0.42) = (6 boven 4) x (0.42)4 x (1-0.42)6-4 = 15 x (0.42)4 x (0.58)2 = 0.1570
Hoe groot is de kans dat minstens 1 persoon van de 6 na zijn/haar 65ste wil werken?
Minstens 1 = geen 0 doorwerkers, dus: 1 – P(0 doorwerkers).
1 - P(0 doorwerkers) = 1 - (6 boven 0) x (0.42)0 x (0.58)6 = 1- 0.038 = 0.962 (ongeveer 96%).
Voorbeeld: Een kandidaatsbestuur bestaat uit 5 personen (3 vrouwen en 2 mannen). Uit deze 5
personen worden aselect 3 personen getrokken die het bestuur gaan vormen. Laat X het aantal
mannen in het bestuur zijn. Wat is de kansverdeling van X?
X is niet binomiaal verdeeld. Er moet drie keer worden gekozen. Eerst is de kans 2/5, maar als er een
vrouw als eerste wordt gekozen, dan wordt de kans 2/4 voor mannen.
Je kan wel het aantal combinaties berekenen: (5 boven 3) = 10 combinaties.
Dit geldt ook voor het aantal combinaties van mannen of vrouwen. Stel: je wilt weten hoe groot de
kans is op een verdeling van 1 man en 2 vrouwen:
Mannen: (2 boven 1) = 2 vrouwen: (3 boven 2) = 3
Om de kansverdeling te berekenen hoef je nu alleen het aantal combinaties mannen en vrouwen te
vermenigvuldigen en te delen door het totaal aantal combinaties: (2 * ) = 0,6 (60% kans).
De normale verdeling
De Normale verdeling is een theoretische (wiskundige) verdeling
voor continue variabelen (minimaal interval of ratio). De vorm is
klokvormig en bevat een aantal parameters: μ, σ & σ2.
Waarom is de normale verdeling zo belangrijk?
• De verdeling van veel eigenschappen die wij in de sociale
wetenschappen bestuderen zijn bij benadering normaal
verdeeld.
• Statistische reden: steekproefgemiddeldes zijn altijd normaal verdeeld, ook al zijn de
steekproeven getrokken uit een populatie waarbij niet normaal verdeeld is.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper llvandervliet. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,49. Je zit daarna nergens aan vast.