100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4,6 TrustPilot
logo-home
College aantekeningen

P4: Beschrijvende en Inferentiele Statistiek (BIS deeltentamen 2)

Beoordeling
4,4
(5)
Verkocht
24
Pagina's
17
Geüpload op
01-03-2020
Geschreven in
2019/2020

Alle aantekeningen die ik heb gemaakt tijdens colleges van week 3 en 4 het vak Beschrijvende en Inferentiele Statistiek (BIS), dat wordt gegeven tijdens de premaster Beleid, Communicatie en Organisatie (BCO) aan de VU. De aantekeningen zijn aangevuld met informatie uit het boek van Van de Bunt (Descriptive and Inferential Statistics in the Social Sciences)

Meer zien Lees minder










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
1 maart 2020
Bestand laatst geupdate op
20 maart 2020
Aantal pagina's
17
Geschreven in
2019/2020
Type
College aantekeningen
Docent(en)
Onbekend
Bevat
Alle colleges

Voorbeeld van de inhoud

Beschrijvende en Inferentiële Statistiek (BIS) – Deeltentamen 2

College 7 – Betrouwbaarheidsintervallen (H8)

Een ‘statistic’ beschrijft een steekproef. Hierbij hoort het steekproefgemiddelde (x-bar) en de standaarddeviatie s. Een
‘parameter’ beschrijft de populatie. Hierbij hoort het gemiddelde (m) en de standaarddeviatie s. Op basis van de steekproef
worden beslissingen gemaakt en voorspellingen gedaan over de populatie. Dit wordt ook wel inferentiële statistiek genoemd.

Puntenschatting en intervalschatting
Populatie paramaters hebben twee manieren om te schatten: puntschatting en intervalschatting. Een schatter (estimator) is een
steekproefwaarde (sample statistic) die wordt gebruikt om de populatieparameter mee te schatten
• Puntschatting (point estimate)
Schattig van een specifiek percentage of een specifiek gemiddelde. Deze schatting wordt gedaan op basis van een
steekproefproportie of een steekproefgemiddelde
Voorbeeld: X krijgt 56,5% van de stemmen/het gemiddelde cijfer is een 8,2
• Intervalschatting (interval estimate)
Schatting van een range. Hierbij wordt een bepaalde foutmarge (margin of error) gegeven, waardoor het mogelijk is
de nauwkeurigheid van de puntschatting te bepalen
Voorbeeld: X krijgt tussen de 54,5% en 58,5% van de stemmen

Bij categorische variabelen wordt een proportie geschat, welke zowel een puntschatting als een intervalschatting kan zijn. Bij
kwantitatieve variabelen wordt een specifiek gemiddelde geschat en wordt dus alleen een puntschatting gedaan.

Kenmerken van een goede puntschatting
Een goede puntschatting heeft twee kenmerken:
• Zuiver (unbiased)
Het gemiddelde van de steekproevenverdeling is gelijk aan het gemiddelde van de populatie. Een onzuivere
schatter (biased estimator) overschat of onderschat daarentegen de populatieparameter en is dus geen goede schatter
• Kleine standaard error (efficient estimate)
Een goede schatter heeft een kleine standaardfout in vergelijking met andere schatters. Dit wordt dan ook wel een
efficiënte schatting genoemd. Hoe kleiner de standaardfout, hoe efficiënter de schatting

Betrouwbaarheid van een intervalschatting
Hoe betrouwbaar een intervalschattig is wordt bepaald aan de hand van twee factoren:
• Het betrouwbaarheidsinterval (confidence interval)
Dit is een interval van waarden, waarvan we met een bepaald vertrouwen aannemen dat de ‘ware’ waarde van de
populatieparameter daarin ligt. Deze wordt bepaald door de puntschatting en de foutmarge (margin of error). De
foutmarge wordt bepaald door de z-score op basis van het betrouwbaarheidsniveau en de standaardfout
Voorbeeld: we kunnen met 95% vertrouwen zeggen dat de werkelijke waarde van de voorkeur voor X tussen de
54,5% en de 58,5% ligt
• Het betrouwbaarheidsniveau (confidence level)
Dit is de kans dat de populatieparameter daadwerkelijk in het interval ligt
Voorbeeld: we kunnen met 95% vertrouwen zeggen dat de werkelijke waarde van de voorkeur voor X tussen de
54,5% en de 58,5% ligt
Het meest gebruikte betrouwbaarheidsniveau is 0,95. In dat geval weet je met 95%
zekerheid dat de populatieparameter in een bepaald betrouwbaarheidsinterval ligt. De
foutmarge (a) is hierbij 5%. Er is dus 0,05 kans dat we het fout hebben. Deze fout kan
in beide ‘staarten’ van de verdeling liggen. Om de benodigde z-score bij 95%
betrouwbaarheidsniveau te vinden wordt a daarom gedeeld door 2 (p = 0,025).

Betrouwbaarheidsinterval berekenen
Om een betrouwbaarheidsinterval te berekenen worden verschillende stappen genomen:
1) Neem de puntschattig
2) Bepaal het betrouwbaarheidsniveau
3) Bereken de foutmarge op basis van de standaardfout en z-score: foutmarge = standaardfout ∗ z − score
4) Bereken het betrouwbaarheidsinterval op basis van de formule: B.I. = puntschatting ± foutmarge
5) Trek de conclusie

Betrouwbaarheidsinterval berekenen met proportie
Voorbeeld: we willen een 95% betrouwbaarheidsinterval maken voor de proportie Amerikanen die in reïncarnatie gelooft. In
2003 werd middels een survey aan 2201 Amerikanen gevraagd of ze in reïncarnatie geloofden. Van deze 2201 Amerikanen
geloofde 594 in reïncarnatie
1) Puntschatting
Aangezien het hier om een categorische variabele gaat wordt gekeken naar de proportie: 594 van de 2201 geloven
!"#
in reïncarnatie, dus: p-hat = = 0,2699
$$%&

, 2) Betrouwbaarheidsniveau
Het betrouwbaarheidsniveau wordt door de onderzoeker zelf bepaald. Dit reken je dus niet uit! In dit geval wordt
gekozen voor een betrouwbaarheidsniveau van 95%

3) Foutmarge op basis van de standaardfout en de z-score
'%,$)(&+%,$))
Standaardfout (se) = = 0,0095
$$%&

Z-score: het betrouwbaarheidsniveau is 95%. Dit betekent dat er een foutmarge is van 5%. Omdat deze kans is
%,%!
beide staarten van de verdeling kan liggen, wordt de kans gedeeld door twee: p = $ = 0,0250, Kijk in tabel A bij
p = 0,0250, Deze hoort bij een z-score van –1,96,




Foutmarge = 1,96 ∗ 0,0095 = 0,01862

4) Betrouwbaarheidsinterval
Bovengrens betrouwbaarheidsinterval = 0,27 + 0,01862 = 0,28862
Ondergrens betrouwbaarheidsinterval = 0,27 − 0,01862 = 0,25138

5) Conclusie
We kunnen met 95% zekerheid zeggen dat het percentage van alle Amerikanen dat in reïncarnatie gelooft tussen de
25,1% en 28,9% ligt

Betrouwbaarheidsinterval berekenen met gemiddelde en z-score
Voorbeeld: we willen een 95% betrouwbaarheidsinterval maken van het aantal sekspartners per jaar van Amerikanen. In
2006 werd aan 2400 Amerikanen gevraagd hoeveel sekspartners ze het afgelopen jaar hadden gehad. Het gemiddelde was
1,04 en de standaarddeviatie 1,09.

1) Puntschatting
Aangezien het hier om een kwantitatieve variabele gaat wordt gekeken naar het gemiddelde. Deze wordt gegeven:
1,04 sekspartners per jaar

2) Betrouwbaarheidsniveau
Het betrouwbaarheidsniveau wordt door de onderzoeker zelf bepaald aan de hand van de hoeveelheid zekerheid de
hij wil. Dit reken je dus niet uit! In dit geval wordt gekozen voor een betrouwbaarheidsniveau van 95%

3) Foutmarge op basis van de standaardfout en de z-score
&%"
Standaardfout (se) = = 0,022
√$#%%

Z-score: het betrouwbaarheidsniveau is 95%. Zoals in het vorige voorbeeld is laten zien hoort hier een z-score van
1,96 bij

Foutmarge = 1,96 ∗ 0,022 = 0,0436

4) Betrouwbaarheidsinterval
Bovengrens betrouwbaarheidsinterval = 1,04 + 0,0436 = 1,0836
Ondergrens betrouwbaarheidsinterval = 1,04 − 0,0436 = 0,9964

5) Conclusie
We kunnen met 95% zekerheid zeggen dat het gemiddeld aantal sekspartners van alle Amerikanen tussen de 1,00
en 1,08 ligt

Invloeden op het betrouwbaarheidsinterval
Als het betrouwbaarheidsniveau wordt vergroot (bijvoorbeeld van 95% naar 99%), is dit van invloed op de z-score. In plaats
van p = 0,025 (betrouwbaarheidsinterval 95%) wordt er bijvoorbeeld naar p = 0,005 (betrouwbaarheidsinterval 99%) gezocht
in tabel A. Waar bij een betrouwbaarheidsniveau van 95% een z-score van – 1,96 hoorde, hoort bij een betrouwbaarheids-
niveau van 99% een z-score van – 2,58, zoals is af te lezen uit tabel A. Als gevolg hiervan neemt de foutmarge toe en wordt
het betrouwbaarheidsinterval breder. De schatting wordt hiermee dus minder precies.

, In onderstaande tabel zijn de meest voorkomende betrouwbaarheidsniveaus met hun bijbehorende foutmarge en z-score
weergegeven.

Betrouwbaarheidsniveau Foutmarge (a) Z-score Betrouwbaarheidsinterval
0,90 0,10 1,645 p ± 1,645(se)
0,95 0,05 1,96 p ± 1,96(se)
0,99 0,01 2,58 p ± 2,58(se)

Als de steekproefgrootte toeneemt (bijvoorbeeld van n = 240 naar n = 2400), is dit van invloed op de standaardfout. De
standaardfout bij een grote steekproef is kleiner dan de standaardfout bij een kleine steekproef. De standaarddeviatie wordt
immers door een groter getal gedeeld, waardoor deze kleiner wordt. Als gevolg hiervan neemt de foutmarge af en wordt het
betrouwbaarheidsinterval smaller. De schatting wordt hiermee dus preciezer.

De t-score gebruiken in plaats van de z-score
Om de standaardfout bij een gemiddelde te berekenen wordt in plaats van de s (standaarddeviatie van de populatie) gebruik
gemaakt van de s (standaarddeviatie van de steekproef), omdat de s vaak onbekend is. Hierdoor is er sprake van een extra
onzekerheid. In plaats van een z-score wordt daarom gebruik gemaakt van een t-score. Om gebruik te kunnen maken van een
t-score moet aan de volgende eisen worden voldaan:
• De data moet worden vergaard door middel van een random sample of een gerandomiseerd experiment
• De data moet ongeveer normaal verdeeld zijn en dus moet n groter zijn dan 30 (Centrale Limiet Theorie)

De t-score wordt gebruikt bij gemiddelden wanneer de n kleiner is dan 100, Wanneer de n bij gemiddelden groter is dan 100,
wordt gewoon gebruik gemaakt van de z-score. Bij proporties wordt altijd gebruik gemaakt van z-scores. Wanneer de n groot
genoeg is neigt de t-verdeling naar de standaard normaalverdeling (op basis van z-scores).

De t-verdeling is afhankelijk van het betrouwbaarheidsniveau en de vrijheidsgraden (degrees of freedom, df). De
vrijheidsgraden kunnen worden berekend door: df = n – 1, Het betrouwbaarheidsniveau wordt door de onderzoeker bepaald.

Betrouwbaarheidsinterval berekenen met gemiddelde en t-score
Voorbeeld: we willen een 95% betrouwbaarheidsinterval maken over de sportprestaties van de studenten van een universiteit.
Aan 7 studenten wordt gevraagd hoe vaak zij per week sporten. Hieruit is naar voren gekomen dat studenten gemiddeld 2,45
keer per week sporten, met een standaardafwijking van 0,54
1) Puntschatting
Aangezien het om een kwantitatieve variabele gaat wordt naar het gemiddelde gekeken. Deze is gegeven: 2,45 keer
per week sporten

2) Betrouwbaarheidsniveau
Het betrouwbaarheidsniveau wordt door de onderzoeker zelf bepaald aan de hand van de hoeveelheid zekerheid de
hij wil. Dit reken je dus niet uit! In dit geval wordt gekozen voor 95%

3) Foutmarge op basis van de standaardfout en de t-score
%,!#
Standaardfout (se) = = 0,204
√)
T-score: het betrouwbaarheidsniveau is 95%. Dit wordt in tabel B ook wel ‘confidence level’ genoemd. Kies
bovenaan in de tabel het juiste betrouwbaarheidsniveau. Aan de linkerkant van de tabel staan de vrijheidsgraden
(df). In dit geval zijn de degrees of freedom 6 (7-1). Bij dit betrouwbaarheidsniveau en degrees of freedom hoort
een t-score van 2,447




Foutmarge = 2,447 ∗ 0,204 = 0,499

4) Betrouwbaarheidsinterval
Bovengrens betrouwbaarheidsinterval = 2,45 + 0,499 = 2,949
Ondergrens betrouwbaarheidsinterval = 2,45 − 0,499 = 1,951
€7,49
Krijg toegang tot het volledige document:
Gekocht door 24 studenten

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Beoordelingen van geverifieerde kopers

Alle 5 reviews worden weergegeven
3 jaar geleden

5 jaar geleden

5 jaar geleden

5 jaar geleden

5 jaar geleden

4,4

5 beoordelingen

5
3
4
1
3
1
2
0
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
sop_hie_ Vrije Universiteit Amsterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
611
Lid sinds
10 jaar
Aantal volgers
316
Documenten
0
Laatst verkocht
1 week geleden
Welkom!

Hi student! Leuk dat je op mijn profiel kijkt. Hier vind je alles wat je nodig hebt voor de pre-master en master Beleid, Communicatie en Organisatie aan de Vrije Universiteit Amsterdam. Beide studies heb ik cum laude afgerond. Ik help je graag hetzelfde te doen door mijn samenvattingen met je te delen. Succes met studeren! ✨

4,2

44 beoordelingen

5
19
4
15
3
8
2
2
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen