100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4,6 TrustPilot
logo-home
Samenvatting

Samenvatting Toetsende Statistiek (Agresti & Franklin) Hoofdstuk 8 t/m 15 + collegeaantekeningen

Beoordeling
-
Verkocht
1
Pagina's
33
Geüpload op
12-03-2021
Geschreven in
2020/2021

Hierbij een samenvatting voor het vak Toetsende Statistiek. Alle hoofdstukken voor dit vak zijn uitgebreid beschreven met voorbeelden en collegeaantekeningen












Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
Hoofdstuk 8 t/m hoofdstuk 15
Geüpload op
12 maart 2021
Aantal pagina's
33
Geschreven in
2020/2021
Type
Samenvatting

Voorbeeld van de inhoud

Samenvatting Toetsende Statistiek




College 1
Hoofdstuk 8 Statistical inference: confidence intervals
Toetsende (inferentiële) statistiek (inferential statistics) = gebruiken van de statistics om iets te
zeggen over de parameter, methode voor het maken van voorspellingen over een populatie

Statistische conclusies (statistical inference) = concluderende methoden helpen ons om te
voorspellen hoe dicht een steekproefstatistic ligt bij een populatieparameter
 Statistische concluderende methoden zijn belangrijk:
1. Gebruiken kansberekeningen die ervan uitgaan dat de data zijn verzameld door middel van
willekeurige steekproeven of een willekeurig experiment
2. De kansberekeningen verwijzen naar een kansverdeling of een statistic, die meestal een
ongeveer normaalverdeling heeft

Er zijn twee typen van statistische concluderende methoden:
1. Schatting van populatieparameters
2. Testen van hypotheses over de waarden van de parameters
- Parameter= een numerieke samenvatting van de populatie – statistics= een numerieke
samenvatting van een steekproef (werken we het vaakst mee, gebruiken we voor de
parameter

De meest informatieve schattingsmethode= construeert een interval van getallen, een
betrouwbaarheidsinterval, waar we verwachten dat de onbekende parameter binnen zal vallen

8.1 Point and interval estimates of population parameters
Een puntschatting (point estimate) = een enkel getal die onze beste schatting is naar de parameter
 Enkel een puntschatting is vaak niet voldoende, omdat het ons niet verteld hoe dicht de
schatting waarschijnlijk bij de parameter zal liggen
Een intervalschatting (interval estimate) = een interval van getallen waarvan geloofd wordt dat het
de werkelijke waarde van de parameter bevat (puntschatting in het midden hiervan)

, - Is handiger dan een puntschatting, door het integreren van de foutmarge (helpt de
intervalschatting ons bij het pellen van de nauwkeurigheid van de puntschatting)

Puntschatting: een zo goed mogelijke schatting maken van de populatieparameter:
Als we de data verzameld hebben, vinden we de puntschatting door: een geschikte
steekproefstatistic te gebruiken
- Bv. voor een populatiegemiddelde is het steekproefgemiddelde een puntschatting van μ

Eigenschappen van puntschatters:
 Een goede schatter van een parameter heeft twee eigenschappen:
1. Een steekproefverdeling die gecentreerd is rond de parameter = een zuivere (unbiased)
schatter
2. Een kleine standaarddeviatie vergeleken met andere schatters > vertelt ons dat de
schatting dichter bij de parameter neigt te vallen dan andere schatters

Voor elke specifieke parameter zijn verschillende mogelijke puntschattingen (bv. voor een
normaalverdeling is het centrum ‘het gemiddelde en de mediaan’ > mogelijke puntschattingen zijn:
- 1. Het steekproefgemiddelde 2. De steekproefmediaan (want symmetrische verdeling)

Intervalschatting: een interval construeren dat de parameter benaderd:
Om te weten of de schatting nuttig is, moeten we weten hoe dicht de schatting waarschijnlijk zal
vallen bij de eigenlijke waarde van de parameter.
 Een intervalschatting indiceert precisie door een aantal getallen rond de puntschatting
 Het interval is opgebouwd uit getallen die de meest geloofwaardige waarden zijn voor de
onbekende parameter, gebaseerd op de geobserveerde data

Een intervalschatting wordt ook wel ‘betrouwbaarheidsinterval’ genoemd, omdat ze met een
vermoedelijke waarden voor de parameter bevat:
 Wordt gevormd door een methode die de puntschatting combineert met de foutmarge
 De kans dat deze methode een interval vormt die de parameter bevat, wordt het
betrouwbaarheidsniveau genoemd (= een gekozen getal, dat dicht bij 1 ligt, meestal 0,95)

Om een betrouwbaarheidsinterval te construeren is de steekproevenverdeling van de puntschatting
de sleutel > deze verdeling verteld ons de kans dat de puntschatting binnen een bepaalde afstand
van de parameter zal vallen

De logica achter het construeren van een betrouwbaarheidsinterval:
 Een betrouwbaarheidsinterval voor een proportie in de populatie, is gebaseerd op de
steekproevenverdeling van een steekproefproportie, eigenschappen:
- Geeft de mogelijke waarden voor de steekproefproportie en hun kansen weer
- Heeft een ongeveer normale verdeling, voor een groot aantal willekeurige steekproeven
(waarbij np ≥ 15 en n(1-P) ≥ 15)
- Heeft een gemiddelde dat gelijk is aan de populatieproportie p
- Heeft een standaarddeviatie die gelijk is aan √ p(1 – p) / n

De foutenmarge (margin of error) = meet hoe nauwkeurig de puntschatting is in hoe waarschijnlijk hij
de parameter zal schatten
 Als een steekproef is geselecteerd, normaal verdeeld is, en de steekproefproportie inderdaad
binnen 1.96 standaarddeviaties van de populatieproportie ligt (95% van de tijd)
- Dan bevat het interval van ‘steekproefproportie -1.96’ tot ‘steekproefproportie +1.96’ de
populatieproportie

,  In andere woorden: met een kans van ongeveer 0.95 doet een steekproefproportie zich zo
voor dat het interval de onbekende populatieproportie bevat (95% betrouwbaarheidsinterval
voor de populatieproportie)

8.2 Constructing a confidence interval to estimate a population proportion
Als een categorische variabele meer dan twee categorieën heeft, kan hij nog steeds benaderd
worden als binomiaal door een van de categorieën te classificeren als een succes en de overgebleven
categorieën als een mislukking

Vinden van de 95% betrouwbaarheidsinterval voor een populatieproportie:
 De steekproefproportie (de puntschatting) wordt gesymboliseerd door ^p (het dakje staat
hier voor de puntschatting van de parameter) > X gedeeld door alle n
 Voor grote willekeurige steekproeven: vertelt de centrale limietstelling ons dat de
steekproevenverdeling van de steekproefproportie ^p ongeveer normaal is
- Dus een foutmarge voor een 95% betrouwbaarheidsinterval bij een normale
steekproefverdeling= 1.96 > dus ongeveer 95% kans dat ^p binnen 1.96
standaarddeviaties van de populatieproportie (p) valt
- Een 95% betrouwbaarheidsinterval wordt gegeven door: puntschatting ± foutmarge, wat
dan wordt: ^p ± 1.96
- De standaarddeviatie van een steekproefproportie is gelijk aan > √ p(1 – p) / n > is
afhankelijk van de onbekende populatieproportie (p) (in praktijk moeten we p schatten)

Een 95% betrouwbaarheidsinterval wordt als volgt berekend voor de populatieproportie (p) = ^p ±
1.96 (se) met SE = √ ^p (1 – ^p) / n
- De standaardfout (SE)= de geschatte standaarddeviatie van de steekproevenverdeling
 Bij rapporteren van resultaten alleen de eerste twee of drie decimalen

Steekproefgrootte (n) nodig voor de validiteit van het betrouwbaarheidsinterval voor een proportie:
 Het betrouwbaarheidsinterval geld alleen bij grote willekeurige steekproeven (n) > minstens
15 successen en 15 mislukkingen hebt voor een binomiale uitkomst (n ^p ≥ en n(1- ^p) ≥ 15)

Een ander betrouwbaarheidsniveau gebruiken dan 95%:
- 95% is meest gebruikte keuze, sommige toepassingen vragen grotere betrouwbaarheid
- Wel geldt: hoe hoger het betrouwbaarheidsniveau, hoe groter de foutenmarge en hoe
breder het betrouwbaarheidsinterval > dus onnauwkeuriger
 Om de kans op een juiste schatting te verhogen gebruiken we een groter
betrouwbaarheidsniveau, zoals 0.99 > berekenen: p = ^p ± 2.58 (se)
 Om 100% zeker te zijn van een bepaalde schatting, moet het betrouwbaarheidsinterval alle
mogelijke waarden voor de parameter bevatten > in praktijk daarom iets minder perfecte
betrouwbaarheid > ze kunnen zo een beter betrouwbaarheidsinterval geven (meer waard)

Hoe reken je met een ander betrouwbaarheidsniveau:
De algemene formule voor het betrouwbaarheidsinterval
voor een populatieproportie =

- Dus steekproefproportie ± z-score van de
normale tabel (standaardfout)
- De z-score is afhankelijk van het betrouwbaarheidsinterval > bv. 70%, dan zoek je de z-
waarde van 0.15 of 0.85 (want hier vallen de grenzen) > beide zelfde z-score (+ en -)
 De foutmarge is: z(se) = z x (√ ^p (1 – ^p) / n)

, - Dit neemt af wanneer de steekproefomvang (n) toeneemt, voor een gegeven waarde van
^p (hoe groter de waarde van n, hoe smaller het interval)
- En de marge neemt toe als het betrouwbaarheidsniveau groter wordt

Interpretatie van het betrouwbaarheidsinterval:
 De 95% betrouwbaarheid is verwezen naar een interpretatie op de lange termijn > hoe de
methode presteert wanneer steeds opnieuw gebruikt bij vele willekeurige steekproeven
 Dus op lange termijn zal 95% van alle intervallen de correcte resultaten geven, die de
populatieproporties bevatten

Kansen gelden voor statistics (zoals steekproefproportie), niet voor parameters
 De schatting ^p, niet de parameter p, is de toevalsvariabele die een steekproefverdeling en
kansen weergeeft (kunnen dit niet zeggen over de populatie)
 De 95% betrouwbaarheid verwijst niet naar de kans van de populatieproportie p > maar naar
de kans die geldt voor de betrouwbaarheidsintervalmethode in de zin van zijn relatieve
frequentie
- Als we deze keer op keer zouden gebruiken voor verschillende methoden, dan zullen we
op de lange termijn in 95% van de gevallen een juiste schatting maken
 Bayesische statistieken= statistische schatting gebaseerd op de subjectieve definitie van kans
(hiermee kan je wel wat zeggen over de parameter, maar subjectief)

8.3 Constructing a confidence interval to estimate a population mean
Een betrouwbaarheidsinterval maken voor een populatiegemiddelde:
 Het steekproefgemiddelde ( x ) is de puntschatter van het gemiddelde in populatie (μ)
 De standaarddeviatie van het steekproefgemiddelde is: σ / √ n , waarbij σ de
standaarddeviatie van de populatie is
 Maar σ kennen we hier niet > dus de geschatte standaarddeviatie die gebruikt wordt bij
betrouwbaarheidsintervallen is de standaardfout SE = s / √ n
- Hierbij is zowel μ als σ onbekend > dus geen z-score maar een t-waarde (vallen iets
strenger dan een z-waarde om de missende waarden)

De t-verdeling en zijn proporties:
De t-waarde= als de z-score, maar deze komt van een klokvormige verdeling die iets dikkere
uiteinden heeft (dus meer variabiliteit laat zien) dan een normale verdeling
- Deze verdeling noemen we de t-verdeling

Degrees of freedom (vrijheidsgraden), genoteerd als df= voor een schatting van een
populatiegemiddelde, gelijk aan df= n -1, 1 minder dan de steekproefomvang

Gebruik van de t-verdeling om een betrouwbaarheidsinterval van het gemiddelde op te stellen:
 Een 95% betrouwbaarheidsinterval voor het populatiegemiddelde (is= x ± t.025 (se), waarbij
SE = s / √ n
- Een t-waarde kan je opzoeken in de t-tabel in het formuleboek (in combinatie met df)>
daarna keer de standaardfout
- Wanneer df toeneemt, neemt de t-score af richting de z-score
(standaardnormaalverdeling)
- De standaardnormale verdeling is de t-verdeling met df = ∞ > wanneer df boven de 100
ligt, is hij ‘oneindig’ en kijk je naar de onderste balk met dit teken
 Je ziet bij een overschrijdingskans van 0.025 (95%) en een n boven 100 > een t-score
van 1.96 (dus gelijk aan standaardnormaalverdeling) > waarden eigenlijk zelfde als z-
score

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
rosaforto Universiteit van Amsterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
237
Lid sinds
8 jaar
Aantal volgers
194
Documenten
21
Laatst verkocht
2 maanden geleden

3,8

55 beoordelingen

5
13
4
22
3
17
2
0
1
3

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen