Herhaling
Gemiddelde “1”
Rekenkundig gemiddelde
- Steekproefgemiddelde (omvang n) =
- Populatiegemiddelde (omvang N) = verwachtingswaarde =
Variantie
= het rekenkundig gemiddelde van de kwadratische
afwijking van de waarnemingsresultaten t.o.v. hun
rekenkundig gemiddelde
- Steekproefvariantie (omvang n) “2”
- Populatievariantie (omvang N) “3”
Nadeel: niet in dezelfde eenheid als de oorspronkelijke
variabele (gekwadrateerd)
Standaarddeviatie
= de wortel van de variantie.
- Standaarddeviatie steekproef (omvang n) “4”
- Standaarddeviatie populatie (omvang N) “5”
Puntschatting en intervalschatting
Populatieparameters zijn niet gekend
→ schatters voor die parameters
Schattingsmethoden:
- Puntschatting:
Schatten van 1 populatieparameter; gemiddelde, variantie of standaarddeviatie
- Intervalschatting:
Intervalschatting [ondergrens; bovengrens] zijn informatiever dan de puntschattingen
omdat ze expliciet de variabiliteit (de onzekerheid) weergeven in de vorm van de
breedte van het interval ( → kennis over verdeling nodig)
1
,Hoofdstuk 1: Steekproefverdeling en
betrouwbaarheidsintervallen
1. Normale verdeling
Betrouwbaarheidsinterval voor het gemiddelde
Wanneer een variabele normaal verdeeld is, dan zal het gemiddelde opnieuw normaal
𝜎
verdeelde zijn met een verwachtingswaarde µ en een standaardfout van 𝑛
√
De som van een groot aantal onafhankelijke variabelen is benaderd normaal verdeeld. De
normale benadering wordt juister naarmate de n groter wordt.
Berekening z-score
- Kansgebied op basis van de z-score “6”
- Z-score op basis van een kansgebied “7”
- Op andere manieren “8”
Dit interval bevat het populatiegemiddelde µ met 95% betrouwbaarheid.
In 95% van de gevallen (herhaling steekproef) ligt het populatiegemiddelde in dit interval.
Betrouwbaarheidsinterval
- Berekend op basis van het steekproefgemiddelde
- Verschilt van steekproef tot steekproef
- Kan soms ver afwijken van het populatiegemiddelde
!! Er is altijd de mogelijkheid dat een foutieve conclusie wordt genomen. Als het
betrouwbaarheidsinterval 95% is dan ligt in 5% van de gevallen het populatiegemiddelde
niet in dit interval.
- Kleinere spreiding → kleiner interval en nauwkeurigere uitspraken
- Grotere spreiding → groter interval en onnauwkeuriger
, - Hoe groter n → hoe kleiner het interval zal worden en hoe nauwkeuriger
2. Chi-kwadraat verdeling
De vorm van de 𝑋 2 is afhankelijk van n. Hoe hoger n is, hoe meer
de verdeling gelijkt op een normale verdeling.
n-1 = aantal vrijheidsgraden = aantal waarnemingen die de
steekproef kent
Overschrijdingskansen
𝑃𝑙𝑖𝑛𝑘𝑠 = “9”
𝑃𝑟𝑒𝑐ℎ𝑡𝑠 = “10”
Waarde behorende bij de overschrijdingskans
Waarde behorende bij 𝑃𝑙𝑖𝑛𝑘𝑠 = “11”
Waarde behorende bij 𝑃𝑟𝑒𝑐ℎ𝑡𝑠 = “12”
Voor onafhankelijke normaal verdeelde data N(µ:𝜎), kan de steekproefvariantie geschat
worden door: En men kan aantonen dat:
Een chi-kwadraat kan nooit negatief zijn!
3. T-verdeling
- Een T-verdeling lijkt sterk op een standaard
normale verdeling
- Het maximum is gelegen in 0 en vertoont een
symmetrie t.o.v. x = 0
- Ten opzichte van de standaard normale verdeling
is de T-verdeling iets meer afgeplat in de top en de
flanken zijn wat breder.
Overschrijdingskansen
𝑃𝑙𝑖𝑛𝑘𝑠 = “13”
𝑃𝑟𝑒𝑐ℎ𝑡𝑠 = “14”
Dubbele overschrijdingskans P = “15”
Waarde behorend bij de overschrijdingskans
Waarde behorende bij 𝑃𝑙𝑖𝑛𝑘𝑠 = “16”
Waarde behorende bij 𝑃𝑟𝑒𝑐ℎ𝑡𝑠 = “17”
3