PRACTICUM 1: STEEKPROEVENVERDELINGEN EN PUNTSCHATTINGEN (HC1+2+3)
Variantie met/ zonder accent
1 1
𝑆𝑋2 = ∑(𝑋𝑖 − 𝑋̅)2 𝑆′𝑋2 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛 𝑛−1
𝑛−1 𝑛
𝑆2 = √ ∗ 𝑆′𝑥 𝑆′2 = √ ∗ 𝑆𝑥
𝑛 𝑛−1
Gemiddelde gekwadrateerde fout1/ mean squared error (MSE) [zie formularium]
met 𝜃̂ als schatter & 𝜃 voor de populatieparameter;
In de plaats van 𝜃 kan er ook een ander symbool komen;
- De gemiddelde gekwadrateerde fout zal altijd gelijk zijn aan de variantie van de schatter ALS
zuiver.
Lineaire transformaties & somvariabelen (opfrissing stat. 1)
Lineaire transformatie Somvariabele
Gemiddelde ̅̅̅̅̅̅̅̅̅
𝑎𝑋 + 𝑏 = 𝑎 𝑋̅ + 𝑏 ̅̅̅̅̅̅̅̅
𝑋 + 𝑌 = 𝑋 + 𝑌̅
̅
Variantie 2
𝑠𝑎𝑋+𝑏 = 𝑎2 𝑠𝑋2 2
𝑠𝑋+𝑌 = 𝑠𝑋2 + 𝑠𝑌2 + 2𝑠𝑋𝑌
bij idd wordt 2*covariantie=0
Standaarddeviatie 𝑠𝑎𝑋+𝑏 = |𝑎| 𝑠𝑋
Covariantie 𝑠𝑎𝑋+𝑏 𝑌 = 𝑎𝑠𝑋 𝑌 𝑠𝑋+𝑌 𝑍 = 𝑠𝑋𝑍 + 𝑠𝑌𝑍
Correlatie 𝑟𝑎𝑋+𝑏 𝑌 = 𝑟𝑋 𝑌 𝑎𝑙𝑠 𝑎 > 0 𝐸𝑁
−𝑟𝑋 𝑌 𝑎𝑙𝑠 𝑎 < 0
𝜎𝜻𝑋 𝜻𝑌 = 𝜌𝑋𝑌
Covariantie 2 Z-scores = correlatie
oorspronkelijke variabelen.
Belangrijke oefening om op te oefenen: Practicum 1, basis 3
1
Gemiddelde gekwadrateerde fout= gemiddelde gekwadrateerde afstand tussen de schattingen en de te schatten
parameter.
, Vierkantswortel
Een vierkantswortel van een som mag je NIET zomaar vereenvoudigen!
√𝑎 + 𝑏 ≠ √𝑎 + √𝑏
√𝑎 ∗ 𝑏 = √𝑎 ∗ √𝑏
Opfrissing modellen
Ja: Binominaal 𝜃= kans op succes
# sucessen: 𝜆= verwacht # succes in gekozen tijdseenheid
max?
Altijd: IID
Nee: Poisson
Onafhankelijke experimenten: geen onderlinge beïnvloeding
Stationariteit: kans op succes is altijd hetzelfde
Discreet:
Geometrisch Normaal & uniforme verdeling: symmetrisch gem= mediaan
Wachttijd 1e
succes
Continu:
Exponentieel
Enumeratieve methode2 (stappenplan)
Enkel mogelijk bij kleine steekproeven, het is onmogelijk om bij grote/ oneindige steekproef alle mogelijke
steekproeven op te lijsten.
1) Lijst met alle mogelijke steekproeven met gegeven steekproefgrootte.
- Alle combinaties met gegeven variabelen
2) Voor elke mogelijke steekproef:
- Kans bepalen van voorkomen
- Waarde van statistiek bepalen
3) Optellen kansen met zelfde statistiek waarde.
Gekwadrateerde standaardfout [zie formularium]
Independent and identically distributed (IID)
Alle waarnemingen zijn:
- Onafhankelijk zijn van elkaar (independent), én
- Gelijk verdeeld zijn volgens dezelfde kansverdeling (identically distributed).
De waarnemingen komen uit dezelfde populatie en beïnvloeden elkaar niet.
In een kansmassatabel: De kansmassa van een cel in de tabel is gelijk aan het product van de marges.
Unieke volgordes/ permutaties (bv. {10,10,20} en {5,10,20})
Aantal permutaties zonder herhaling: x! cf. 3! = 3*2*1 = 6
Corrigeren voor herhalingen (in eerste geval): (x!/y!) cf. (3!/2!) = 3
2
Enumeratieve methode= opsommen of ‘enumereren’ van elle mogelijke steekproeven.