Statistiek 2
MAT - 15403
Tutorial 1
Populatie: gehele groep elementen waarover informatie wordt gewenst
Steekproef: gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren
Eenheden: elementen van steekproef waaraan gegevens worden verzameld
Variabele: eigenschap van element uit steekproef die wordt bepaald
Kwantitatieve variabele
Continu; iets om te meten
Discreet; heel aantal
Kwalitatieve variabele
Nominaal; gegeven niet te ordenen
Ordinaal; gegevens te ordenen
Visualisatie resultaten
Histogram: alle mogelijke waarden (tussen hele getallen in) worden behaald
→ veel waarnemingen → steeds kleinere klassenbreedten in histogram → curve wordt kansdichtheidsfunctie
Staafdiagram: discrete variabelen met beperkt aantal mogelijke uitkomsten
Normaalverdeling Standaard normaalverdeling
Eentoppig Z ~ N(0,σ)1)
Symmetrisch P(y </>/≠ z) aflezen in tabel 1
Klokvormig
Notatie y~N(µ,σ)σ))
2
1 y−μ
1 ( )
f(y) = e2 σ
σ √2 π
Waarnemingen rond rechte lijn in QQ-plot
Transformatie y ~ N(µ,σ)σ)) → Z ~ N(0,σ)1)
y = µ + z σ) → Z = (y-μ)/σ)/σ)
QQ-plot
Waarnemingen uit steekproef rond rechte lijn; populatie normaal verdeeld
Waarnemingen met kromming naar rechts → verdeling scheef naar rechts (in curve top aan linkerkant)
Waarnemingen uitlopend in tegengestelde richting aan uiteinden → normaalverdeling met dikkere staarten
Centrale limietstelling
Enkelvoudig Aselecte Steekproef van omvang n,σ) populatie met verwachting µ y en standaardafwijking σ)y.
σy
Verdeling steekproefgemiddelde: y ~ N (µy ,σ) )
√n
→ steekproefgemiddelde bij benadering normaal verdeeld
Verdeling som: y ~ N (n µy,σ) √ n σ)y) ∑
Tutorial 2
ŷ (gemiddelde) is consistente schatter voor µy: hoe groter de steekproef,σ) hoe dichterbij hij komt
→ ŷ : puntschatting voor µy
Betrouwbaarheidsinterval: informatie nauwkeurigheid schatting
Betrouwbaarheidscoëfficient 1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat geeft mate van vertrouwen weer; 1- α geeft mate van vertrouwen weer; 1-α = 95%; kans dat = 95%; kans dat
betrouwbaarheidsinterval µy bevat = 0.95
1-6
, Tabel 2; voor 1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ; right-tail p: 0.025 → df = inf → za/2 = 1.960
σy
Grenzen betrouwbaarheidsinterval ŷ ± za/2
√n
σ): populatie standaardafwijking; schatten door s: steekproef standaardafwijking
σ s
σ y= y =
√n √n
Standaardfout: maat voor nauwkeurigheid steekproefgemiddelde als schatter voor populatiegemiddelde
s
SE =
√n
Door schatten van σ) extra onnauwkeurigheid
Standaard normale verdeling → t-verdeling met bepaald aantal vrijheidsgraden
σ) bekend σ) onbekend
(1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ) betrouwbaarheidsinterval voor µ (1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ) betrouwbaarheidsinterval voor µ
σy s
ŷ ± za/2 ŷ ± ta/2
√n √n
za/2 uit N(0,σ)1)-verdeling ta/2 uit t(n-1)-verdeling
[df=inf.,σ) right-tail p = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat /2,σ) tabel 2] [df=n-1,σ) right-tail p = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat /2,σ) tabel 2]
Tutorial 3
Toets procedure
1. H0 en Ha opstellen
2. Kiezen ToetsingsGrootheid TG
3. Kansverdeling van TG onder H0
4. Gedrag TG onder Ha; kleiner/groter/kleiner of grotere waarden
5. Zijdigheid P-waarde; rechtszijdig,σ) linkszijdig,σ) tweezijdig
6. Berekenen TG
7. P-waarde bepalen
8. Conclusie; ook in niet statistische bewoordingen; ga uit van Ha!
Z-toets; onder Z ~ N(0,σ)1)
Toetsingsgrootheid; y: aantal eenheden uit populatie dat voldoet aan gebeurtenis
P-waarde: kans -berekend onder de aanname dat H0 waar is- dat toetsingsgrootheid een waarde zou aannemen
die even extreem is als feitelijk waargenomen uitkomst; hoe kleiner P-waarde hoe sterker bewijs tegen H 0
Significantieniveau; onbetrouwbaarheidsdrempel: waarde die nauwkeurigheid bewijs bepaalt
P-waarde ≤ α geeft mate van vertrouwen weer; 1-α = 95%; kans dat → H0 verworpen en Ha aangetoond
P-waarde ≥ α geeft mate van vertrouwen weer; 1-α = 95%; kans dat → H0 niet verworpen en Ha niet aangetoond
Kritiek gebied: KG: uitkomsten van toetsingsgrootheid waarvoor H 0 verworpen wordt
KG bepalen: [tabel 2]: tα geeft mate van vertrouwen weer; 1-α = 95%; kans dat =significantieniveau,σ) x df let op; bij tweezijdig KG t(α geeft mate van vertrouwen weer; 1-α = 95%; kans dat =significantieniveau)/2 ,σ) x df
Fout type I: H0 ten onrechte verworpen kans = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat
Fout type II: H0 ten onrechte niet verwerpen kans = β
2-6
MAT - 15403
Tutorial 1
Populatie: gehele groep elementen waarover informatie wordt gewenst
Steekproef: gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren
Eenheden: elementen van steekproef waaraan gegevens worden verzameld
Variabele: eigenschap van element uit steekproef die wordt bepaald
Kwantitatieve variabele
Continu; iets om te meten
Discreet; heel aantal
Kwalitatieve variabele
Nominaal; gegeven niet te ordenen
Ordinaal; gegevens te ordenen
Visualisatie resultaten
Histogram: alle mogelijke waarden (tussen hele getallen in) worden behaald
→ veel waarnemingen → steeds kleinere klassenbreedten in histogram → curve wordt kansdichtheidsfunctie
Staafdiagram: discrete variabelen met beperkt aantal mogelijke uitkomsten
Normaalverdeling Standaard normaalverdeling
Eentoppig Z ~ N(0,σ)1)
Symmetrisch P(y </>/≠ z) aflezen in tabel 1
Klokvormig
Notatie y~N(µ,σ)σ))
2
1 y−μ
1 ( )
f(y) = e2 σ
σ √2 π
Waarnemingen rond rechte lijn in QQ-plot
Transformatie y ~ N(µ,σ)σ)) → Z ~ N(0,σ)1)
y = µ + z σ) → Z = (y-μ)/σ)/σ)
QQ-plot
Waarnemingen uit steekproef rond rechte lijn; populatie normaal verdeeld
Waarnemingen met kromming naar rechts → verdeling scheef naar rechts (in curve top aan linkerkant)
Waarnemingen uitlopend in tegengestelde richting aan uiteinden → normaalverdeling met dikkere staarten
Centrale limietstelling
Enkelvoudig Aselecte Steekproef van omvang n,σ) populatie met verwachting µ y en standaardafwijking σ)y.
σy
Verdeling steekproefgemiddelde: y ~ N (µy ,σ) )
√n
→ steekproefgemiddelde bij benadering normaal verdeeld
Verdeling som: y ~ N (n µy,σ) √ n σ)y) ∑
Tutorial 2
ŷ (gemiddelde) is consistente schatter voor µy: hoe groter de steekproef,σ) hoe dichterbij hij komt
→ ŷ : puntschatting voor µy
Betrouwbaarheidsinterval: informatie nauwkeurigheid schatting
Betrouwbaarheidscoëfficient 1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat geeft mate van vertrouwen weer; 1- α geeft mate van vertrouwen weer; 1-α = 95%; kans dat = 95%; kans dat
betrouwbaarheidsinterval µy bevat = 0.95
1-6
, Tabel 2; voor 1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ; right-tail p: 0.025 → df = inf → za/2 = 1.960
σy
Grenzen betrouwbaarheidsinterval ŷ ± za/2
√n
σ): populatie standaardafwijking; schatten door s: steekproef standaardafwijking
σ s
σ y= y =
√n √n
Standaardfout: maat voor nauwkeurigheid steekproefgemiddelde als schatter voor populatiegemiddelde
s
SE =
√n
Door schatten van σ) extra onnauwkeurigheid
Standaard normale verdeling → t-verdeling met bepaald aantal vrijheidsgraden
σ) bekend σ) onbekend
(1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ) betrouwbaarheidsinterval voor µ (1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ) betrouwbaarheidsinterval voor µ
σy s
ŷ ± za/2 ŷ ± ta/2
√n √n
za/2 uit N(0,σ)1)-verdeling ta/2 uit t(n-1)-verdeling
[df=inf.,σ) right-tail p = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat /2,σ) tabel 2] [df=n-1,σ) right-tail p = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat /2,σ) tabel 2]
Tutorial 3
Toets procedure
1. H0 en Ha opstellen
2. Kiezen ToetsingsGrootheid TG
3. Kansverdeling van TG onder H0
4. Gedrag TG onder Ha; kleiner/groter/kleiner of grotere waarden
5. Zijdigheid P-waarde; rechtszijdig,σ) linkszijdig,σ) tweezijdig
6. Berekenen TG
7. P-waarde bepalen
8. Conclusie; ook in niet statistische bewoordingen; ga uit van Ha!
Z-toets; onder Z ~ N(0,σ)1)
Toetsingsgrootheid; y: aantal eenheden uit populatie dat voldoet aan gebeurtenis
P-waarde: kans -berekend onder de aanname dat H0 waar is- dat toetsingsgrootheid een waarde zou aannemen
die even extreem is als feitelijk waargenomen uitkomst; hoe kleiner P-waarde hoe sterker bewijs tegen H 0
Significantieniveau; onbetrouwbaarheidsdrempel: waarde die nauwkeurigheid bewijs bepaalt
P-waarde ≤ α geeft mate van vertrouwen weer; 1-α = 95%; kans dat → H0 verworpen en Ha aangetoond
P-waarde ≥ α geeft mate van vertrouwen weer; 1-α = 95%; kans dat → H0 niet verworpen en Ha niet aangetoond
Kritiek gebied: KG: uitkomsten van toetsingsgrootheid waarvoor H 0 verworpen wordt
KG bepalen: [tabel 2]: tα geeft mate van vertrouwen weer; 1-α = 95%; kans dat =significantieniveau,σ) x df let op; bij tweezijdig KG t(α geeft mate van vertrouwen weer; 1-α = 95%; kans dat =significantieniveau)/2 ,σ) x df
Fout type I: H0 ten onrechte verworpen kans = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat
Fout type II: H0 ten onrechte niet verwerpen kans = β
2-6