College 1
*Doel Statistiek 2: generaliseren steekproefuitkomsten
(steekproefuitkomsten variëren > steekproevenverdeling)
* Bij heel vaak steekproef uit populatie trekken geldt:
1. steekproefgemiddelden variëren minder dan scores in populatie.
- Variantie van steekproefgemiddelden is KLEINER dan variantie van scores in populatie
- Gemiddelde van steekproefgemiddelden is ZELFDE als gemiddelde van scores in populatie.
2. verdeling van steekproefgemiddelden is ‘meer’ normaal verdeeld dan de scores.
- Als scores normaal verdeeld zijn, dan is het steekproefgemiddelde ook normaal verdeeld.
- verdeling van scores in populatie N(,)
verdeling van steekproefgemiddelden N(,/n)
- Centrale limietstelling : Als scores in populatie NIET normaal verdeeld, dan steekproefgemiddelde
meer normaal verdeeld naarmate n toeneemt. Dus als n heel groot is dan geld: verdeling van
steekproefgemiddelden is ongeveer N(,/n) > ook als scores totaal niet normaal verdeeld zijn in
populatie.
* Als je heel veel steekproeven trekt:
en
Het steekproefgemiddelde heeft dan een verdeling van : x x n
* Populatie(parameter) Steekproef(statistic)
Proportie succes p Aantal successen in steekproef: verdeeld volgens B(n,p)
Gemiddelde , standaarddeviatie Steekproefgemiddelde
* Mbv steekproefgemiddelde, schatting maken van populatiegemiddelde(=omgekeerde stap)
> waar ligt het populatiegemiddelde ongeveer? > X~N(μX,σX) en n is groot (σ altijd gegeven)
College 2
* 95%Betrouwbaarheidsinterval: 95% zeker dat populatiewaarde () erin ligt. Dus dat het
steekproefgemiddelde niet verder dan [..] van de populatiewaarde afligt.
*Betrouwbaarheidsinterval: schatting ± margin of error
(afhankelijk van niveau C%)
*Betrouwbaarheidsinterval voor populatiegemiddelde =
(C% van de oppervlakte onder de
standaardnormaalverdeling ligt x z*
tussen –z* en z*) n
Z* opzoeken in Tabel A. Bij 80% moet je opzoeken bij p=0.90. Bij 95% p=0,975
*Breedte interval bepaalt door: :
- niveau C (want C bepaalt z*) > 80% smaller interval dan 95%
- (hoe kleiner , des te smaller interval)
- n (grotere steekproefgrootte, dan smaller interval)
* Berekenen hoe groot steekproefgrootte moet zijn voor gewenste breedte.
Als breedte maximaal 4 moet zijn > margin of error = 2
Dan vergelijking oplossen:
z* 2
n
* Margin of error kleiner > als betrouwbaarheidsniveau C ook kleiner wordt. .
*Doel Statistiek 2: generaliseren steekproefuitkomsten
(steekproefuitkomsten variëren > steekproevenverdeling)
* Bij heel vaak steekproef uit populatie trekken geldt:
1. steekproefgemiddelden variëren minder dan scores in populatie.
- Variantie van steekproefgemiddelden is KLEINER dan variantie van scores in populatie
- Gemiddelde van steekproefgemiddelden is ZELFDE als gemiddelde van scores in populatie.
2. verdeling van steekproefgemiddelden is ‘meer’ normaal verdeeld dan de scores.
- Als scores normaal verdeeld zijn, dan is het steekproefgemiddelde ook normaal verdeeld.
- verdeling van scores in populatie N(,)
verdeling van steekproefgemiddelden N(,/n)
- Centrale limietstelling : Als scores in populatie NIET normaal verdeeld, dan steekproefgemiddelde
meer normaal verdeeld naarmate n toeneemt. Dus als n heel groot is dan geld: verdeling van
steekproefgemiddelden is ongeveer N(,/n) > ook als scores totaal niet normaal verdeeld zijn in
populatie.
* Als je heel veel steekproeven trekt:
en
Het steekproefgemiddelde heeft dan een verdeling van : x x n
* Populatie(parameter) Steekproef(statistic)
Proportie succes p Aantal successen in steekproef: verdeeld volgens B(n,p)
Gemiddelde , standaarddeviatie Steekproefgemiddelde
* Mbv steekproefgemiddelde, schatting maken van populatiegemiddelde(=omgekeerde stap)
> waar ligt het populatiegemiddelde ongeveer? > X~N(μX,σX) en n is groot (σ altijd gegeven)
College 2
* 95%Betrouwbaarheidsinterval: 95% zeker dat populatiewaarde () erin ligt. Dus dat het
steekproefgemiddelde niet verder dan [..] van de populatiewaarde afligt.
*Betrouwbaarheidsinterval: schatting ± margin of error
(afhankelijk van niveau C%)
*Betrouwbaarheidsinterval voor populatiegemiddelde =
(C% van de oppervlakte onder de
standaardnormaalverdeling ligt x z*
tussen –z* en z*) n
Z* opzoeken in Tabel A. Bij 80% moet je opzoeken bij p=0.90. Bij 95% p=0,975
*Breedte interval bepaalt door: :
- niveau C (want C bepaalt z*) > 80% smaller interval dan 95%
- (hoe kleiner , des te smaller interval)
- n (grotere steekproefgrootte, dan smaller interval)
* Berekenen hoe groot steekproefgrootte moet zijn voor gewenste breedte.
Als breedte maximaal 4 moet zijn > margin of error = 2
Dan vergelijking oplossen:
z* 2
n
* Margin of error kleiner > als betrouwbaarheidsniveau C ook kleiner wordt. .