Les 1:
Hoe meer spreiding, hoe meer onzekerheid
Spreiding= onzekerheid
Fout van de 1e soort
Fout van de 2e soort (kennen we niet exact)
In statistiek maken we fouten omdat we steekproeven nemen
Deze fouten zijn wel onder controle
x (gemiddelde van de steekproef) is een zuivere schatter van µ (gemiddelde van de populatie)
Sampling distribution = standaardafwijking van x
σ = standaardafwijking in de populatie
S= standaardafwijking in de steekproef
p = steekproefpercentage
π = populatiepercentage
Voorbeeld vs niet-kerkelijke populatie: grafiek gemaakt van de p (= waargenomen percentages) van
de 1000 EAS met 100 mensen
Hoe meer data je hebt, hoe beter de spreiding neemt af naarmate de N stijgt vb: hoe grotere N
hoe beter, MAAR is niet lineair! gaat via een vierkantswortel
Se= standard error = standaard fout
Se (p) = √p(1-p)/N
Formule se: naarmate N groter wordt, wordt je fout kleiner (in termen van de wortel van het aantal
keren dat je steekproef groter wordt)
95% van de steekproeven zitten tussen een interval [π - (2 x se) ; π + (2 x se)]
Populatieverdeling = de verdeling van de variabele in de populatie (meestal niet normaal verdeeld)
Steekproevenverdeling = ‘gedrag’ van steekproefgrootheid bij onbeperkt aantal trekkingen (meestal
normaal verdeeld)
Centrale limietstelling: Wanneer je x berekent, eender hoe u populatieverdeling eruit ziet, vanaf
N>30 (vanaf 30 waarnemingen per steekproef) zal uw x uit een normale verdeling getrokken zal zijn
Onderzoek = hypothesetoetsing
Nuhypothese: er is niets aan de hand, geen verschil, geen effect,…
Alternatieve hypothese: nulhypothese is niet waar
Door te toetsen gaan we proberen de nulhypothese te verwerpen of aanvaarden
Wanneer we de nulhypothese verwerpen gaan we de alternatieve hypothese aanvaarden
Aanvaardingsinterval = een subset van waarden die mogelijk gegenereerd kunnen worden indien de
nulhypothese juist is
Als het binnen het aanvaardingsinterval ligt, dan aanvaarden we de nulhypothese
Hoe meer spreiding, hoe meer onzekerheid
Spreiding= onzekerheid
Fout van de 1e soort
Fout van de 2e soort (kennen we niet exact)
In statistiek maken we fouten omdat we steekproeven nemen
Deze fouten zijn wel onder controle
x (gemiddelde van de steekproef) is een zuivere schatter van µ (gemiddelde van de populatie)
Sampling distribution = standaardafwijking van x
σ = standaardafwijking in de populatie
S= standaardafwijking in de steekproef
p = steekproefpercentage
π = populatiepercentage
Voorbeeld vs niet-kerkelijke populatie: grafiek gemaakt van de p (= waargenomen percentages) van
de 1000 EAS met 100 mensen
Hoe meer data je hebt, hoe beter de spreiding neemt af naarmate de N stijgt vb: hoe grotere N
hoe beter, MAAR is niet lineair! gaat via een vierkantswortel
Se= standard error = standaard fout
Se (p) = √p(1-p)/N
Formule se: naarmate N groter wordt, wordt je fout kleiner (in termen van de wortel van het aantal
keren dat je steekproef groter wordt)
95% van de steekproeven zitten tussen een interval [π - (2 x se) ; π + (2 x se)]
Populatieverdeling = de verdeling van de variabele in de populatie (meestal niet normaal verdeeld)
Steekproevenverdeling = ‘gedrag’ van steekproefgrootheid bij onbeperkt aantal trekkingen (meestal
normaal verdeeld)
Centrale limietstelling: Wanneer je x berekent, eender hoe u populatieverdeling eruit ziet, vanaf
N>30 (vanaf 30 waarnemingen per steekproef) zal uw x uit een normale verdeling getrokken zal zijn
Onderzoek = hypothesetoetsing
Nuhypothese: er is niets aan de hand, geen verschil, geen effect,…
Alternatieve hypothese: nulhypothese is niet waar
Door te toetsen gaan we proberen de nulhypothese te verwerpen of aanvaarden
Wanneer we de nulhypothese verwerpen gaan we de alternatieve hypothese aanvaarden
Aanvaardingsinterval = een subset van waarden die mogelijk gegenereerd kunnen worden indien de
nulhypothese juist is
Als het binnen het aanvaardingsinterval ligt, dan aanvaarden we de nulhypothese