100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4,6 TrustPilot
logo-home
Summary

Volledige Samenvatting Blok 2.2: Statistiek

Rating
4,0
(3)
Sold
21
Pages
52
Uploaded on
26-06-2022
Written in
2021/2022

Dit is een samenvatting van alle belangrijke hoofdstukken en alle colleges. Dit is alle relevante stof voor het tentamen.

Institution
Course













Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
June 26, 2022
Number of pages
52
Written in
2021/2022
Type
Summary

Subjects

Content preview

Basiskennis

Meetniveaus variabelen
 Categorische/kwalitatieve variabelen
o Nominaal
 Geen volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 Sekse
o Ordinaal
 Wel volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 SES (Hoog, Gemiddeld, Laag)
 Kwantitatieve variabelen
o Interval: deling geeft geen juiste uitkomst.
 Wel volgorde
 Wel meeteenheid
 Geen natuurlijk nulpunt (Nulpunt is arbitrair.)
 Temperatuur, IQ (Iemand met een IQ van 100 is niet twee keer zo slim als
iemand met een IQ van 50.), toets cijfer (Nulpunt is hier arbitrair).
o Ratio
 Wel volgorde
 Wel meeteenheid
 Wel natuurlijk nulpunt (Nulpunt is niet arbitrair.)

Frequentieverdeling
 Unimodaal: verdeling heeft 1 piek.
 Bimodaal: verdeling heeft 2 pieken.
 Gemiddelde: beïnvloedt door outliers.
 Mediaan: middelste getal, niet beïnvloedt door outliers.
 Modus: getal dat het meeste voorkomt, niet beïnvloedt door outliers.




Variantie

,Variantie is de mate waarin de waarden onderling verschillen.

2
Xi (score) x̄ (gem) Afwijking afwijking
4 6 4 – 6 = -2 4
5 6 5 – 6 = -1 1
6 6 6–6=0 0
6 6 6–6=0 0
7 6 7–6=1 1
8 6 8–6=2 4
SOM = 0 SOM = 10

2 somafwijking 2 10
Variantie( s )=  Variantie= =2
aantal scores−1 6−1
Standaard deviatie( s)= √ Variantie  Standard deviatie=√2 = 1.41

Stappenplan berekenen variantie
1. Bereken het gemiddelde van de scores.
2. Trek het gemiddelde van alle scores af, zo bereken je de afwijking.
3. Zet al deze afwijkingen in het kwadraat.
4. Tel al deze gekwadrateerde afwijkingen bij elkaar op.
5. Deel de som hiervan door het aantal score – 1.
6. Neem hier de wortel van.

Notaties
 Populatie
o Gemiddelde: μ
o Standaarddeviatie
 SD van de populatie
 σ
o Proportie: p
 Steekproef:
o Gemiddelde: x̄
o Standaard deviatie: SD
o Proportie: p̂

Betrouwbaarheidsinterval
Stel je hebt een betrouwbaarheidsinterval van 95%. Wanneer je 100 steekproeven uit de
populatie trekt en hier de betrouwbaarheidsintervallen van berekend, zullen 95 van deze
betrouwbaarheidsintervallen de échte populatiewaarde bevatten en 5 niet. 95% van de
betrouwbaarheidsintervallen zullen de populatiewaarde dus bevatten.
(Betrouwbaarheidsintervallen zijn altijd tweezijdig.)
 Als je oneindig keer uit deze populatie een steekproef van … personen zou trekken, zou in
95% van de gevallen “de ware populatiewaarde” in dit betrouwbaarheidsinterval (lopend
van … tot …) liggen en in 5% van de gevallen niet.
Let op: het is dus niet zo dat je met 95% zekerheid weet dat de echte populatiewaarde in
een bepaald interval ligt.

, Betrouwbaarheidsinterval populatiegemiddelde:
o μ= x̄ ± m
z∗σ
o m=
√n
 N berekenen met de margin of error: je kan zo bepalen hoeveel mensen je in de
steekproef nodig hebt om een bepaalde mate van nauwkeurigheid te krijgen.

( )
2

o n=
m

,Proporties
Toetsen met proporties doen we altijd met een z-toets, nooit met een t-toets.

Toetsen één proportie
aantal succesgevallen x
De sample proportie (p̂ ) = 
totaal aantal deelnemers n
Als de sample size (n) groot genoeg is en gekozen met SRS, zal de steekproevenverdeling van
p̂ ongeveer normaal verdeeld zijn.
 Het gemiddelde is dan μ ^p= p
 De standaarddeviatie is dan σ =
√ p( 1− p)
n
.

 SE van de steekproefverdeling is dan SE ^p=

^p (1− ^p )
n
Omdat p een onbekende waarde is wordt deze vervangen door p̂ en zo ontstaat een
standaard error.
 Berekenen betrouwbaarheidsinterval
x
o p̂ =
n
^
o p ( schatting proportie)± m


o m=z∗ ^p ( 1− ^p )
n
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen beide minimaal 10 zijn.
Voorbeeld: je berekent de proportie van het aantal mensen dat de bloktoets heeft
gehaald. Het aantal mensen dat de bloktoets wel heeft gehaald en het aantal mensen
dat de bloktoets niet heeft gehaald moeten beide minimaal 10 zijn.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je mag dan twee successen en twee niet-successen toevoegen.
aantal successen∈de sample +2
o ^p=
n+ 4


o SE ^p= p (1− p)
n+4
o ^p ± z∗
√^p (1− ^p )
n+4
 N berekenen met de margin of error
o n=¿ ¿
o P*: een gegokte waarde voor de steekproefproportie omdat p̂ nog onbekend
is omdat we nog geen data hebben verzameld. P* kan bepaald worden op
twee manieren:
 Gebruik p̂ uit een pilotstudie.
 Gebruik p* = 0.5. Dit is het worst-case scenario, de margin of error is
dan het grootst. Je weet dan zeker dat je goed zit.
Nadeel: het gebruik van 0.5 kan leiden tot de uitkomst van een veel
grotere n dan dat in werkelijkheid nodig is.
 Significantie toets

, o Hypothesen opstellen
 H 0= p 0
 H a < p0 of H a > p0 of H a ≠ p 0
p0 is hier een bepaalde bekende proportie die we willen testen.
o Z-toets
^p− p 0
z=


 p0 (1−p 0)
n
Let op: gebruik deze test alleen als de verwachte aantallen van de successen
en niet-successen beide minimaal gelijk zijn aan 10.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode
toepassen.
o Conclusie
 Bij een tweezijdige toets moet je de p-waarde * 2 doen.
 P < alpha  Verwerp H 0.
 P > alpha  Verwerp H 0 niet.
We maken niet vaak gebruik van significantietesten voor één proportie omdat het niet veel
voorkomend is om een situatie te hebben waar er een precieze p0 die we willen weten.

Toetsen twee proporties
Hierbij worden twee proporties vergeleken. Dit kan door twee populaties te vergelijken of
door twee behandelingen in één populatie te vergelijken.
Om beide populaties te vergelijken kijk je naar het verschil tussen de sample proporties:
D= p̂ 1− p̂ 2.

 SED = 1
√ ^p (1−^p1) ^p2 (1−^p 2)
n1
+
n2
Wanneer beide steekproeven groot zijn zal de steekproevenverdeling van het verschil (D)
ongeveer normaal verdeeld zijn.
 Berekenen betrouwbaarheidsinterval
o D±m

o m=z∗¿

o Conclusie
√ ^p1 ( 1− ^p1 ) ^p 2 ( 1− ^p 2)
n1
+
n2

 Is de betrouwbaarheidsinterval volledig positief, dan is methode A
beter dan methode B.
 Is de betrouwbaarheidsinterval volledig negatief, dan is methode B
beter dan A.
 Is de betrouwbaarheidsinterval gedeeltelijk positief en gedeeltelijk
negatief, dan ligt 0 in het interval, wat bekent dat beide methode even
goed zouden kunnen zijn.
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen in beide samples minimaal 10 is.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je voegt dan één succes en één niet-succes toe aan elke sample.

, X 1+1 X +1
o p̂ 1= en p̂ 2= 2
n 1+2 n2 + 2

o SED =

o D±m
√ ^p1 ( 1− ^p1 )
n1 +2
+
^p 2 ( 1−^p 2 )
n2 +2





o m=z∗¿
√ ^p1 ( 1− ^p1 ) p^ 2 ( 1− ^p 2)
n1 +2
N berekenen met de margin of error
+
n2 +2

o n=¿ ¿
o P*: de gegokte proportie.
 Significantie toets
o Hypothesen opstellen
 H 0 : p 1 = p2
 H a : p 1< p 2 of p1 > p2 of p1 ≠ p2
( ^p1− ^p2 )
z=


o 1 1
p^ ( 1− p^ ) ( + )
n1 n1
o ^p: pooled steekproefpoprotie
totale aantal succssen∈beide steekproeven gecombineerd
o ^p=
totaal aantal individuen∈beide steekproeven gecombineerd
Let op: gebruik deze toets alleen als de aantal successen en niet-successen in beide
samples minimaal 5 zijn.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode toepassen. Je
voegt dan bij elke sample 1 succes en 1 niet-succes toe.

Relatief risico
Je kunt proporties vergelijken door het betrouwbaarheidsinterval te berekenen, maar ook
door de ratio te nemen. Een proportie wordt dan gezien als een risico dat iets zal gebeuren.
Je kunt dus twee risico’s vergelijken met de ratio van de twee proporties (relatief risico). Een
relatief risico van 1 betekent dat de proporties gelijk zijn. Je berekent het relatief risico door
^p 1
RR =
^p 2
R165,99
Get access to the full document:
Purchased by 21 students

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Reviews from verified buyers

Showing all 3 reviews
5 days ago

2 year ago

2 year ago

4,0

3 reviews

5
1
4
1
3
1
2
0
1
0
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
lunaerasmus2020 Erasmus Universiteit Rotterdam
Follow You need to be logged in order to follow users or courses
Sold
243
Member since
5 year
Number of followers
115
Documents
11
Last sold
1 day ago

4,3

27 reviews

5
12
4
13
3
1
2
1
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can immediately select a different document that better matches what you need.

Pay how you prefer, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card or EFT and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions