100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4,6 TrustPilot
logo-home
Samenvatting

Volledige Samenvatting Blok 2.2: Statistiek

Beoordeling
4,0
(3)
Verkocht
21
Pagina's
52
Geüpload op
26-06-2022
Geschreven in
2021/2022

Dit is een samenvatting van alle belangrijke hoofdstukken en alle colleges. Dit is alle relevante stof voor het tentamen.














Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
26 juni 2022
Aantal pagina's
52
Geschreven in
2021/2022
Type
Samenvatting

Voorbeeld van de inhoud

Basiskennis

Meetniveaus variabelen
 Categorische/kwalitatieve variabelen
o Nominaal
 Geen volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 Sekse
o Ordinaal
 Wel volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 SES (Hoog, Gemiddeld, Laag)
 Kwantitatieve variabelen
o Interval: deling geeft geen juiste uitkomst.
 Wel volgorde
 Wel meeteenheid
 Geen natuurlijk nulpunt (Nulpunt is arbitrair.)
 Temperatuur, IQ (Iemand met een IQ van 100 is niet twee keer zo slim als
iemand met een IQ van 50.), toets cijfer (Nulpunt is hier arbitrair).
o Ratio
 Wel volgorde
 Wel meeteenheid
 Wel natuurlijk nulpunt (Nulpunt is niet arbitrair.)

Frequentieverdeling
 Unimodaal: verdeling heeft 1 piek.
 Bimodaal: verdeling heeft 2 pieken.
 Gemiddelde: beïnvloedt door outliers.
 Mediaan: middelste getal, niet beïnvloedt door outliers.
 Modus: getal dat het meeste voorkomt, niet beïnvloedt door outliers.




Variantie

,Variantie is de mate waarin de waarden onderling verschillen.

2
Xi (score) x̄ (gem) Afwijking afwijking
4 6 4 – 6 = -2 4
5 6 5 – 6 = -1 1
6 6 6–6=0 0
6 6 6–6=0 0
7 6 7–6=1 1
8 6 8–6=2 4
SOM = 0 SOM = 10

2 somafwijking 2 10
Variantie( s )=  Variantie= =2
aantal scores−1 6−1
Standaard deviatie( s)= √ Variantie  Standard deviatie=√2 = 1.41

Stappenplan berekenen variantie
1. Bereken het gemiddelde van de scores.
2. Trek het gemiddelde van alle scores af, zo bereken je de afwijking.
3. Zet al deze afwijkingen in het kwadraat.
4. Tel al deze gekwadrateerde afwijkingen bij elkaar op.
5. Deel de som hiervan door het aantal score – 1.
6. Neem hier de wortel van.

Notaties
 Populatie
o Gemiddelde: μ
o Standaarddeviatie
 SD van de populatie
 σ
o Proportie: p
 Steekproef:
o Gemiddelde: x̄
o Standaard deviatie: SD
o Proportie: p̂

Betrouwbaarheidsinterval
Stel je hebt een betrouwbaarheidsinterval van 95%. Wanneer je 100 steekproeven uit de
populatie trekt en hier de betrouwbaarheidsintervallen van berekend, zullen 95 van deze
betrouwbaarheidsintervallen de échte populatiewaarde bevatten en 5 niet. 95% van de
betrouwbaarheidsintervallen zullen de populatiewaarde dus bevatten.
(Betrouwbaarheidsintervallen zijn altijd tweezijdig.)
 Als je oneindig keer uit deze populatie een steekproef van … personen zou trekken, zou in
95% van de gevallen “de ware populatiewaarde” in dit betrouwbaarheidsinterval (lopend
van … tot …) liggen en in 5% van de gevallen niet.
Let op: het is dus niet zo dat je met 95% zekerheid weet dat de echte populatiewaarde in
een bepaald interval ligt.

, Betrouwbaarheidsinterval populatiegemiddelde:
o μ= x̄ ± m
z∗σ
o m=
√n
 N berekenen met de margin of error: je kan zo bepalen hoeveel mensen je in de
steekproef nodig hebt om een bepaalde mate van nauwkeurigheid te krijgen.

( )
2

o n=
m

,Proporties
Toetsen met proporties doen we altijd met een z-toets, nooit met een t-toets.

Toetsen één proportie
aantal succesgevallen x
De sample proportie (p̂ ) = 
totaal aantal deelnemers n
Als de sample size (n) groot genoeg is en gekozen met SRS, zal de steekproevenverdeling van
p̂ ongeveer normaal verdeeld zijn.
 Het gemiddelde is dan μ ^p= p
 De standaarddeviatie is dan σ =
√ p( 1− p)
n
.

 SE van de steekproefverdeling is dan SE ^p=

^p (1− ^p )
n
Omdat p een onbekende waarde is wordt deze vervangen door p̂ en zo ontstaat een
standaard error.
 Berekenen betrouwbaarheidsinterval
x
o p̂ =
n
^
o p ( schatting proportie)± m


o m=z∗ ^p ( 1− ^p )
n
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen beide minimaal 10 zijn.
Voorbeeld: je berekent de proportie van het aantal mensen dat de bloktoets heeft
gehaald. Het aantal mensen dat de bloktoets wel heeft gehaald en het aantal mensen
dat de bloktoets niet heeft gehaald moeten beide minimaal 10 zijn.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je mag dan twee successen en twee niet-successen toevoegen.
aantal successen∈de sample +2
o ^p=
n+ 4


o SE ^p= p (1− p)
n+4
o ^p ± z∗
√^p (1− ^p )
n+4
 N berekenen met de margin of error
o n=¿ ¿
o P*: een gegokte waarde voor de steekproefproportie omdat p̂ nog onbekend
is omdat we nog geen data hebben verzameld. P* kan bepaald worden op
twee manieren:
 Gebruik p̂ uit een pilotstudie.
 Gebruik p* = 0.5. Dit is het worst-case scenario, de margin of error is
dan het grootst. Je weet dan zeker dat je goed zit.
Nadeel: het gebruik van 0.5 kan leiden tot de uitkomst van een veel
grotere n dan dat in werkelijkheid nodig is.
 Significantie toets

, o Hypothesen opstellen
 H 0= p 0
 H a < p0 of H a > p0 of H a ≠ p 0
p0 is hier een bepaalde bekende proportie die we willen testen.
o Z-toets
^p− p 0
z=


 p0 (1−p 0)
n
Let op: gebruik deze test alleen als de verwachte aantallen van de successen
en niet-successen beide minimaal gelijk zijn aan 10.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode
toepassen.
o Conclusie
 Bij een tweezijdige toets moet je de p-waarde * 2 doen.
 P < alpha  Verwerp H 0.
 P > alpha  Verwerp H 0 niet.
We maken niet vaak gebruik van significantietesten voor één proportie omdat het niet veel
voorkomend is om een situatie te hebben waar er een precieze p0 die we willen weten.

Toetsen twee proporties
Hierbij worden twee proporties vergeleken. Dit kan door twee populaties te vergelijken of
door twee behandelingen in één populatie te vergelijken.
Om beide populaties te vergelijken kijk je naar het verschil tussen de sample proporties:
D= p̂ 1− p̂ 2.

 SED = 1
√ ^p (1−^p1) ^p2 (1−^p 2)
n1
+
n2
Wanneer beide steekproeven groot zijn zal de steekproevenverdeling van het verschil (D)
ongeveer normaal verdeeld zijn.
 Berekenen betrouwbaarheidsinterval
o D±m

o m=z∗¿

o Conclusie
√ ^p1 ( 1− ^p1 ) ^p 2 ( 1− ^p 2)
n1
+
n2

 Is de betrouwbaarheidsinterval volledig positief, dan is methode A
beter dan methode B.
 Is de betrouwbaarheidsinterval volledig negatief, dan is methode B
beter dan A.
 Is de betrouwbaarheidsinterval gedeeltelijk positief en gedeeltelijk
negatief, dan ligt 0 in het interval, wat bekent dat beide methode even
goed zouden kunnen zijn.
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen in beide samples minimaal 10 is.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je voegt dan één succes en één niet-succes toe aan elke sample.

, X 1+1 X +1
o p̂ 1= en p̂ 2= 2
n 1+2 n2 + 2

o SED =

o D±m
√ ^p1 ( 1− ^p1 )
n1 +2
+
^p 2 ( 1−^p 2 )
n2 +2





o m=z∗¿
√ ^p1 ( 1− ^p1 ) p^ 2 ( 1− ^p 2)
n1 +2
N berekenen met de margin of error
+
n2 +2

o n=¿ ¿
o P*: de gegokte proportie.
 Significantie toets
o Hypothesen opstellen
 H 0 : p 1 = p2
 H a : p 1< p 2 of p1 > p2 of p1 ≠ p2
( ^p1− ^p2 )
z=


o 1 1
p^ ( 1− p^ ) ( + )
n1 n1
o ^p: pooled steekproefpoprotie
totale aantal succssen∈beide steekproeven gecombineerd
o ^p=
totaal aantal individuen∈beide steekproeven gecombineerd
Let op: gebruik deze toets alleen als de aantal successen en niet-successen in beide
samples minimaal 5 zijn.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode toepassen. Je
voegt dan bij elke sample 1 succes en 1 niet-succes toe.

Relatief risico
Je kunt proporties vergelijken door het betrouwbaarheidsinterval te berekenen, maar ook
door de ratio te nemen. Een proportie wordt dan gezien als een risico dat iets zal gebeuren.
Je kunt dus twee risico’s vergelijken met de ratio van de twee proporties (relatief risico). Een
relatief risico van 1 betekent dat de proporties gelijk zijn. Je berekent het relatief risico door
^p 1
RR =
^p 2
€8,49
Krijg toegang tot het volledige document:
Gekocht door 21 studenten

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Beoordelingen van geverifieerde kopers

Alle 3 reviews worden weergegeven
5 dagen geleden

2 jaar geleden

2 jaar geleden

4,0

3 beoordelingen

5
1
4
1
3
1
2
0
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
lunaerasmus2020 Erasmus Universiteit Rotterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
243
Lid sinds
5 jaar
Aantal volgers
115
Documenten
11
Laatst verkocht
1 dag geleden

4,3

27 beoordelingen

5
12
4
13
3
1
2
1
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen