100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting Statistiek 2.2

Beoordeling
4,0
(1)
Verkocht
8
Pagina's
50
Geüpload op
19-11-2020
Geschreven in
2020/2021

en complete samenvatting van blok 2.2 statistiek. Inclusief: aantekeningen bij alle colleges, alle gevraagde hoofdstukken uit de boeken, SPSS en een overzicht van de verschillende toetsen.












Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
19 november 2020
Aantal pagina's
50
Geschreven in
2020/2021
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

College 1: Herhaling blok 1.3

Statistiek omdat: voor onderzoek of om onderzoek kritisch te kunnen interpreteren.
Bijvoorbeeld: is een onderzoek over de werking van een medicijn voor een bepaalde ziekte
wel relevant? Dat een onderzoek gepubliceerd is (ook in aangeschreven bladen/op sites)
betekent niet dat het onderzoek ook daadwerkelijk goed is.

Twee soorten van statistiek:
 Beschrijvende statistiek: samenvatten/organiseren/beschrijven van kwantitatieve
onderzoeksresultaten, bijvoorbeeld CBS: van alle studenten heeft 20% depressie
 Inferentiële statistiek: om aan te tonen of er verbanden/relaties zijn, toetsen,
trekken van conclusies over een populatie op basis van de onderzoeksresultaten
afkomstig uit een steekproef, bijvoorbeeld: werkt een bepaalde interventie voor
depressie bij studenten.

Inferentiële statistiek kan op beschrijvende volgen, bijvoorbeeld: 30% van de mensen die
corona heeft rookt. Vervolgens ga je toetsen: leidt roken tot ernstige coronaklachten?

Statistiek geeft een model voor hoe je denkt dat de werkelijkheid eruit ziet, dat model ga je
testen. Er is altijd een interventiegroep en controlegroep, jij denkt óf dat allebei die groepen
hetzelfde zijn óf dat allebei de groepen hetzelfde zijn behalve één ding, bijvoorbeeld het
gemiddelde. Het éne ding dat verschilt, bepaalt welke test je uitvoert.

In analyses werk je met variabelen. Vier soorten variabelen met verschillende meetniveaus:
- Nominaal (kwalitatief): er zijn verschillende waarden, maar die waarden zeggen
alleen dat iets niet hetzelfde is dan een ander, bijvoorbeeld: appel, peer, banaan. Er
wordt onderscheid gemaakt tussen verschillende waarden, zonder rangorde.
- Ordinaal (kwalitatief): er zijn verschillende waarden, die waarden zeggen dat iets niet
hetzelfde is en dat iets “meer” of “minder” is, er zit een rangorde in. De volgorde loopt
niet gelijk op, de afstanden tussen de waarden zijn onbepaald, niet te interpreteren.
- Interval (kwantitatief): we kunnen kijken naar afstanden tussen de waarden, deze zijn
interpreteerbaar, bijv. IQ het verschil tussen 130-140 en 110-120 is even groot. máár
er is geen absoluut nulpunt, dus het is niet zo dat een IQ van 160 twee keer zo
hoog is als een IQ van 80.
- Ratio (kwantitatief): meetschalen met een natuurlijk voorkomend nulpunt (zoals
lengte, gewicht, inkomen), iemand van twee meter is twee keer zo lang als iemand
van een meter.

Het presenteren van variabelen
kan aan de hand van een
frequentieverdeling. We kijken in
eerste instantie of de verdeling
unimodaal is (één top heeft) en of
hij symmetrisch is. Een verdeling
kan ook right skewed of left
skewed zijn. Een verdeling wordt

1

,bekeken aan de hand van centrummaten: de modus, de mediaan en het gemiddelde. De
modus is de meest voorkomende score. De mediaan is de middelste score en het
gemiddelde is de som van alle scores gedeeld door het aantal. Wanneer een verdeling
skewed is, heeft dit invloed op deze maten, bijvoorbeeld het gemiddelde wordt als het ware
meegetrokken met de scheefheid.

Een verdeling kan je samenvatten aan de hand van een centrummaat en de maat van
spreiding; het gemiddelde en de standaarddeviatie. Als je een verdeling wilt beschrijven
maar je verdeling is scheef (left or right) kan je het gemiddelde vervangen door de mediaan.
Met spreiding bedoelt men of de waarden van een variabele dichtbij elkaar of ver van elkaar
af staan. De standaarddeviatie is dus de gemiddelde spreiding rond het gemiddelde. Des te
hoger de standaarddeviatie, des te platter de verdeling. De standaarddeviatie wordt
berekend aan de hand van de variantie, het is namelijk de wortel van de variantie.

Als je de spreidingsmaat wilt berekenen, wil je alle afstanden van het gemiddelde
(gekwadrateerd!) van iedere meting weten om hiervan het gemiddelde te nemen, gedeeld
door het aantal metingen minus
1. Nu ken je de variantie. De
standaarddeviatie is de wortel
hiervan.

Nu je weet wat het gemiddelde en de standaarddeviatie is, kan je gaan kijken naar scores
die afwijken ofwel extreem hoog of extreem laag is. Bij een normaal verdeelde scoren zit
68% van de scores binnen -s en +s, 95% van de scores zitten tussen -2s en +2s. Je gaat de
kans berekenen op iets nog extremers dan +2s of -2s. Je berekent de Z-score. Je kan deze
berekenen met het gemiddelde en de
standaarddeviatie. Je gebruikt de tabel
om met de Z-
score op te
zoeken wat de
kans is om een
bepaalde waarde te overschrijden. Je
zou ook de kans kunnen berekenen op
een waarde tussen twee bepaalde
waardes.

Inferentiële statistiek is onderdeel van de empirische cyclus. Je hebt een idee, een
hypothese. Deze ga je toetsbaar maken. Vervolgens ga je dit dan ook daadwerkelijke
toetsen. Hierop evalueer je en kan je gebruiken als observatie instrument. Op deze manier
kan je blijven onderzoeken.

Voorbeeld: je veronderstelt dat je door kauwgum kauwen beter gaat presteren. Je gaat een
hypothese opstellen. De nulhypothese (H0) houdt in dat er geen verschil is: zowel mensen
die kauwgum kauwen als niet behalen dezelfde resultaten. De alternatieve hypothese (HA)
houdt in dat er wel verschil is, ofwel: beide groepen zijn niet gelijk.


2

,Voor elke toetsing heeft men een steekproef nodig. Een steekproef is een gedeelte van de
populatie. Het is in principe niet mogelijk om met de hele populatie te toetsen. De steekproef
representeert de populatie, deze moet wel groot genoeg zijn. In de steekproef worden twee
gelijke groepen gecreëerd (romaniseren) zodat deze groepen vervolgens vergeleken
kunnen worden. De onafhankelijke variabele is hetgeen dat we gaan manipuleren, in dit
geval het kauwgum kauwen. De afhankelijke variabele is hetgeen waarin we
geïnteresseerd zijn, in dit geval prestatie, hetgeen dat afhankelijk is van de onafhankelijke
variabele.

Bij statistiek gaat men er altijd vanuit dat de H0 volledig juist is. Nu gaan we kijken of een
bepaalde score extreem is in het geval dat de H0 waar is. Het gemiddelde verschil tussen
kauwgum kauwers en niet kauwgum kauwers is 0, want je H0 is dat er geen verschil is
tussen die twee. Welke waarde zou je moeten zien om toch te gaan twijfelen aan je H0?
Vaak wordt er gesteld dat een score extreem is als we een waarde zien waarop de kans
volgens de H0 5% is of minder. Dat betekent in dit geval dus 2,5% kans op iets dat lager is
dan -2,1 (ofwel kauwgum kauwen is slecht) of 2,5% kans op iets dat hoger +2,1 (ofwel
kauwgum kauwen is goed).

Er bestaan drie manieren om de nulhypothese te verwerpen:
1. De kritische waarde opzoeken en deze vergelijken met de toets statistiek (t, z waarde
etc.). Wanneer de toets statistiek groter is dan deze kritieke waarde, verwerp je H0.
2. De p-waarde achterhalen en deze vergelijken met alpha. Wanneer de kans kleiner is
dan alpha, verwerp je de nulhypothese.
3. Het betrouwbaarheidsinterval opstellen, wanneer de waarde van de H0 (meestal 0)
niet tussen dit interval ligt, mag je H0 verwerpen.

Bij het verwerpen van de H0 weten we echter nooit 100% zeker of die H0 ook daadwerkelijk
onjuist is. Er kunnen twee typen fouten gemaakt worden. Stel je hebt een normale verdeling
die de H0 weergeef, waarbij je de kritieke waarde hebt bepaald. Iedere waarde die links van
de kritieke waarde zou liggen zou niet leiden tot het verwerpen van H0. Iedere waarde die
rechts zou liggen van de kritieke waarde zou wel leiden tot het verwerpen van H0. Echter is
er bij verwerpen sprake van waarschijnlijkheid. Het kan zijn dat je H0 verwerpt, terwijl deze
eigenlijk waar is. Je ziet dan iets heel onwaarschijnlijks/afwijkends, wat toch af en toe kan
voorkomen en dus onder H0 niet onmogelijk is. Dit is een Type 1 fout. Bij een Type II fout
wordt de H0 niet verworpen, terwijl
dit eigenlijk wel zou moeten
gebeuren. Het zou namelijk voor
kunnen komen dat je steekproef
insinueert dat H0 waar is (gezien
je links van de stippellijn uitkomt)
terwijl daar ook waardes liggen die
waar zijn volgen HA.

De power van een toets is de kans op het accepteren van de HA als die waar is; als er een
effect is, wat is de kans dat je het dan ook daadwerkelijk vind. Je kiest voor HA zolang je aan


3

, de rechterkant van de stippellijn zit. Je kan de power vergroten door je significantieniveau op
te hogen, je steekproef te vergroten of de standaarddeviatie te verkleinen.

Stappen van elke statistische toetsingsprocedure:
1. Formuleren van H0 en HA (eenzijdig of tweezijdig)
2. Kiezen van een beslisregel: wat vinden we verbazend. We kiezen hier een
significantieniveau: wanneer gaan we twijfelen aan onze H0. We kiezen ook een
analyseprocedure: welke toets moeten we gebruiken?
3. We trekken een steekproef.
4. We bepalen een referentieverdeling en berekenen een toetsingsgrootheid uit de data.
5. We bepalen de p-waarde: kans
6. Beslissing maken: verwerp H0 als p kleiner of gelijk aan je significantie niveau is




Voorbeeld toetsing: al jarenlang
halen kinderen zonder kauwgum
een gemiddelde score van 6.9 met
een standaard deviatie van 2.3 (dit
gaat dus om de populatie). Welke
waarde zou ik voor de
kauwgumkauwers moeten vinden
om te gaan twijfelen of
kauwgumkauwen inderdaad geen
zin heeft. (1) We stellen
hypotheses op waarbij H0 dus
inhoudt dat er geen verschil is
tussen kauwgumkauwers en niet-
kauwgumkauwers. Het
gemiddelde is dus gelijk. HA houdt
in dat dit niet gelijk zou zijn. De
beslisregel is dat als we iets


4

Beoordelingen van geverifieerde kopers

Alle reviews worden weergegeven
2 jaar geleden

4,0

1 beoordelingen

5
0
4
1
3
0
2
0
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
rozemarijnnoelle Erasmus Universiteit Rotterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
121
Lid sinds
7 jaar
Aantal volgers
70
Documenten
17
Laatst verkocht
1 maand geleden

4,6

5 beoordelingen

5
3
4
2
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen