Samenvatting Experimentele onderzoeksmethoden
2024
, Hoorcollege 1
Experimentele onderzoeksmethoden: Analyseren van data van experimenten (hier zijn
speciale analysetechnieken voor). Het doel bij deze experimenten is dat we willen kijken of
er bijvoorbeeld een verschil is tussen een experimentele groep of een controlegroep.
- Experimentele groep: krijgt de conditie aangeboden waarin de onderzoeker
geïnteresseerd is
- Controlegroep: krijgt of geen enkele conditie aangeboden, of een standaard conditie
waarvan het effect bekend is.
Beschrijvende statistiek
Beschrijvende statistiek is het samenvatten van de data. Dit kan data zijn van de gehele
populatie of data van de steekproef.
- Data = numerieke gegevens van een populatie of een steekproef
- Populatie = alle leden van een gedefinieerde groep, oftewel de gehele doelgroep
waar we door middel van onderzoek conclusies over willen trekken (Nederlanders)
➔ We kunnen vaak niet deze gehele populatie bevragen, daardoor verzamelen we
een steekproef:
- Steekproef = een deelverzameling van alle leden van een gedefinieerde groep. De
resultaten van deze steekproef generaliseer je uiteindelijk naar de populatie (dit doen
we d.m.v. hypothesetoetsen) (een groep Nederlanders, omdat je niet alle
Nederlanders kan onderzoeken).
Populatie Steekproef
Parameters zijn maten voor eigenschappen Steekproefgrootheden zijn maten voor
van de scores in de populatie eigenschappen van de scores in de
- Bv de gemiddelde score van de steekproef
lengte van alle Nederlanders - Bv de gemiddelde score van de
lengte van een groep Nederlanders
Griekse letters geven parameters weer (µ = Latijnse letters geven de
gem populatie, σ = st.dev.) steekproefgrootheden weer ( = gem
steekproef, s = st.dev.)
Waarom is beschrijvende statistiek handig?
Stel je voor je hebt de volgende gegevens uit een steekproef:
1144323121344334431444434423134134442424331143413
Het is op basis van deze data (deze reeks getallen) vrij moeilijk om conclusies te trekken
(bijvoorbeeld over wat is het gemiddelde?). Het is lastig om deze reeks getallen te
interpreteren. Beschrijvende statistiek helpt ons om de data die gegeven is uit een
steekproef samen te vatten, en dus interpreteerbaar te maken. Er zijn twee manieren om dit
te doen:
1. Het maken van een verdeling van de scores
2. Steekproefgrootheden (bv een gemiddelde berekenen)
Hoe doen we dat? Zowel bij de verdeling van de scores als bij de steekproefgrootheden
voeren we de getallen eerst in SPSS. Daarna kun je kijken naar de verdeling van de scores
en de steekproefgrootheden.
,1) Verdeling van de scores
We gaan de data samen vatten door het groeperen van data met dezelfde score. Dit kan
onder andere d.m.v. een frequentieverdeling (plaatje links) of een histogram (plaatje
rechts).
X-as: de 4
verschillende scores
Y-as: frequentie:
hoe vaak komt de
score voor
- Je ziet in de tabel dat er 4 verschillende scores zijn en bij frequentie staat er hoe vaak
de scores voorkomen.
- Beiden geven dezelfde gegevens weer, maar een histogram is minder precies dan
een tabel → op basis van deze gegevens zien we op beide plaatjes dat de waarde 4
het meest voorkomt en dat 60% van alle respondenten een 3 of lager scoort. (kijk bij
cumulatieve percentage: percentages zijn opgeteld van score 1,2 en 3).
- Valid percent: deze kolom verschilt in percentages met de ‘Percent’ kolom als er
missende scores (missing values) zijn. Wanneer dit het geval is worden de missende
scores niet meegenomen in de kolom ‘valid percent’. In dit geval zijn er geen
missende waardes.
SPSS syntax om een frequentieverdeling en een histogram te generen
2) Steekproefgrootheden
We kunnen de data samenvatten door kenmerkende eigenschappen van de verdeling van de
data. We berekenen dan bepaalde eigenschappen van de data, om zo uiteindelijk een
conclusie te trekken over de steekproef en later te generaliseren naar de populatie.
We kunnen op twee manieren kijken naar wat deze kenmerkende eigenschappen zijn:
1. Meest kenmerkende score van de verdeling (midden)= centrale tendentie
2. Hoeveel wijken scores af van de meest kenmerkende score? = spreiding
1) Centrale tendentie
Drie maten voor de centrale tendentie (=centrummaten):
1. Gemiddelde = de som van alle scores gedeeld door het aantal scores
- Gemiddelde is het meest relevant voor experimenteel onderzoek omdat je vaak wil weten of
dat bv het gemiddelde van een experimentele groep (patiënten met depressie na afloop van
een behandeling) anders is dan de gemiddelde score van de patiënten in de controlegroep
(patiënten met depressie die geen behandeling hebben gekregen).
Je begint bij i=1. Dus bij X1. Je ziet dat boven de i een N staat. Dit
betekent dat je moet doortellen tot het totaal aantal scores (in dit
geval 3, want N=3). Dit tel je allemaal bij elkaar op en deel je door
het totaal aantal scores: N.
, 2. Mediaan = middelste score wanneer je de scores ordent van laag naar hoog.
bv, de volgende cijfers zijn gehaald: 7, 7, 8, 6, 9, 7, 8, 9. Dan eerst ordenen van de
cijfers: 6, 7, 7, 7, 8, 8, 9, 9. Dan 7 + 8 = 15. 15/2 is 7,5. Dus mediaan is 7,5.
3. Modus = meest voorkomende score.
Bv, de volgende cijfers zijn gehaald 7, 7, 8, 6, 9. Dan is de modus 7.
2) Spreiding
Drie maten voor de spreiding (=spreidingsmaten):
1. Range = het verschil tussen de laagste en de hoogste waarde in de data
2. Variantie = de som van alle gekwadrateerde deviatiescores (verschil tussen score op
variabele en het gemiddelde) gedeeld door het aantal scores min één.
SPSS geeft niet de variantie weer in de output, maar de
standaarddeviatie (zie hieronder)
- Voor elke observatie berekent men de deviatie (afwijking) van het gemiddelde:
dus verschil tussen score op variabele en het gemiddelde. Deviatie =
- Kwadrateer alle deviaties die je in stap 1 hebt berekend
- Neem de som van alle gekwadrateerde deviaties uit stap 2: hierdoor krijg je de
Sum of Squares (SS) within
- Bepaal het totaal aantal observaties, we noemen dat aantal n of N.
- Deel de Sum of Squares door het aantal observaties - 1 (-1 als het in een
steekproef is. Stel dat het een populatie was gebruikte je alleen N onder de
streep)
- Nu is de variantie in een steekproef berekend: s²
3. Standaarddeviatie = de wortel van de variantie
Hoe groter de variantie of standaarddeviatie, hoe meer spreiding er is.
Variantie = vertelt ons hoezeer personen verschillen qua testscores
Standaarddeviatie = geeft ons beter beeld hoe mensen verschillen in scores dan de
variantie omdat het wordt uitgedrukt in dezelfde eenheid als de oorspronkelijke waarde
Inferentiële statistiek
Beschrijvende statistiek volstaat wanneer we data hebben van de gehele populatie, maar
bijna altijd hebben we alleen data van een steekproef en niet van de hele populatie. Dit is om
3 redenen het geval:
1. Het is te duur om de hele populatie te onderzoeken
2. Het kost te veel tijd om de hele populatie te onderzoeken
3. Soms is het onmogelijk om de hele populatie te onderzoeken
Met behulp van Inferentiële statistiek kunnen we op basis van informatie uit de steekproef
een uitspraak proberen te doen (generaliseren) over de populatie.
Er zijn 3 procedures in de inferentiële statistiek:
2024
, Hoorcollege 1
Experimentele onderzoeksmethoden: Analyseren van data van experimenten (hier zijn
speciale analysetechnieken voor). Het doel bij deze experimenten is dat we willen kijken of
er bijvoorbeeld een verschil is tussen een experimentele groep of een controlegroep.
- Experimentele groep: krijgt de conditie aangeboden waarin de onderzoeker
geïnteresseerd is
- Controlegroep: krijgt of geen enkele conditie aangeboden, of een standaard conditie
waarvan het effect bekend is.
Beschrijvende statistiek
Beschrijvende statistiek is het samenvatten van de data. Dit kan data zijn van de gehele
populatie of data van de steekproef.
- Data = numerieke gegevens van een populatie of een steekproef
- Populatie = alle leden van een gedefinieerde groep, oftewel de gehele doelgroep
waar we door middel van onderzoek conclusies over willen trekken (Nederlanders)
➔ We kunnen vaak niet deze gehele populatie bevragen, daardoor verzamelen we
een steekproef:
- Steekproef = een deelverzameling van alle leden van een gedefinieerde groep. De
resultaten van deze steekproef generaliseer je uiteindelijk naar de populatie (dit doen
we d.m.v. hypothesetoetsen) (een groep Nederlanders, omdat je niet alle
Nederlanders kan onderzoeken).
Populatie Steekproef
Parameters zijn maten voor eigenschappen Steekproefgrootheden zijn maten voor
van de scores in de populatie eigenschappen van de scores in de
- Bv de gemiddelde score van de steekproef
lengte van alle Nederlanders - Bv de gemiddelde score van de
lengte van een groep Nederlanders
Griekse letters geven parameters weer (µ = Latijnse letters geven de
gem populatie, σ = st.dev.) steekproefgrootheden weer ( = gem
steekproef, s = st.dev.)
Waarom is beschrijvende statistiek handig?
Stel je voor je hebt de volgende gegevens uit een steekproef:
1144323121344334431444434423134134442424331143413
Het is op basis van deze data (deze reeks getallen) vrij moeilijk om conclusies te trekken
(bijvoorbeeld over wat is het gemiddelde?). Het is lastig om deze reeks getallen te
interpreteren. Beschrijvende statistiek helpt ons om de data die gegeven is uit een
steekproef samen te vatten, en dus interpreteerbaar te maken. Er zijn twee manieren om dit
te doen:
1. Het maken van een verdeling van de scores
2. Steekproefgrootheden (bv een gemiddelde berekenen)
Hoe doen we dat? Zowel bij de verdeling van de scores als bij de steekproefgrootheden
voeren we de getallen eerst in SPSS. Daarna kun je kijken naar de verdeling van de scores
en de steekproefgrootheden.
,1) Verdeling van de scores
We gaan de data samen vatten door het groeperen van data met dezelfde score. Dit kan
onder andere d.m.v. een frequentieverdeling (plaatje links) of een histogram (plaatje
rechts).
X-as: de 4
verschillende scores
Y-as: frequentie:
hoe vaak komt de
score voor
- Je ziet in de tabel dat er 4 verschillende scores zijn en bij frequentie staat er hoe vaak
de scores voorkomen.
- Beiden geven dezelfde gegevens weer, maar een histogram is minder precies dan
een tabel → op basis van deze gegevens zien we op beide plaatjes dat de waarde 4
het meest voorkomt en dat 60% van alle respondenten een 3 of lager scoort. (kijk bij
cumulatieve percentage: percentages zijn opgeteld van score 1,2 en 3).
- Valid percent: deze kolom verschilt in percentages met de ‘Percent’ kolom als er
missende scores (missing values) zijn. Wanneer dit het geval is worden de missende
scores niet meegenomen in de kolom ‘valid percent’. In dit geval zijn er geen
missende waardes.
SPSS syntax om een frequentieverdeling en een histogram te generen
2) Steekproefgrootheden
We kunnen de data samenvatten door kenmerkende eigenschappen van de verdeling van de
data. We berekenen dan bepaalde eigenschappen van de data, om zo uiteindelijk een
conclusie te trekken over de steekproef en later te generaliseren naar de populatie.
We kunnen op twee manieren kijken naar wat deze kenmerkende eigenschappen zijn:
1. Meest kenmerkende score van de verdeling (midden)= centrale tendentie
2. Hoeveel wijken scores af van de meest kenmerkende score? = spreiding
1) Centrale tendentie
Drie maten voor de centrale tendentie (=centrummaten):
1. Gemiddelde = de som van alle scores gedeeld door het aantal scores
- Gemiddelde is het meest relevant voor experimenteel onderzoek omdat je vaak wil weten of
dat bv het gemiddelde van een experimentele groep (patiënten met depressie na afloop van
een behandeling) anders is dan de gemiddelde score van de patiënten in de controlegroep
(patiënten met depressie die geen behandeling hebben gekregen).
Je begint bij i=1. Dus bij X1. Je ziet dat boven de i een N staat. Dit
betekent dat je moet doortellen tot het totaal aantal scores (in dit
geval 3, want N=3). Dit tel je allemaal bij elkaar op en deel je door
het totaal aantal scores: N.
, 2. Mediaan = middelste score wanneer je de scores ordent van laag naar hoog.
bv, de volgende cijfers zijn gehaald: 7, 7, 8, 6, 9, 7, 8, 9. Dan eerst ordenen van de
cijfers: 6, 7, 7, 7, 8, 8, 9, 9. Dan 7 + 8 = 15. 15/2 is 7,5. Dus mediaan is 7,5.
3. Modus = meest voorkomende score.
Bv, de volgende cijfers zijn gehaald 7, 7, 8, 6, 9. Dan is de modus 7.
2) Spreiding
Drie maten voor de spreiding (=spreidingsmaten):
1. Range = het verschil tussen de laagste en de hoogste waarde in de data
2. Variantie = de som van alle gekwadrateerde deviatiescores (verschil tussen score op
variabele en het gemiddelde) gedeeld door het aantal scores min één.
SPSS geeft niet de variantie weer in de output, maar de
standaarddeviatie (zie hieronder)
- Voor elke observatie berekent men de deviatie (afwijking) van het gemiddelde:
dus verschil tussen score op variabele en het gemiddelde. Deviatie =
- Kwadrateer alle deviaties die je in stap 1 hebt berekend
- Neem de som van alle gekwadrateerde deviaties uit stap 2: hierdoor krijg je de
Sum of Squares (SS) within
- Bepaal het totaal aantal observaties, we noemen dat aantal n of N.
- Deel de Sum of Squares door het aantal observaties - 1 (-1 als het in een
steekproef is. Stel dat het een populatie was gebruikte je alleen N onder de
streep)
- Nu is de variantie in een steekproef berekend: s²
3. Standaarddeviatie = de wortel van de variantie
Hoe groter de variantie of standaarddeviatie, hoe meer spreiding er is.
Variantie = vertelt ons hoezeer personen verschillen qua testscores
Standaarddeviatie = geeft ons beter beeld hoe mensen verschillen in scores dan de
variantie omdat het wordt uitgedrukt in dezelfde eenheid als de oorspronkelijke waarde
Inferentiële statistiek
Beschrijvende statistiek volstaat wanneer we data hebben van de gehele populatie, maar
bijna altijd hebben we alleen data van een steekproef en niet van de hele populatie. Dit is om
3 redenen het geval:
1. Het is te duur om de hele populatie te onderzoeken
2. Het kost te veel tijd om de hele populatie te onderzoeken
3. Soms is het onmogelijk om de hele populatie te onderzoeken
Met behulp van Inferentiële statistiek kunnen we op basis van informatie uit de steekproef
een uitspraak proberen te doen (generaliseren) over de populatie.
Er zijn 3 procedures in de inferentiële statistiek: