Correlationeel onderzoek
Verschillende manieren data gegenereerd:
Toevallig (organisch)
- Aspirational: kiest ervoor wat mensen genereren, vrijwillig
- Transactional: transacties (pinnen of punten sparen),
beloningen
Doelgericht (ontworpen/designed)
- Experiment
- Survey: speciaal ontworpen data voor sociaalwetenschappelijk
onderzoek.
- Administrative: specifiek doel voor ogen, vaak door instanties
We ontwerpen een onderzoek en verzamelen gegevens om:
De sociale werkelijkheid te beschrijven
(causale) relaties bestuderen
Te generaliseren naar de doelpopulatie (voorspellen)
Surveys
Soorten surveys:
Face-to-face (CAPI)
Post
Telefonisch (CATI)
Via het internet
Mixed-modes
Verschillen tussen typen surveys:
Mate van betrokkenheid van de interviewer
Mate van interactie met de respondent
Mate van privacy
Communicatiemogelijkheden
- Visueel
- Auditief
Gebruik technologie
Soorten surveys in NL:
Bevolkingsregister en meer dan 90% internetgebruik
- Telefonische enquêtes (random digit dialing), niet veel
gebruikt.
Combinaties veel gebruikt
- Uitnodiging via post voor internet enquête
- Telefooncomponent als nummers bekend zijn
Marktonderzoekers gebruiken zowel selecte als aselecte online
panels.
Surveys ontworpen speciaal voor verschillende digitale media:
- Computer en smartphone.
,Mixed-modes surveys:
Een type voor sommige respondenten, een ander type voor anderen.
Een type voor werving, een andere voor administratie van de
enquête.
Een type voor gegevensverzameling, een andere voor
herinneringen, follow-up.
Een type voor hoofdgedeelte een andere voor vragen over een
gevoelig onderwerp.
Een type voor een ronde van het panelonderzoek, een andere voor
andere.
Cross-sectionele en panelonderzoeken:
Panelonderzoeken volgen respondenten over een langere periode.
- Inhoud van de vragenlijsten is meenstal hetzelfde, maar kan
verschillen.
Voordelen:
- We kunnen binnen-persoons verandering en causaliteit meten.
- We kunnen leeftijd, periode en cohort effecten (verschil in
tijden) verklaren.
Potentiële fouten:
- Verloop (attrition) = uitval
non respons in opeenvolgende rondes
- Panel conditionering
leereffecten
Operationaliseren
Theoretische begrip Conceptuele definitie operationele definitie
variabele
Een variabele creëren:
Doel: 1 score maken die de ernst van bijv. PTSS aangeeft.
Optie 1 (somscore):
- Tel alle itemscores bij elkaar op
- 12 items, itemscores tussen de 1 en de 4
schaalscores tussen de 12 en de 48.
- Nadeel: kan niet gebruikt worden als antwoorden niet ingevuld
zijn.
Optie 2 (gemiddelde som):
- Bereken het gemiddelde van alle itemscores.
- Dit kan ook berekend worden met een paar missende
waarden.
Schoolscores tussen 1 en 4.
Let op:
Een lage score zou “milde of geen PTSS” moeten betekenen.
Een hoge score zou “ernstige PTSS” moeten betekenen.
In veel vragenlijsten vinden we omgekeerd geformuleerde items.
- Dus het omgekeerde vragen van wat we willen meten.
Dit laat dus eigenlijk “veel PTSS” zien terwijl dit niet zo is.
, o Hercoderen (ompolen)
Data set:
Kolom per vraag (Q1 OF Q1_R)
Rij per respondent
Schaalscores berekenen
Met de omgepoolde items kan nu een schaalscore worden berekend.
- Met somscore of gemiddelde score.
Validiteit en betrouwbaarheid
Betrouwbare meting: de meting varieert niet door kenmerken van de
manier waarop je hebt gemeten of het meetinstrument.
Consistentie van de meting
Valide meting: hoe goed je meting overeenkomt met het theoretische
begrip waarin je geïnteresseerd bent.
Nauwkeurigheid van de meting
Begripsvaliditeit:
Indruk validiteit: lijkt de meting in orde?
Inhoudsvaliditeit: meet het alle aspecten van het construct?
Convergent: correleert het met een andere meting van hetzelfde
construct?
Divergent: correleert het niet met iets dat iets anders meet?
Criterium: correleert het met een andere meting waarvan we weten
dat de relatie er is?
Correlatie: maat voor het meten van de sterkte en richting van een
lineaire relatie tussen twee interval-/ratiovariabelen.
r waarde tussen -1 en +1
Betrouwbaarheid:
Test-hertest: 2x bij dezelfde mensen een test afnemen.
Interbeoordelaar: consistente scores wanneer verschillende
onderzoekers het gebruiken.
Interne: geven respondenten soortgelijke antwoorden op vragen.
Cronbach’s Alpha
Item rest correlatie: correlatie tussen ene item en schaal gemaakt van
alle andere items.
Cronbach’s a if item dropped: de alpha zonder dat item.
Betrouwbaarheidsanalyse schaal verbeteren:
, Controleer de correlaties tussen de individuele items en de schaal
zonder dat item.
- “Item-rest-correlatie”
- Vuistregel” rit < +- 0.2 item kan mogelijk worden
verwijderd.
Controleer bovendien wat er gebeurt met cronbach’s alpha als de
schaal zou worden gemaakt zonder dat specifieke item.
- “Cronbach’s alpha if item dropped”
- Vuistregel: a neemt het meeste toe item kan als eerste
worden verwijderd.
Waarschuwing: kijk ook altijd naar de inhoud en het subjectieve belang
van de items.
Variabele creëren:
1. Ompolen van items.
2. Betrouwbaarheidsanalyse.
3. Schaalscore berekenen.
Gebruiken voor grafieken, correlatie etc.
NHST:
1. Formuleer H0 en HA
2. Verzamel data en bereken toetsingsgrootheid
3. Bereken de p-waarde
4. Beslissing nemen: H0 verwerpen of niet (<0.05)
Enkelvoudige regressie
Correlatie wordt gebruikt om:
- De sterkte van de lineaire relatie te meten.
- De richting van het lineair verband te meten.
Regressie wordt gebruikt om:
- De lineaire relatie te beschrijven met een vergelijking.
- Voorspellingen te doen met behulp van deze vergelijking.
Variabelen:
De variabele die wordt voorspeld.
- Wordt aangegeven met Y
- Wordt de afhankelijke variabele genoemd.
De variabele die wordt gebruikt om voorspellingen te doen.
- Wordt aangegeven met X
- Wordt de onafhankelijke variabele genoemd.
Residuen: verschil tussen wat voorspelt wordt en wat in werkelijkheid
waar is.
Kan je per punt in het spreidingsdiagram berekenen.
Als er weinig spreiding is rond de regressielijn, dan
- Zijn de meeste residuen klein.
- Zullen de voorspellingen met de regressievergelijking zeer
nauwkeurig zijn.
Verschillende manieren data gegenereerd:
Toevallig (organisch)
- Aspirational: kiest ervoor wat mensen genereren, vrijwillig
- Transactional: transacties (pinnen of punten sparen),
beloningen
Doelgericht (ontworpen/designed)
- Experiment
- Survey: speciaal ontworpen data voor sociaalwetenschappelijk
onderzoek.
- Administrative: specifiek doel voor ogen, vaak door instanties
We ontwerpen een onderzoek en verzamelen gegevens om:
De sociale werkelijkheid te beschrijven
(causale) relaties bestuderen
Te generaliseren naar de doelpopulatie (voorspellen)
Surveys
Soorten surveys:
Face-to-face (CAPI)
Post
Telefonisch (CATI)
Via het internet
Mixed-modes
Verschillen tussen typen surveys:
Mate van betrokkenheid van de interviewer
Mate van interactie met de respondent
Mate van privacy
Communicatiemogelijkheden
- Visueel
- Auditief
Gebruik technologie
Soorten surveys in NL:
Bevolkingsregister en meer dan 90% internetgebruik
- Telefonische enquêtes (random digit dialing), niet veel
gebruikt.
Combinaties veel gebruikt
- Uitnodiging via post voor internet enquête
- Telefooncomponent als nummers bekend zijn
Marktonderzoekers gebruiken zowel selecte als aselecte online
panels.
Surveys ontworpen speciaal voor verschillende digitale media:
- Computer en smartphone.
,Mixed-modes surveys:
Een type voor sommige respondenten, een ander type voor anderen.
Een type voor werving, een andere voor administratie van de
enquête.
Een type voor gegevensverzameling, een andere voor
herinneringen, follow-up.
Een type voor hoofdgedeelte een andere voor vragen over een
gevoelig onderwerp.
Een type voor een ronde van het panelonderzoek, een andere voor
andere.
Cross-sectionele en panelonderzoeken:
Panelonderzoeken volgen respondenten over een langere periode.
- Inhoud van de vragenlijsten is meenstal hetzelfde, maar kan
verschillen.
Voordelen:
- We kunnen binnen-persoons verandering en causaliteit meten.
- We kunnen leeftijd, periode en cohort effecten (verschil in
tijden) verklaren.
Potentiële fouten:
- Verloop (attrition) = uitval
non respons in opeenvolgende rondes
- Panel conditionering
leereffecten
Operationaliseren
Theoretische begrip Conceptuele definitie operationele definitie
variabele
Een variabele creëren:
Doel: 1 score maken die de ernst van bijv. PTSS aangeeft.
Optie 1 (somscore):
- Tel alle itemscores bij elkaar op
- 12 items, itemscores tussen de 1 en de 4
schaalscores tussen de 12 en de 48.
- Nadeel: kan niet gebruikt worden als antwoorden niet ingevuld
zijn.
Optie 2 (gemiddelde som):
- Bereken het gemiddelde van alle itemscores.
- Dit kan ook berekend worden met een paar missende
waarden.
Schoolscores tussen 1 en 4.
Let op:
Een lage score zou “milde of geen PTSS” moeten betekenen.
Een hoge score zou “ernstige PTSS” moeten betekenen.
In veel vragenlijsten vinden we omgekeerd geformuleerde items.
- Dus het omgekeerde vragen van wat we willen meten.
Dit laat dus eigenlijk “veel PTSS” zien terwijl dit niet zo is.
, o Hercoderen (ompolen)
Data set:
Kolom per vraag (Q1 OF Q1_R)
Rij per respondent
Schaalscores berekenen
Met de omgepoolde items kan nu een schaalscore worden berekend.
- Met somscore of gemiddelde score.
Validiteit en betrouwbaarheid
Betrouwbare meting: de meting varieert niet door kenmerken van de
manier waarop je hebt gemeten of het meetinstrument.
Consistentie van de meting
Valide meting: hoe goed je meting overeenkomt met het theoretische
begrip waarin je geïnteresseerd bent.
Nauwkeurigheid van de meting
Begripsvaliditeit:
Indruk validiteit: lijkt de meting in orde?
Inhoudsvaliditeit: meet het alle aspecten van het construct?
Convergent: correleert het met een andere meting van hetzelfde
construct?
Divergent: correleert het niet met iets dat iets anders meet?
Criterium: correleert het met een andere meting waarvan we weten
dat de relatie er is?
Correlatie: maat voor het meten van de sterkte en richting van een
lineaire relatie tussen twee interval-/ratiovariabelen.
r waarde tussen -1 en +1
Betrouwbaarheid:
Test-hertest: 2x bij dezelfde mensen een test afnemen.
Interbeoordelaar: consistente scores wanneer verschillende
onderzoekers het gebruiken.
Interne: geven respondenten soortgelijke antwoorden op vragen.
Cronbach’s Alpha
Item rest correlatie: correlatie tussen ene item en schaal gemaakt van
alle andere items.
Cronbach’s a if item dropped: de alpha zonder dat item.
Betrouwbaarheidsanalyse schaal verbeteren:
, Controleer de correlaties tussen de individuele items en de schaal
zonder dat item.
- “Item-rest-correlatie”
- Vuistregel” rit < +- 0.2 item kan mogelijk worden
verwijderd.
Controleer bovendien wat er gebeurt met cronbach’s alpha als de
schaal zou worden gemaakt zonder dat specifieke item.
- “Cronbach’s alpha if item dropped”
- Vuistregel: a neemt het meeste toe item kan als eerste
worden verwijderd.
Waarschuwing: kijk ook altijd naar de inhoud en het subjectieve belang
van de items.
Variabele creëren:
1. Ompolen van items.
2. Betrouwbaarheidsanalyse.
3. Schaalscore berekenen.
Gebruiken voor grafieken, correlatie etc.
NHST:
1. Formuleer H0 en HA
2. Verzamel data en bereken toetsingsgrootheid
3. Bereken de p-waarde
4. Beslissing nemen: H0 verwerpen of niet (<0.05)
Enkelvoudige regressie
Correlatie wordt gebruikt om:
- De sterkte van de lineaire relatie te meten.
- De richting van het lineair verband te meten.
Regressie wordt gebruikt om:
- De lineaire relatie te beschrijven met een vergelijking.
- Voorspellingen te doen met behulp van deze vergelijking.
Variabelen:
De variabele die wordt voorspeld.
- Wordt aangegeven met Y
- Wordt de afhankelijke variabele genoemd.
De variabele die wordt gebruikt om voorspellingen te doen.
- Wordt aangegeven met X
- Wordt de onafhankelijke variabele genoemd.
Residuen: verschil tussen wat voorspelt wordt en wat in werkelijkheid
waar is.
Kan je per punt in het spreidingsdiagram berekenen.
Als er weinig spreiding is rond de regressielijn, dan
- Zijn de meeste residuen klein.
- Zullen de voorspellingen met de regressievergelijking zeer
nauwkeurig zijn.