Hoorcollege toegepaste statistiek Correlationeel: Surveys 04-02-20
Verschillende soorten kwantitatieve data (die we gebruiken bij correlationeel onderzoek)
- Customer statisfaction: was dit nuttig? Duimpje omhoog duimpje omlaag
- Polls: denk aan verkiezingen
- CBS: voor overheid of instanties
Correlationeel data
Data wordt op twee verschillende manieren geproduceerd:
1. Opzettelijk (purposively/designed)
2. Toevallig (incidentally/organic)
Als je ze echt dingen gaat vragen dan is het opzettelijk
Experiment
Survey
Administratief: niet echt een vragenlijst, denk aan de belastingdienst
Aspirational: denk aan fb, Instagram of twitter
Transactional: transacties, dus meer mastercard, bonuskaart, energiemaatschappij
Correlationeel data (designed)
We bestuderen en verzamelen data om:
- De sociale realiteit te beschrijven (description)
- Causale relaties beschrijven (causation)
- Generaliseren (prediction)
Survey modes: verschillende manieren om surveys af te nemen
- Face-to-face (CAPI)
o Persoonlijk; computer assistent personal interview; vaak geen vragenlijst
afname meer zonder hulp van computer. Dus je vraagt de vragen en typt ze
dan op de computer. Nadeel is wel interviewer effect en social desirability
bias.
- Mail
- Telephone (CATI)
- Internet
- Mixed-mode
o Ene groep een methode, andere groep een andere methode
o Je stuurt een mail en dan staat erin dat ze naar een website moeten
,De verschillen tussen de soorten manieren zijn:
- Mate van betrokkenheid van de interviewer
- Mate van interactie met de respondent
- Mate van privacy
- Communicatie: visueel? Auditief?
- Gebruik van technologie
Cross-sectional and panel surveys
Panel surveys: interviewen respondenten over de tijd. De content is meestal hetzelfde, dus
elk jaar zelfde vragen.
Voordelen hiervan zijn:
- We kunnen verandering meten en beschrijven
- Een keer vragen is niet genoeg om de achtergrondfactoren mee te rekenen.
Potentiele nadelen:
- Attrition/uitval: na 6 keer vragenlijst heb je er geen zin meer in. Dus niet meer
reageren. Of een nieuw adres. Of een tijdje niet meedoen, en dan een tijdje wel
(golf).
- Panel conditionering
- Learning effect
➔ Dit kan je voorkomen door mixed-mode.
Een schema voor surveys:
Links: meetinstrument
- Construct: operationele en conceptuele definities
- Meting
- Reacties
- Edited response
Rechts: mensen
- Doel populatie
- Steekproefkader
- Steekproef
- Respondenten
- Postsurvey aanpassing
, Fouten in rechterkolom:
Dekkingsfout (coverage error)
We hebben een doelpopulatie: een groep waar we
geïnteresseerd in zijn. Als we een steekproef trekken hebben
we een steekproefkader.
Hoeveel van je doelpopulatie zitten ook echt in je lijst?
Dekkingsfout treedt op:
- Als niet alle leden van de bevolking een
bekende, niet-nul kans of wordt opgenomen in de
monster en
- Indien personen die zijn uitgesloten van het steekproefkader verschillen
van die inbegrepen die wel op de lijst staan
twee soorten dekkingsfouten:
- Overschatting/over-coverage: wel in lijst, niet in
doelpopulatie
- Onderschatting/under-coverage: niet in de lijst, maar
wel in doelpopulatie
Steekproeffout (sampling error)
Komt eigenlijk altijd voor. Een steekproef is namelijk nooit exact.
Dit treedt op als:
- Als je slechts enkele, in plaats van alle, leden van de overdekte
populatie onderzoekt/surveyt.
- Onzekerheid
- We hebben statistieken nodig om deze onzekerheid te
kwantificeren
Non-response fout:
Bepaalde vragen niet antwoorden.
Dit treedt op als:
- Mensen die geselecteerd zijn, geen antwoord geven
Het wordt pas een probleem als de mensen die niet antwoorden anders zijn dan de mensen
die wel antwoorden.
Twee soorten non-response:
- Unit non response: weigeren niet mee te doen. Hele vragenlijst niet invullen
- Item non-response: weigeren bepaalde vragen niet te beantwoorden. Persoonlijke
vragen bijvoorbeeld.
Redenen:
- Geen vertrouwen
- Technische moeilijkheden
- Geen motivatie of interesse
Verschillende soorten kwantitatieve data (die we gebruiken bij correlationeel onderzoek)
- Customer statisfaction: was dit nuttig? Duimpje omhoog duimpje omlaag
- Polls: denk aan verkiezingen
- CBS: voor overheid of instanties
Correlationeel data
Data wordt op twee verschillende manieren geproduceerd:
1. Opzettelijk (purposively/designed)
2. Toevallig (incidentally/organic)
Als je ze echt dingen gaat vragen dan is het opzettelijk
Experiment
Survey
Administratief: niet echt een vragenlijst, denk aan de belastingdienst
Aspirational: denk aan fb, Instagram of twitter
Transactional: transacties, dus meer mastercard, bonuskaart, energiemaatschappij
Correlationeel data (designed)
We bestuderen en verzamelen data om:
- De sociale realiteit te beschrijven (description)
- Causale relaties beschrijven (causation)
- Generaliseren (prediction)
Survey modes: verschillende manieren om surveys af te nemen
- Face-to-face (CAPI)
o Persoonlijk; computer assistent personal interview; vaak geen vragenlijst
afname meer zonder hulp van computer. Dus je vraagt de vragen en typt ze
dan op de computer. Nadeel is wel interviewer effect en social desirability
bias.
- Telephone (CATI)
- Internet
- Mixed-mode
o Ene groep een methode, andere groep een andere methode
o Je stuurt een mail en dan staat erin dat ze naar een website moeten
,De verschillen tussen de soorten manieren zijn:
- Mate van betrokkenheid van de interviewer
- Mate van interactie met de respondent
- Mate van privacy
- Communicatie: visueel? Auditief?
- Gebruik van technologie
Cross-sectional and panel surveys
Panel surveys: interviewen respondenten over de tijd. De content is meestal hetzelfde, dus
elk jaar zelfde vragen.
Voordelen hiervan zijn:
- We kunnen verandering meten en beschrijven
- Een keer vragen is niet genoeg om de achtergrondfactoren mee te rekenen.
Potentiele nadelen:
- Attrition/uitval: na 6 keer vragenlijst heb je er geen zin meer in. Dus niet meer
reageren. Of een nieuw adres. Of een tijdje niet meedoen, en dan een tijdje wel
(golf).
- Panel conditionering
- Learning effect
➔ Dit kan je voorkomen door mixed-mode.
Een schema voor surveys:
Links: meetinstrument
- Construct: operationele en conceptuele definities
- Meting
- Reacties
- Edited response
Rechts: mensen
- Doel populatie
- Steekproefkader
- Steekproef
- Respondenten
- Postsurvey aanpassing
, Fouten in rechterkolom:
Dekkingsfout (coverage error)
We hebben een doelpopulatie: een groep waar we
geïnteresseerd in zijn. Als we een steekproef trekken hebben
we een steekproefkader.
Hoeveel van je doelpopulatie zitten ook echt in je lijst?
Dekkingsfout treedt op:
- Als niet alle leden van de bevolking een
bekende, niet-nul kans of wordt opgenomen in de
monster en
- Indien personen die zijn uitgesloten van het steekproefkader verschillen
van die inbegrepen die wel op de lijst staan
twee soorten dekkingsfouten:
- Overschatting/over-coverage: wel in lijst, niet in
doelpopulatie
- Onderschatting/under-coverage: niet in de lijst, maar
wel in doelpopulatie
Steekproeffout (sampling error)
Komt eigenlijk altijd voor. Een steekproef is namelijk nooit exact.
Dit treedt op als:
- Als je slechts enkele, in plaats van alle, leden van de overdekte
populatie onderzoekt/surveyt.
- Onzekerheid
- We hebben statistieken nodig om deze onzekerheid te
kwantificeren
Non-response fout:
Bepaalde vragen niet antwoorden.
Dit treedt op als:
- Mensen die geselecteerd zijn, geen antwoord geven
Het wordt pas een probleem als de mensen die niet antwoorden anders zijn dan de mensen
die wel antwoorden.
Twee soorten non-response:
- Unit non response: weigeren niet mee te doen. Hele vragenlijst niet invullen
- Item non-response: weigeren bepaalde vragen niet te beantwoorden. Persoonlijke
vragen bijvoorbeeld.
Redenen:
- Geen vertrouwen
- Technische moeilijkheden
- Geen motivatie of interesse