TOE HERKANSING CORRELATIONEEL HOORCOLLEGE 1:
- Typen correlationele data
- Doelen van dataverzameling
- Methoden van dataverzameling
- Fouten bij surveys
VERSCHILLENDE SOORTEN DATA
- Customer satisfaction
- Political polls
- Governmental statistics
Data kan steeds meer worden verzameld door smartphone, digitale thermostaat etc.
Data kan op twee manieren worden verzameld
- TOEVALLIG -> ORGANIC . dit wordt geproduceerd door allerlei mensen zonder dat dat de
bedoeling is om per se voor dat onderzoek.
o ASPIRATIONAL : data wordt wel opzettelijk gemaakt maar niet opzettelijk voor het
onderzoek. Je wil wat delen met de buitenwereld zoals een tweet. Maar is niet per se
bedoeld voor het onderzoek.
o TRANSACTIONAL : wat gebeurd er met je bankkaart, bonuskaart? Of energie
maatschappij.
- OPZETTELIJK -> DESIGNED
o Experimenten
o Vragenlijst -> gaan we het overhebben in deze cursus
Nadeel: je kan met survey geen causaal verband aantonen
o Administratief : bijvoorbeeld belastingdienst
Waarom verzamelen we data?
- Het beschrijven van de sociale realiteit
- Relaties en causaliteit beschrijven
- Generaliseren
Inferentie = generaliseren naar grote groepen
Inferentie (generalisatie) goals: beschrijving, causaliteit en voorspellen
METHODES VAN DATA VERZAMELEN
- Face-to-face (capi)
- Mail
- Telephone (cati)
- Internet
- Mixed-mode
Verschillen tussen de methodes
- Mate van betrokkenheid interviewer
- Mate van interactie met de respondent
- Mate van privacy
- Hoe kan je communiceren
o visual / plaatje
o auditief / geluid
- technologie gebruik
, Verschillende types mixed-mode
• One mode for some respondents, another mode for others
– E.g. online survey with mail component for those without Internet
• One mode for recruitment, another for survey administration
– E.g. mail invitation for an online survey
• One mode for data collection, another for reminders, follow-up
– E.g. telephone reminders for an online survey
• One mode for main part of the interview, another for some subset of answers (e.g. sensitive items)
– E.g. Telephone & Audio Computer Self-Administered (ACASI)
cross-sectional and panel surveys
vragenlijsten die de respondenten invullen op verschillende momenten in tijd
voordelen:
- je kan de verandering en causaliteit
- we van disentagle age, period and cohort effects
error:
- ATTRITION : mensen vallen uit
- PANEL CONDITIONING: na 10 keer de zelfde vragenlijst in te vullen geef je vaak hetzelfde
antwoord
VOORBEELD ZOMER/WINTERTIJD: …
Als je deze fouten negeert dan krijg je een vertekening in de data
DEKKINGSFOUT : wanneer niet iedereen uit de populatie waarnaar de onderzoeker wil generaliseren
kans maakt om in steekproef terecht te komen omdat ze niet op de lijst staan waar steekproef wordt
getrokken. Het is een probleem wanneer iemand uit de steekproef anders is dan je doelpopulatie.
STEEKPROEFFOUT : als het geen a selecte steekproef is
NON-RESPONSEFOUT : Mensen die niet reageren op de survey. Als er verschil is tussen deze niet
reagerende met de wel reagerende = error
ADJUSTMENT ERROR: als een verhouding niet goed is moet je dat aanpassen. Als 80% van alle data
uit Duitsland komt kan het zijn dat het niet representatief is voor heel de EU.
Of wanneer er sprake is van een non response fout en de ontbrekende scores op schatting worden
ingevuld.
Meet- en verwerkings processen : te maken met het operationaliseren van een abstract concept tot
een meetbare variabele.
- Typen correlationele data
- Doelen van dataverzameling
- Methoden van dataverzameling
- Fouten bij surveys
VERSCHILLENDE SOORTEN DATA
- Customer satisfaction
- Political polls
- Governmental statistics
Data kan steeds meer worden verzameld door smartphone, digitale thermostaat etc.
Data kan op twee manieren worden verzameld
- TOEVALLIG -> ORGANIC . dit wordt geproduceerd door allerlei mensen zonder dat dat de
bedoeling is om per se voor dat onderzoek.
o ASPIRATIONAL : data wordt wel opzettelijk gemaakt maar niet opzettelijk voor het
onderzoek. Je wil wat delen met de buitenwereld zoals een tweet. Maar is niet per se
bedoeld voor het onderzoek.
o TRANSACTIONAL : wat gebeurd er met je bankkaart, bonuskaart? Of energie
maatschappij.
- OPZETTELIJK -> DESIGNED
o Experimenten
o Vragenlijst -> gaan we het overhebben in deze cursus
Nadeel: je kan met survey geen causaal verband aantonen
o Administratief : bijvoorbeeld belastingdienst
Waarom verzamelen we data?
- Het beschrijven van de sociale realiteit
- Relaties en causaliteit beschrijven
- Generaliseren
Inferentie = generaliseren naar grote groepen
Inferentie (generalisatie) goals: beschrijving, causaliteit en voorspellen
METHODES VAN DATA VERZAMELEN
- Face-to-face (capi)
- Telephone (cati)
- Internet
- Mixed-mode
Verschillen tussen de methodes
- Mate van betrokkenheid interviewer
- Mate van interactie met de respondent
- Mate van privacy
- Hoe kan je communiceren
o visual / plaatje
o auditief / geluid
- technologie gebruik
, Verschillende types mixed-mode
• One mode for some respondents, another mode for others
– E.g. online survey with mail component for those without Internet
• One mode for recruitment, another for survey administration
– E.g. mail invitation for an online survey
• One mode for data collection, another for reminders, follow-up
– E.g. telephone reminders for an online survey
• One mode for main part of the interview, another for some subset of answers (e.g. sensitive items)
– E.g. Telephone & Audio Computer Self-Administered (ACASI)
cross-sectional and panel surveys
vragenlijsten die de respondenten invullen op verschillende momenten in tijd
voordelen:
- je kan de verandering en causaliteit
- we van disentagle age, period and cohort effects
error:
- ATTRITION : mensen vallen uit
- PANEL CONDITIONING: na 10 keer de zelfde vragenlijst in te vullen geef je vaak hetzelfde
antwoord
VOORBEELD ZOMER/WINTERTIJD: …
Als je deze fouten negeert dan krijg je een vertekening in de data
DEKKINGSFOUT : wanneer niet iedereen uit de populatie waarnaar de onderzoeker wil generaliseren
kans maakt om in steekproef terecht te komen omdat ze niet op de lijst staan waar steekproef wordt
getrokken. Het is een probleem wanneer iemand uit de steekproef anders is dan je doelpopulatie.
STEEKPROEFFOUT : als het geen a selecte steekproef is
NON-RESPONSEFOUT : Mensen die niet reageren op de survey. Als er verschil is tussen deze niet
reagerende met de wel reagerende = error
ADJUSTMENT ERROR: als een verhouding niet goed is moet je dat aanpassen. Als 80% van alle data
uit Duitsland komt kan het zijn dat het niet representatief is voor heel de EU.
Of wanneer er sprake is van een non response fout en de ontbrekende scores op schatting worden
ingevuld.
Meet- en verwerkings processen : te maken met het operationaliseren van een abstract concept tot
een meetbare variabele.