Cursusdoelstellingen
- Op basis- en geavanceerde elementen uit de kwantitatieve methodologie en statistische
analysetechnieken toepassen op bedrijfskundige onderzoeksvraagstukken, mede met behulp
van SPSS
- Basis- en geavanceerde elementen uit de kwantitatieve onderzoeksmethoden en
onderzoeksresultaten adequaat interpreteren
- Keuzes en interpretaties bij de toepassing van de behandelde elementen uit kwantitatieve
methoden en statistische analyseprocedures beargumenteren
- Het gaat daarbij over de volgende onderdelen: dataverzameling, representativiteit, missing
data analyse, factoranalyse, betrouwbaarheidsanalyse, multivariate variantieanalyse,
meervoudige regressieanalyse
Hoorcollege 1
De keuze voor primaire of secundaire data voor het beantwoorden van onderzoeksvragen
> primaire data is data dat specifiek voor het onderzoek zelf is gemaakt
> secundaire data is data dat verzameld is voor een ander doel
Het testen van representativiteit van getrokken steekproeven en in staat zijn om testresultaten te
interpreteren en maatregelen te bedenken
> Representativiteit: mate waarin de steekproef op relevante kenmerken een goede afspiegeling
vormt van de populatie
> Statistische conclusie: (a = .30) p > a, H 0 niet verwerpen (0.774 > 0.30)
> Inhoudelijke conclusie: steekproef is representatief voor populatie
> Je wil niet te snel besluiten tot representativiteit: vermijden van type II fout belangrijker dan van
type I fout, hierdoor is de a van 0.30 hoger dan de ‘normale’ a van 0.05, om een lagere b te krijgen en
om H0 minder snel aan te nemen
Oorzaken van non-respons en relatie met geldigheid verzamelde gegevens
negeerbaar
non-respons / steekproef
routings (bepaalde respondenten wil je niet aantrekken)
censored (gecontroleerd) data / ontwerp
niet negeerbaar
geen antwoorden
missing categorieën
, Data cleaning uitvoeren met SPSS: gegevens kunnen opschonen, uitkomsten interpreteren en
maatregelen bedenken
>codes, routings, response set
> Indien percentage missing data < 10%, dan is probleem verwaarloosbaar, en hoef je dus niets te
verwijderen, Mits missing data ‘Missing Completely at Random’ zijn
- listwise deletion = uit de lijst respondenten verwijderen die op 1 variabelen missen
> hierbij raak je veel mensen kwijt, met waarschijnlijk weinig missende scores
- pairwise deletion = uit paren met correlatie 1 weghalen, mensen die op een van de twee een
onbrekende score hebben worden niet meegenomen > bij factoranalyse
- mean substitution = gemiddelde van de respondenten berekenen
>hiermee hou je de meeste mensen binnen boord, dit is eigenlijk wat je wil > je geeft mensen
wel een waardige score (MCAR)
> geldt alleen voor waarde variabelen, en niet voor categorievariabelen (je kan niet random
iemand een man of vrouw maken, of op het platteland of in de stad
- voor het geheel
- voor subgroepen
- regression techniques = wanneer je te maken hebt met schalen, de overige variabelen gebruiken
om een score te voorspellen (regressie analyse)
> de keuze wordt bepaald doordat je zoveel mogelijk mensen in je steekproef wil houden
Missing data analyseren met SPSS: resultaten interpreteren, vaststellen welke maatregelen mogelijk
en zinvol zijn
Missing Completely At Random MCAR
De ontbrekende score patronen komen volledig door toeval tot stand
Missing At Random MAR
De kans dat de waarde van een variabele ontbreekt, is deels afhankelijk van andere
geobserveerde data, maar is niet afhankelijk van een van de andere waarden die
ontbrekend zijn > de kans is groter dat het binnen een bepaalde categorie is
Criterium:
Grote steekproeven (N > 400; vgl. Korzilius, 2008): percentage-verschillen van >
percentageverschil van 5% zijn significant (tussen totaal en categorie zelf)
Kleine steekproeven: percentage-verschillen van > 10% zijn significant
Criterium t > |2| (meer precies > |1.96|) wijst op mogelijke MAR
Overall toets voor MCAR: Little’s MCAR test
H0 missing patronen wijken niet af van verwachte patronen voor MCAR
H1 missing patronen wijken af van verwachte patronen voor MCAR
- Op basis- en geavanceerde elementen uit de kwantitatieve methodologie en statistische
analysetechnieken toepassen op bedrijfskundige onderzoeksvraagstukken, mede met behulp
van SPSS
- Basis- en geavanceerde elementen uit de kwantitatieve onderzoeksmethoden en
onderzoeksresultaten adequaat interpreteren
- Keuzes en interpretaties bij de toepassing van de behandelde elementen uit kwantitatieve
methoden en statistische analyseprocedures beargumenteren
- Het gaat daarbij over de volgende onderdelen: dataverzameling, representativiteit, missing
data analyse, factoranalyse, betrouwbaarheidsanalyse, multivariate variantieanalyse,
meervoudige regressieanalyse
Hoorcollege 1
De keuze voor primaire of secundaire data voor het beantwoorden van onderzoeksvragen
> primaire data is data dat specifiek voor het onderzoek zelf is gemaakt
> secundaire data is data dat verzameld is voor een ander doel
Het testen van representativiteit van getrokken steekproeven en in staat zijn om testresultaten te
interpreteren en maatregelen te bedenken
> Representativiteit: mate waarin de steekproef op relevante kenmerken een goede afspiegeling
vormt van de populatie
> Statistische conclusie: (a = .30) p > a, H 0 niet verwerpen (0.774 > 0.30)
> Inhoudelijke conclusie: steekproef is representatief voor populatie
> Je wil niet te snel besluiten tot representativiteit: vermijden van type II fout belangrijker dan van
type I fout, hierdoor is de a van 0.30 hoger dan de ‘normale’ a van 0.05, om een lagere b te krijgen en
om H0 minder snel aan te nemen
Oorzaken van non-respons en relatie met geldigheid verzamelde gegevens
negeerbaar
non-respons / steekproef
routings (bepaalde respondenten wil je niet aantrekken)
censored (gecontroleerd) data / ontwerp
niet negeerbaar
geen antwoorden
missing categorieën
, Data cleaning uitvoeren met SPSS: gegevens kunnen opschonen, uitkomsten interpreteren en
maatregelen bedenken
>codes, routings, response set
> Indien percentage missing data < 10%, dan is probleem verwaarloosbaar, en hoef je dus niets te
verwijderen, Mits missing data ‘Missing Completely at Random’ zijn
- listwise deletion = uit de lijst respondenten verwijderen die op 1 variabelen missen
> hierbij raak je veel mensen kwijt, met waarschijnlijk weinig missende scores
- pairwise deletion = uit paren met correlatie 1 weghalen, mensen die op een van de twee een
onbrekende score hebben worden niet meegenomen > bij factoranalyse
- mean substitution = gemiddelde van de respondenten berekenen
>hiermee hou je de meeste mensen binnen boord, dit is eigenlijk wat je wil > je geeft mensen
wel een waardige score (MCAR)
> geldt alleen voor waarde variabelen, en niet voor categorievariabelen (je kan niet random
iemand een man of vrouw maken, of op het platteland of in de stad
- voor het geheel
- voor subgroepen
- regression techniques = wanneer je te maken hebt met schalen, de overige variabelen gebruiken
om een score te voorspellen (regressie analyse)
> de keuze wordt bepaald doordat je zoveel mogelijk mensen in je steekproef wil houden
Missing data analyseren met SPSS: resultaten interpreteren, vaststellen welke maatregelen mogelijk
en zinvol zijn
Missing Completely At Random MCAR
De ontbrekende score patronen komen volledig door toeval tot stand
Missing At Random MAR
De kans dat de waarde van een variabele ontbreekt, is deels afhankelijk van andere
geobserveerde data, maar is niet afhankelijk van een van de andere waarden die
ontbrekend zijn > de kans is groter dat het binnen een bepaalde categorie is
Criterium:
Grote steekproeven (N > 400; vgl. Korzilius, 2008): percentage-verschillen van >
percentageverschil van 5% zijn significant (tussen totaal en categorie zelf)
Kleine steekproeven: percentage-verschillen van > 10% zijn significant
Criterium t > |2| (meer precies > |1.96|) wijst op mogelijke MAR
Overall toets voor MCAR: Little’s MCAR test
H0 missing patronen wijken niet af van verwachte patronen voor MCAR
H1 missing patronen wijken af van verwachte patronen voor MCAR