2.1 Variabelen en hun metingen
Variabele = een karakteristiek dat kan variëren in waarde in een steekproef of
populatie. Bv. hoeveelheid kinderen, lengte, leeftijd etc.
De waarde die de variabele kan nemen vormt de meetschaal.
Kwantitatief = wanneer de waarde van de variabele nummers als waarde
heeft.
Bij kwantitatieve variabelen heeft de meetschaal/de waardes (nummers) een
interval = specifieke afstand tussen elke waarde.
Kwalitatief (categoriaal) = wanneer de waarde van de variabele verdeeld is
in categorieën. Bv. huwelijksstatus, haarkleur.
De eerste kwalitatieve schaal is nominaal = de categorieën hebben geen
volgorde of hoog of laag. Bv. manier van transport naar school.
De tweede kwalitatieve schaal is ordinaal = deze valt eigenlijk tussen interval
en nominaal. Dit bevat een schaal met categorieën die een neutrale ordening
hebben qua waarden. Bv. sociale klas (boven, gemiddeld, laag).
Ze zijn niet nominaal omdat ze wel geordend zijn en ze zijn ook niet interval
omdat er geen specifiek afstand tussen zit.
Discrete variabelen = wanneer de waardes een set van onafhankelijke
nummers vormen zoals 0, 1, 2, 3 etc.
Alle categoriale variabelen (nominaal en ordinaal) zijn discreet.
Continue variabelen = wanneer de waardes op een schaal infinitief veel
waardes kunnen aannemen zoals lengte.
Kwantitatieve variabelen zijn meest continu, maar we ronden ze vaak af
waardoor ze discreet worden.
2.2 Randomisatie
Randomisatie = het mechanisme voor het bereiken van goede steekproef
representatie.
Willekeurige steekproef = wanneer elke respondent dezelfde kans heeft om
geselecteerd te worden. Dit is de meest ‘eerlijke’ manier van een respondent
kiezen er voorkomt dat de steekproef een bias heeft.
De meest voorkomende methode om een willekeurige steekproef te kiezen is
om als eerste een lijst van je populatie te maken (bv. mensen in jaar 1
pedagogische wetenschappen) vervolgens iedereen een nummer te geven
om dan random nummer te genereren (via de computer).
, Manieren om data te verzamelen; (1) een survey. (2) een experiment. (3) een
observatie.
2.3 Steekproefvariabiliteit en mogelijke bias
Sampling error = in hoeveel de statisci verschilt van de parameter omdat niet
de hele populatie ondervraagt wordt. Bv. steekproef komt uit op 63% en in de
populatie is het daadwerkelijk 66%, dan is er een sampling error van -3%.
In werkelijkheid is dat sampling error niet bekend omdat de parameter van de
populatie niet bekend is.
Drie soorten bias; sampling bias, response bias en nonresponse bias.
Selecte steekproef (probability) = de kans dat elke willekeurige persoon
wordt geselecteerd bekend is.
Aselecte steekproef (nonprobability) = hierbij is het niet mogelijk om de
kansen van de mogelijkheid om gekozen te worden te bepalen. Dit resulteert
in een sampling bias. Een meest voorkomende aselecte steekproef is
bijvoorbeeld als het op basis is van vrijwilligheid. Dit is geen goede
representatie van de werkelijke populatie.
Ook met een willekeurige steekproef kan er sprake zijn van sampling bias;
wanneer de sampling frame niet een representatie is voor sommige groepen
in de populatie.
Response bias = wanneer de respondenten een ‘verkeerd’ antwoord geven
op de vraag door hoe de vraag gesteld wordt of door bv te liegen.
Nonrespons bias = wanneer respondenten die bedoeld waren om in de
steekproef deel te nemen, niet participeren. De groep die wel geantwoord
heeft kan verschillen van de groep die niet geantwoord heeft (> 20%).
Systematische willekeurige steekproef = wanneer er systematisch een
respondent gekozen wordt. Bij het begin wordt iemand gekozen, vervolgens
worden er een paar overgeslagen en er wordt weer een gekozen etc.
K = het skipp nummer. Dus wanneer de n=100 is uit een populatie van
N=30.000 dan is de K (N/n) = 30.000/100 = 300. Dus 1 respondent selecteren
uit iedere 300 personen.
Gestratificeerde steekproef = wanneer de populatie in verschillende
groepen wordt verdeeld (ook wel strata) en vervolgens uit elke strata een
willekeurige steekproef wordt genomen.
Proportioneel = wanneer de proporties in de strata overeenkomen met de
porporties in de populatie. Bv. 90% is democratische en 10% niet, dan is de
sample size voor democratisch 9 keer zo groot als die van niet.
Disproportioneel = wanneer de proporties niet overeenkomen.
Cluster steekproef = te gebruiken wanneer een lijst van de gehele populatie
van je onderzoek (sampling frame) niet beschikbaar is.
Hiermee verdeel je de populatie in grote aantallen/clusters bv. wijken. Hier
wordt vervolgens willekeurige steekproeven in uitgevoerd. Er wordt echter in
vergelijking met de strata niet gebruik gemaakt van elke cluster.
2