Samenvatting CSI Q7 statistiek
Je krijgt SE doordat je maar een deel van de populatie onderzoekt, en er variatie zit in de populatie,
dit zal je altijd blijven houden. Je kan SE schatten en verminderen.
SE kan je verminderen door de sample grootte te vergroten. Dit is wel duurder.
Je kan het ook verminderen door een goede sample design.
Natuurlijk variatie: iedereen is anders en doet niet hetzelfde.
Explainable variatie: door verschil in groepen (vrouwen, afkomst)
Non-sample error: door slechte onderzoeksopzet, of fouten
Unbiased sample: als iedereen even grote kans heeft om gekozen te worden.
Simple random sampling:
Random gekozen, iedereen heeft even grote kans om gekozen te worden. Hierdoor unbiased en
representatief.
Dit is alleen vaak moeilijk waar te maken.
Convenience sampling:
Voor mensen die langskomen, of eerste paar van industrie. Dit is vaak biased, en self-selection biased
Systematic sampling:
Je pakt elk gegeven nummer een sample.
Cluster sampling:
Populatie ingedeeld in clusters, clusters worden random gekozen.
Dit kan makkelijker zijn en praktischer. Mogelijk wel bias en onrepresentatief.
Stratified sampling:
Uit de populatie maak je clusters die op elkaar lijken, uit die
clusters pak je random samples.
Unbiased en representatief. Dit kan wel moeilijk waar te maken
zijn.
Standaard deviatie:
Meet hoe veel de data is gespreid van het gemiddelde. Hoe groter
de spreiding, hoe groter de SD.
Positive skew → rechtsscheef, staart naar rechts, naar positief
Negative skew → linksscheef, naar links, naar negatief
Kwartalen: om deze in te delen moet je alles op volgorde zetten. Nu kun je de mediaan vinden. De
helft hiervan is een kwartaal. Dit gebruik je ook om box plots te maken.
Je krijgt SE doordat je maar een deel van de populatie onderzoekt, en er variatie zit in de populatie,
dit zal je altijd blijven houden. Je kan SE schatten en verminderen.
SE kan je verminderen door de sample grootte te vergroten. Dit is wel duurder.
Je kan het ook verminderen door een goede sample design.
Natuurlijk variatie: iedereen is anders en doet niet hetzelfde.
Explainable variatie: door verschil in groepen (vrouwen, afkomst)
Non-sample error: door slechte onderzoeksopzet, of fouten
Unbiased sample: als iedereen even grote kans heeft om gekozen te worden.
Simple random sampling:
Random gekozen, iedereen heeft even grote kans om gekozen te worden. Hierdoor unbiased en
representatief.
Dit is alleen vaak moeilijk waar te maken.
Convenience sampling:
Voor mensen die langskomen, of eerste paar van industrie. Dit is vaak biased, en self-selection biased
Systematic sampling:
Je pakt elk gegeven nummer een sample.
Cluster sampling:
Populatie ingedeeld in clusters, clusters worden random gekozen.
Dit kan makkelijker zijn en praktischer. Mogelijk wel bias en onrepresentatief.
Stratified sampling:
Uit de populatie maak je clusters die op elkaar lijken, uit die
clusters pak je random samples.
Unbiased en representatief. Dit kan wel moeilijk waar te maken
zijn.
Standaard deviatie:
Meet hoe veel de data is gespreid van het gemiddelde. Hoe groter
de spreiding, hoe groter de SD.
Positive skew → rechtsscheef, staart naar rechts, naar positief
Negative skew → linksscheef, naar links, naar negatief
Kwartalen: om deze in te delen moet je alles op volgorde zetten. Nu kun je de mediaan vinden. De
helft hiervan is een kwartaal. Dit gebruik je ook om box plots te maken.