Samenvatting data 1:
1. Inleiding:
Kijken naar dia inleiding:
2. Inleiding tot beschrijvende statistiek:
2.1. Populatie & steekproef:
Populatie: verzameling elementen (personen of objecten)
Variabele: kenmerken die worden onderzocht
Steekproef:
Methode ban steekproeftrekking
Representativiteit (maar populatie is niet altijd gekend)
Aselecte steekproef (loting)
2.2. Gegevens verzamelen:
Externe bron
Interne bron
Enquête: vragenlijst
Aandachtspunt: non-respons
Gegevens -> datamatrix
Codeboek (definitie variabelen)
Onderbrekende gegevens
Experiment (bv. Invloed van medicijnen)
Controlegroep
2.3. Variabelen
Kenmerk van een object dat gemeten kan worden en dat kan variëren.
Kwantitatief: we kunnen het tellen. Bv: lengte
Kwalitatief: we kunnen het niet tellen. Bv: namen, merken
Deterministisch: uitkomst ligt vast
Kansvariabele: uitkomst onzeker
Discrete variabele: kan een eindig of aftelbaar oneindig aantal verschillende waarden
aannemen
Continue variabele: bv. tijd
2.4. Indeling in schalen:
Nominaal: de data kunnen alleen worden gecategoriseerd, zonder duidelijke
rangorde. -> kwalitatieve
Namen Woonplaats
Politieke keuze Merken
Geslacht
Ordinaal: de data worden gecategoriseerd en er is sprake van een duidelijke
rangorde. -> kwalitatieve
Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en
de intervallen tussen de categorieën zijn gelijk -> kwantitatief
1
, Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de
intervallen tussen de categorieën zijn gelijk en er is een betekenisvol nulpunt. ->
kwantitatief
2.5. Frequentie:
Klassenindeling:
Indeling in een aantal intervallen of intervallen
Rekening houden met alle mogelijke uitkomsten
Geen overlapping tussen klassen
Categorisch systeem
Vuistregel voor aantal klassen n (bv. N = 9 -> 3 klassen)
Turven
Frequentie
Frequentieverdeling
2.5.1. Relatieve frequenties = frequentie per klasse delen door totaal aantal
waarnemingen.
2.6. Formele voorschriften voor tabellen:
Speciale aanduidingen:
. = het gegeven is onbekend
* = het gegeven is voorlopig
X = het gegeven is geheim
= hier kan logischerwijs geen gegeven voorkomen
- = het gegeven is precies gelijk aan 0
0 of 0,0 = het gegeven is na afronding nul (kleiner dan de halve eenheid werd
gebruikt)
Bronvermelding
2.7. Mengverdelingen:
Een variabele die zich
(vermoedelijk) verschillend
gedraagt in twee (of meer)
subgroepen. -> Gevaar dat de
frequentieverdeling de soms is van
2 afzonderlijke verdelingen.
Bv. Voltijds & deeltijds werken bij
mannen en vrouwen.
2
1. Inleiding:
Kijken naar dia inleiding:
2. Inleiding tot beschrijvende statistiek:
2.1. Populatie & steekproef:
Populatie: verzameling elementen (personen of objecten)
Variabele: kenmerken die worden onderzocht
Steekproef:
Methode ban steekproeftrekking
Representativiteit (maar populatie is niet altijd gekend)
Aselecte steekproef (loting)
2.2. Gegevens verzamelen:
Externe bron
Interne bron
Enquête: vragenlijst
Aandachtspunt: non-respons
Gegevens -> datamatrix
Codeboek (definitie variabelen)
Onderbrekende gegevens
Experiment (bv. Invloed van medicijnen)
Controlegroep
2.3. Variabelen
Kenmerk van een object dat gemeten kan worden en dat kan variëren.
Kwantitatief: we kunnen het tellen. Bv: lengte
Kwalitatief: we kunnen het niet tellen. Bv: namen, merken
Deterministisch: uitkomst ligt vast
Kansvariabele: uitkomst onzeker
Discrete variabele: kan een eindig of aftelbaar oneindig aantal verschillende waarden
aannemen
Continue variabele: bv. tijd
2.4. Indeling in schalen:
Nominaal: de data kunnen alleen worden gecategoriseerd, zonder duidelijke
rangorde. -> kwalitatieve
Namen Woonplaats
Politieke keuze Merken
Geslacht
Ordinaal: de data worden gecategoriseerd en er is sprake van een duidelijke
rangorde. -> kwalitatieve
Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en
de intervallen tussen de categorieën zijn gelijk -> kwantitatief
1
, Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de
intervallen tussen de categorieën zijn gelijk en er is een betekenisvol nulpunt. ->
kwantitatief
2.5. Frequentie:
Klassenindeling:
Indeling in een aantal intervallen of intervallen
Rekening houden met alle mogelijke uitkomsten
Geen overlapping tussen klassen
Categorisch systeem
Vuistregel voor aantal klassen n (bv. N = 9 -> 3 klassen)
Turven
Frequentie
Frequentieverdeling
2.5.1. Relatieve frequenties = frequentie per klasse delen door totaal aantal
waarnemingen.
2.6. Formele voorschriften voor tabellen:
Speciale aanduidingen:
. = het gegeven is onbekend
* = het gegeven is voorlopig
X = het gegeven is geheim
= hier kan logischerwijs geen gegeven voorkomen
- = het gegeven is precies gelijk aan 0
0 of 0,0 = het gegeven is na afronding nul (kleiner dan de halve eenheid werd
gebruikt)
Bronvermelding
2.7. Mengverdelingen:
Een variabele die zich
(vermoedelijk) verschillend
gedraagt in twee (of meer)
subgroepen. -> Gevaar dat de
frequentieverdeling de soms is van
2 afzonderlijke verdelingen.
Bv. Voltijds & deeltijds werken bij
mannen en vrouwen.
2