Statistiek I: statistisch gezien
Inhoud
Table of Contents
Statistiek I: statistisch gezien..................................................................................................................1
Inhoud....................................................................................................................................................1
Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia................................................2
statistiek is …..................................................................................................................................2
Hoofdstuk 2 data statistisch onder de loep genomen........................................................................2
Datamatrix......................................................................................................................................2
onderzoekselementen....................................................................................................................3
variabelen.......................................................................................................................................3
Meetwaarden.................................................................................................................................4
Sommatieteken..............................................................................................................................4
Dubbel sommatieteken..................................................................................................................5
Hoofdstuk 3: visuele inspectie van verdelingen op basis van ruwe data............................................5
Rangorde kengetallen.....................................................................................................................5
Grafieken kwalitatieve variabelen..................................................................................................5
Stam-bladdiagram : diepte.............................................................................................................6
Kwartielen vs scharnierwaarden.....................................................................................................6
Centrale tendentie..........................................................................................................................7
Spreiding.........................................................................................................................................7
Vorm...............................................................................................................................................8
overzicht kengetallen.....................................................................................................................9
Uitschieters.....................................................................................................................................9
Hoofdstuk 4: eerste analyseniveau, centrale tendentie.....................................................................9
Rekenkundig gemiddelde.............................................................................................................10
Specifiek gemiddelde....................................................................................................................11
Logaritmen...................................................................................................................................13
Overzicht gemiddelden.................................................................................................................14
Hoofdstuk 5: tweede analyseniveau, spreiding................................................................................14
Standaardafwijking (.....................................................................................................................15
Variantie ).....................................................................................................................................15
Interkwartiele spreidingscoëfficiënt:............................................................................................18
Kengetallen...................................................................................................................................18
Spreiding kwalitatieve variabelen.................................................................................................18
Informatietheorie.........................................................................................................................20
entropie H.....................................................................................................................................21
1
, Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia
statistiek is …
Hoe verwerk je de leerstof?
Stap 1: theorie begrijpen en eenvoudige oefeningen
Stap 2: leerstof inoefenen tijdens werkcolleges
Stap 3: theorie studeren en extra oefeningen maken
Beschrijvende statistiek: beschrijven van steekproef/populatiegegevens m.b.v. tabellen, grafieken en
kengetallen (deel 1)
Inferentiële statistiek: o.b.v. steekproefgegevens uitspraken doen over de populatie (deel 2)
begrippen
Statistiek = de wetenschap van het verzamelen, organiseren, presenteren, analyseren en
interpreteren van gegevens of data volgens een numerieke logica.
Populatie N = de grep wrover het onderzoek een uitspraak wil doen (bv. Amerikaanse mannen)
Steekproef n = een selectie uit de totale populatie, wrop je het onderzoek uitvoert. (bv. Het
daadwerkelijke aantal Amerikaanse mannen die je hebt ondervraagd)
Problemen bij dataverzameling:
Problemen bij de presentatie van data:
Misleidende grafieken
Populatie v gemiddelde is risky, gevoelig vr uitschieters
Hoofdstuk 2 data statistisch onder de loep genomen
Datamatrix
- Onderzoekselement
- Variabelen
- Meetwaarden
Enkelvoudig sommatieteken
Dubbel sommatieteken
Rangorde kengetallen
Datamatrix
Kolommen
Variabelen: kenmerken van
Rijen 2
de onderzoekselementen
, Meetwaarden of observaties: waarde van een onderzoekselement op een variabele
Onderzoekselementen of cases: Datgene waar we iets over willen zeggen
onderzoekselementen
Aggregatieniveaus
- Micro: individuen (burgers, studenten, tieners)
- Meso: organisaties, beroepsgroepen, scholen
- Macro: gemeenten, landen, provincies
Ecologische meetfout: op basis van gegevens op macro (/meso) niveau uitspraken doen over
het micro-niveau (Simpson paradox)
variabelen
Meten van variabelen
Conceptualisering: wat wil je meten?
Indicering: hoe het theoretisch concept empirisch meten? – validiteit: meet je wat je wil
meten?
Operationalisering: hoe ga je het registreren?
o Belang v antwoordschalen
o Betrouwbaarheid: leveren verschillende metingen hetzelfde resultaat op?
(interpersoonlijk: meerdere indicatoren of intertemporeel: op verschillende momenten)
Kwalitatieve/ categorische meetniveaus
Ordinaal: linkert-schaal (eens-oneens), onderwijsniveau, aantal sterren hotel
Vb: resultaat wedstrijd (winnen-gelijk-verliezen)
Nominaal: geslacht, politieke partijvoorkeur, haarkleur, regio
Vb: soorten olympische diciplines
Kwantitatieve meetniveaus
Ratio: afstand, leeftijd, aantallen, inkomen
Vb: leeftijd eendagsvlieg, aantal politieke partijen
Interval: jaartelling, IQ, temperatuur (Celsius, Fahrenheit)
Kwantitatieve variabelen (interval/ratio) kunnen discreet of continue zijn
Discreet = variabele kan een beperkt aantal waarden aannemen
3
Inhoud
Table of Contents
Statistiek I: statistisch gezien..................................................................................................................1
Inhoud....................................................................................................................................................1
Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia................................................2
statistiek is …..................................................................................................................................2
Hoofdstuk 2 data statistisch onder de loep genomen........................................................................2
Datamatrix......................................................................................................................................2
onderzoekselementen....................................................................................................................3
variabelen.......................................................................................................................................3
Meetwaarden.................................................................................................................................4
Sommatieteken..............................................................................................................................4
Dubbel sommatieteken..................................................................................................................5
Hoofdstuk 3: visuele inspectie van verdelingen op basis van ruwe data............................................5
Rangorde kengetallen.....................................................................................................................5
Grafieken kwalitatieve variabelen..................................................................................................5
Stam-bladdiagram : diepte.............................................................................................................6
Kwartielen vs scharnierwaarden.....................................................................................................6
Centrale tendentie..........................................................................................................................7
Spreiding.........................................................................................................................................7
Vorm...............................................................................................................................................8
overzicht kengetallen.....................................................................................................................9
Uitschieters.....................................................................................................................................9
Hoofdstuk 4: eerste analyseniveau, centrale tendentie.....................................................................9
Rekenkundig gemiddelde.............................................................................................................10
Specifiek gemiddelde....................................................................................................................11
Logaritmen...................................................................................................................................13
Overzicht gemiddelden.................................................................................................................14
Hoofdstuk 5: tweede analyseniveau, spreiding................................................................................14
Standaardafwijking (.....................................................................................................................15
Variantie ).....................................................................................................................................15
Interkwartiele spreidingscoëfficiënt:............................................................................................18
Kengetallen...................................................................................................................................18
Spreiding kwalitatieve variabelen.................................................................................................18
Informatietheorie.........................................................................................................................20
entropie H.....................................................................................................................................21
1
, Hoofdstuk 1 Inleiding: over statistiek, statistieken en mathemafobia
statistiek is …
Hoe verwerk je de leerstof?
Stap 1: theorie begrijpen en eenvoudige oefeningen
Stap 2: leerstof inoefenen tijdens werkcolleges
Stap 3: theorie studeren en extra oefeningen maken
Beschrijvende statistiek: beschrijven van steekproef/populatiegegevens m.b.v. tabellen, grafieken en
kengetallen (deel 1)
Inferentiële statistiek: o.b.v. steekproefgegevens uitspraken doen over de populatie (deel 2)
begrippen
Statistiek = de wetenschap van het verzamelen, organiseren, presenteren, analyseren en
interpreteren van gegevens of data volgens een numerieke logica.
Populatie N = de grep wrover het onderzoek een uitspraak wil doen (bv. Amerikaanse mannen)
Steekproef n = een selectie uit de totale populatie, wrop je het onderzoek uitvoert. (bv. Het
daadwerkelijke aantal Amerikaanse mannen die je hebt ondervraagd)
Problemen bij dataverzameling:
Problemen bij de presentatie van data:
Misleidende grafieken
Populatie v gemiddelde is risky, gevoelig vr uitschieters
Hoofdstuk 2 data statistisch onder de loep genomen
Datamatrix
- Onderzoekselement
- Variabelen
- Meetwaarden
Enkelvoudig sommatieteken
Dubbel sommatieteken
Rangorde kengetallen
Datamatrix
Kolommen
Variabelen: kenmerken van
Rijen 2
de onderzoekselementen
, Meetwaarden of observaties: waarde van een onderzoekselement op een variabele
Onderzoekselementen of cases: Datgene waar we iets over willen zeggen
onderzoekselementen
Aggregatieniveaus
- Micro: individuen (burgers, studenten, tieners)
- Meso: organisaties, beroepsgroepen, scholen
- Macro: gemeenten, landen, provincies
Ecologische meetfout: op basis van gegevens op macro (/meso) niveau uitspraken doen over
het micro-niveau (Simpson paradox)
variabelen
Meten van variabelen
Conceptualisering: wat wil je meten?
Indicering: hoe het theoretisch concept empirisch meten? – validiteit: meet je wat je wil
meten?
Operationalisering: hoe ga je het registreren?
o Belang v antwoordschalen
o Betrouwbaarheid: leveren verschillende metingen hetzelfde resultaat op?
(interpersoonlijk: meerdere indicatoren of intertemporeel: op verschillende momenten)
Kwalitatieve/ categorische meetniveaus
Ordinaal: linkert-schaal (eens-oneens), onderwijsniveau, aantal sterren hotel
Vb: resultaat wedstrijd (winnen-gelijk-verliezen)
Nominaal: geslacht, politieke partijvoorkeur, haarkleur, regio
Vb: soorten olympische diciplines
Kwantitatieve meetniveaus
Ratio: afstand, leeftijd, aantallen, inkomen
Vb: leeftijd eendagsvlieg, aantal politieke partijen
Interval: jaartelling, IQ, temperatuur (Celsius, Fahrenheit)
Kwantitatieve variabelen (interval/ratio) kunnen discreet of continue zijn
Discreet = variabele kan een beperkt aantal waarden aannemen
3