Statistiek
Hoofdstuk 1. Statistiek, gegevens en een kritische houding
1.1. De wetenschap statistiek
Statistiek de wetenschap van gegevens
• verzamelen
• evalueren (classificeren, samenvatten, organiseren, analyseren)
• interpreteren
1.2. 2 Soorten statistische toepassingen
Steekproef trekken gegevens selecteren uit een grotere verzameling waarvan we de
kenmerken willen schatten
Ø Beschrijvende statistiek beschrijven van verzamelde gegevens
Ø Verklarende statistiek trekt conclusies over de gehele groep op basis van
een deel (steekproef) van deze groep
1.3. 6 Basiselementen van de statistiek
Experimentele eenheden de bestudeerde objecten
Populatie de verzameling experimentele eenheden
Variabele kenmerk of eigenschap van een individuele eenheid uit de
populatie
− Meten:
getallen toekennen aan variabelen
− Census van de populatie:
resultaat als we een variabele meten voor iedere
eenheid van een populatie
Steekproef deelverzameling van de populatie
Statistische veralgemening vanuit de steekproef naar de populatie
gevolgtrekking/conclusie
Betrouwbaarheidsmaat uitspraak over de onzekerheid van de statistische
gevolgtrekking
1
, Gelijke
1.4. Soorten gegevens: 2 gegevenstypes intervallen
hebben gelijke
betekenissen
(berekeningen)
Kwalitatieve gegevens Kwantitatieve
(categorieën, niet- gegevens
numeriek) (numeriek)
Ratioschaal
Ordinale gegevens (absoluut nulpunt
(zinvol ordenbaar) bv. 0 km)
Nominale gegevens Intervalschaal
(Niet-ordenbaar) (geen absoluut nulpunt
bv. 0 graden °C of 00:00)
Opmerking: Kwantitatief ⇒ kwalitatief door indeling in categorieën
Kwalitatief ⇏ kwantitatief
1.5. Gegevens verzamelen
Gegevensbronnen: 4 methodes
1. Publicaties
= boek, tijdschrift, krant, website
⟶ primaire bron: maker is betrokkene, ooggetuige,…
⟶ secundaire bron: maker is niet direct betrokken, vaak andere tijd
2. (Ontworpen/gecontroleerd) experiment
= effecten van een behandeling onderzoeken
⟶ experimentele groep/ behandelingsgroep: krijgt behandeling
⟶ controlegroep: krijgt geen behandeling of krijgt placebo
3. Enquête (survey)
= gegevens via vragenlijsten, gesteld aan een steekproef van personen
4. Waarnemend onderzoek/ observatie
= onderzoeken van experimentele eenheden in hun natuurlijke omgeving,
zonder interactie of behandeling!
Steekproeven trekken
− Nodig voor verklarende statistiek
− Steekproeven moeten representatief zijn voor gehele populatie!
⟹ representativiteit via aselecte steekproef
= Elke deelverzameling van dezelfde omvang uit de populatie heeft
dezelfde kans om gekozen te worden
2
, 1.6. Blijf kritisch: fouten in gegevens
⟹ fouten doordat steekproef niet aselect (niet representatief) is!
3 Soorten Vertekening door Vertekening door non- Meetfouten
vertekeningen (zelf)selectie respons
(“bias”)
Wat een deelverzameling onderzoekers zijn niet in slordigheden in gegevens
van de populatie is staat om gegevens te
uitgesloten van het verkrijgen over alle
onderzoek eenheden in de
steekproef
Oorzaak wie op een enquête oorzaak zoeken, hoe - dubbelzinnige of
reageert heeft vaak al verwerken we dit suggestieve vragen
uitgesproken statisch? - enquêteur
meningen over het - apparatuur
onderwerp - verkeerde omzetting
van gegevens
3
Hoofdstuk 1. Statistiek, gegevens en een kritische houding
1.1. De wetenschap statistiek
Statistiek de wetenschap van gegevens
• verzamelen
• evalueren (classificeren, samenvatten, organiseren, analyseren)
• interpreteren
1.2. 2 Soorten statistische toepassingen
Steekproef trekken gegevens selecteren uit een grotere verzameling waarvan we de
kenmerken willen schatten
Ø Beschrijvende statistiek beschrijven van verzamelde gegevens
Ø Verklarende statistiek trekt conclusies over de gehele groep op basis van
een deel (steekproef) van deze groep
1.3. 6 Basiselementen van de statistiek
Experimentele eenheden de bestudeerde objecten
Populatie de verzameling experimentele eenheden
Variabele kenmerk of eigenschap van een individuele eenheid uit de
populatie
− Meten:
getallen toekennen aan variabelen
− Census van de populatie:
resultaat als we een variabele meten voor iedere
eenheid van een populatie
Steekproef deelverzameling van de populatie
Statistische veralgemening vanuit de steekproef naar de populatie
gevolgtrekking/conclusie
Betrouwbaarheidsmaat uitspraak over de onzekerheid van de statistische
gevolgtrekking
1
, Gelijke
1.4. Soorten gegevens: 2 gegevenstypes intervallen
hebben gelijke
betekenissen
(berekeningen)
Kwalitatieve gegevens Kwantitatieve
(categorieën, niet- gegevens
numeriek) (numeriek)
Ratioschaal
Ordinale gegevens (absoluut nulpunt
(zinvol ordenbaar) bv. 0 km)
Nominale gegevens Intervalschaal
(Niet-ordenbaar) (geen absoluut nulpunt
bv. 0 graden °C of 00:00)
Opmerking: Kwantitatief ⇒ kwalitatief door indeling in categorieën
Kwalitatief ⇏ kwantitatief
1.5. Gegevens verzamelen
Gegevensbronnen: 4 methodes
1. Publicaties
= boek, tijdschrift, krant, website
⟶ primaire bron: maker is betrokkene, ooggetuige,…
⟶ secundaire bron: maker is niet direct betrokken, vaak andere tijd
2. (Ontworpen/gecontroleerd) experiment
= effecten van een behandeling onderzoeken
⟶ experimentele groep/ behandelingsgroep: krijgt behandeling
⟶ controlegroep: krijgt geen behandeling of krijgt placebo
3. Enquête (survey)
= gegevens via vragenlijsten, gesteld aan een steekproef van personen
4. Waarnemend onderzoek/ observatie
= onderzoeken van experimentele eenheden in hun natuurlijke omgeving,
zonder interactie of behandeling!
Steekproeven trekken
− Nodig voor verklarende statistiek
− Steekproeven moeten representatief zijn voor gehele populatie!
⟹ representativiteit via aselecte steekproef
= Elke deelverzameling van dezelfde omvang uit de populatie heeft
dezelfde kans om gekozen te worden
2
, 1.6. Blijf kritisch: fouten in gegevens
⟹ fouten doordat steekproef niet aselect (niet representatief) is!
3 Soorten Vertekening door Vertekening door non- Meetfouten
vertekeningen (zelf)selectie respons
(“bias”)
Wat een deelverzameling onderzoekers zijn niet in slordigheden in gegevens
van de populatie is staat om gegevens te
uitgesloten van het verkrijgen over alle
onderzoek eenheden in de
steekproef
Oorzaak wie op een enquête oorzaak zoeken, hoe - dubbelzinnige of
reageert heeft vaak al verwerken we dit suggestieve vragen
uitgesproken statisch? - enquêteur
meningen over het - apparatuur
onderwerp - verkeerde omzetting
van gegevens
3