HOORCOLLEGES STATISCHE METHODEN - TENTAMEN 1
HC1.a Beschrijvende Statistiek - Basisbegrippen en Frequentieverdelingen - inleiding,
H1, H2
- Nagaan in welke mate de uitkomsten van een steekproef algemeen geldig zijn.
Statistiek → 2 vormen:
1. Beschrijvende Statistiek (ordenen/presenteren van gegevens dmv tabellen en
grafieken + samenhang tussen variabelen + verschillen tussen groepen + doe je
altijd/begin je altijd mee (steekproef hoeft niet aselect te zijn)).
2. Inductieve Statistiek (alleen toepassen als er sprake is van een steekproef; nagaan
of de uitkomsten van de steekproef ook geldig zijn voor de hele populatie + alleen
toepassen op aselecte steekproeven).
Populatie en Steekproef
- Populatie = hele onderzoeksgroep (groep met 1 of meer gemeenschappelijke
kenmerken).
- Steekproef = deelgroep uit de populatie (als we de populatie als geheel niet kunnen
onderzoeken → moet representatief zijn).
- aselect = random = representatieve afspiegeling populatie
Datamatrix (= bestand met alle gegevens)
- Onderzoekseenheden of cases (elementen die je onderzoekt → rijen; onder elkaar).
- Variabelen (kenmerken van de onderzoekseenheden → kolommen; naast elkaar).
- Waarden of scores (feitelijk gemeten gegevens → getallen
(leeftijden)/eigenschappen (geslacht) → cellen van de matrix).
- Titel: boven de tabel + tabelnummer + duidelijk zijn wat er in de tabel te zien is.
- Bron: achter de titel/onder de tabel.
Typen variabelen - meetschalen
4 meetschalen (bepaald welke statistische technieken je kunt toepassen).
- Nominaal (categorieën zonder logische volgorde (geslacht, typen huishouden,
studierichting)).
- Ordinaal (categorieën met een natuurlijke ordening (opleidingsniveau, stellingen,
numerieke gegevens die in klassen zijn ingedeeld (leeftijd → je weet niet het verschil
in de leeftijd))).
→ Kwalitatief of categorisch (je kunt hiermee niet rekenen)
- Interval (het nulpunt is arbitrair; niet echt nul (temperatuur → beide schalen hebben
een ander nulpunt, maar in beide gevallen is het niet echt nul)). → komen weinig
voor.
- Ratio (hebben wel een echt nulpunt (reistijd, inkomen)).
→ Kwantitatief of numeriek (hiermee kun je wel rekenen)
Oplopend: als een techniek bij een bepaald meetniveau is toegestaan, dan is het ook
toegestaan bij een hogere schaal, maar niet bij een lagere (gemiddelde; intervalschaal →
ook ratio, maar niet nominaal of ordinaal).
1
,Typen variabelen - andere indelingen
Bijzondere meetschalen:
- Dichotoom
● Categorisch met slechts twee categorieën (geslacht (man/vrouw), woningtype
(koop/huur), studieresultaat (gehaald/gezakt)).
● Proporties of fracties p + q = 1 (rekenen als interval).
● 60 vrouwen; 40 mannen → p = 0,6 en q = 0,4
- Rangnummers
● Ordinaal
Discreet - Continu
- Discreet
● Categorisch (beperkt aantal waarden/categorieën).
● Numerieke - gehele getallen (numerieke getallen kunnen ook discreet zijn als
ze gehele getallen zijn; aantallen (geen cijfers achter de komma mogelijk)).
● STAAFDIAGRAM (staven staan los van elkaar).
- Continu
● Wel cijfers achter de komma mogelijk.
● Numeriek - doorlopende getallen
● Numeriek - ingedeeld in klassen
● HISTOGRAM (staven staan tegen elkaar aan).
Frequentieverdeling
Stap 1:
Beschrijvende statistiek: welke antwoorden zijn er gegeven + hoe vaak komt bepaald
antwoord voor → frequentietabel (overzicht + absolute aantallen/frequenties → = f +
relatieve frequenties → proporties/fracties = p (f/n) / = %).
Staafdiagram
- Grafiek met een titel (boven de grafiek + aangeduid met Figuur) en een bron (achter
titel of onder figuur).
- Horizontale as: element
- Verticale as: frequentie
Kruistabel - Vergelijken categorieën
- Gebruik als je twee categorische variabelen tegen elkaar wilt afzetten (geslacht -
vervoermiddelen).
- Kolommen: variabelen waarvoor de groepen willen vergelijken.
- Rijen: variabelen die we willen vergelijken.
2
, - Totaal: onderaan en meest rechtse rij.
- Titel en bron nodig.
- Om de gegevens te vergelijken moet je gebruik maken van kolompercentages.
- Kolompercentages geven de relatieve verdeling per groep + tellen op tot 100%.
Staafdiagrammen - verdeling vervoermiddelen per geslacht
- Grafisch weergeven van een kruistabel: samengesteld staafdiagram
(aantallen/procenten + naast elkaar/op elkaar).
- Absolute verdeling (zien hoe vaak iets echt voorkomt + slecht met elkaar te
vergelijken).
- Relatieve verdeling (verdelingen goed te vergelijken + zegt niks over de aantallen
antwoorden die gegeven zijn).
Frequentieverdeling - geclassificeerde gegevens
→ Klassen lopen in elkaar over, dus: gebruik maken van een histogram.
Histogram - geclassificeerde gegevens
- Horizontale as: klassen + zorg dat de klassengrenzen altijd onder het midden onder
de staaf staan (niet onder de hoekpunten want dat zijn de exacte grenzen) +
klassenmiddens ook onder de staven.
- Verticale as: absolute aantallen/relatieve aandeel.
- Titel en bron.
Cumulatieve frequentieverdeling
- Geven het aantal waarnemingen aan tot een bepaalde bovengrens.
- Cumulatieve frequentieverdeling = F.
- Absoluut/relatief.
Cumulatieve of somfrequentiepolygoon
- Horizontale as: bovengrenzen van de klassen.
- Verticale as: cumulatieve frequenties/percentages (% het meest gekozen).
- Steile lijn: klassen hebben een hoge frequentie
- Afgevlakte lijn: er komt weinig frequentie bij bij de klassen.
3
, HC1.b Beschrijvende Statistiek - Centrummaten - paragraaf 3.1
- Stap 1: beschrijvende statistiek + frequentietabel (kan ook in grafiek).
- Stap 2: berekenen van statistische maten (samenvatten van alle waarden in een
paar karakteristieke getallen).
Statische maten
- Centrummaten (Indicatie van het middelpunt/zwaartepunt van de gegevens).
● Modus (meest voorkomende waarde → alle meetschalen).
● Mediaan (middelste waarde → minimaal ordinale schaal).
● Rekenkundig gemiddelde (zwaartepunt → intervalschaal/ratioschaal).
- Spreidingsmaten (HC2 → Verdeling van de gegevens).
- Scheefheidsmaten (HC2 → Symmetrisch of niet).
Modus
- Mo.
- Meest voorkomend.
- Kan gebruikt worden bij kwantitatieve en kwalitatieve gegevens.
Mediaan
- Md.
- Middelste waarde.
- 1. Zet de gegevens op volgorde (ordinale schaal) → 2. Bepaal de middelste
waarneming. → 3. Md = waarde van de middelste waarneming.
- Middelste =
Mediaan bij klassen
- Formule =
Rekenkundig gemiddelde
- Zwaartepunt.
- Meetschaal: interval of ratio.
4
HC1.a Beschrijvende Statistiek - Basisbegrippen en Frequentieverdelingen - inleiding,
H1, H2
- Nagaan in welke mate de uitkomsten van een steekproef algemeen geldig zijn.
Statistiek → 2 vormen:
1. Beschrijvende Statistiek (ordenen/presenteren van gegevens dmv tabellen en
grafieken + samenhang tussen variabelen + verschillen tussen groepen + doe je
altijd/begin je altijd mee (steekproef hoeft niet aselect te zijn)).
2. Inductieve Statistiek (alleen toepassen als er sprake is van een steekproef; nagaan
of de uitkomsten van de steekproef ook geldig zijn voor de hele populatie + alleen
toepassen op aselecte steekproeven).
Populatie en Steekproef
- Populatie = hele onderzoeksgroep (groep met 1 of meer gemeenschappelijke
kenmerken).
- Steekproef = deelgroep uit de populatie (als we de populatie als geheel niet kunnen
onderzoeken → moet representatief zijn).
- aselect = random = representatieve afspiegeling populatie
Datamatrix (= bestand met alle gegevens)
- Onderzoekseenheden of cases (elementen die je onderzoekt → rijen; onder elkaar).
- Variabelen (kenmerken van de onderzoekseenheden → kolommen; naast elkaar).
- Waarden of scores (feitelijk gemeten gegevens → getallen
(leeftijden)/eigenschappen (geslacht) → cellen van de matrix).
- Titel: boven de tabel + tabelnummer + duidelijk zijn wat er in de tabel te zien is.
- Bron: achter de titel/onder de tabel.
Typen variabelen - meetschalen
4 meetschalen (bepaald welke statistische technieken je kunt toepassen).
- Nominaal (categorieën zonder logische volgorde (geslacht, typen huishouden,
studierichting)).
- Ordinaal (categorieën met een natuurlijke ordening (opleidingsniveau, stellingen,
numerieke gegevens die in klassen zijn ingedeeld (leeftijd → je weet niet het verschil
in de leeftijd))).
→ Kwalitatief of categorisch (je kunt hiermee niet rekenen)
- Interval (het nulpunt is arbitrair; niet echt nul (temperatuur → beide schalen hebben
een ander nulpunt, maar in beide gevallen is het niet echt nul)). → komen weinig
voor.
- Ratio (hebben wel een echt nulpunt (reistijd, inkomen)).
→ Kwantitatief of numeriek (hiermee kun je wel rekenen)
Oplopend: als een techniek bij een bepaald meetniveau is toegestaan, dan is het ook
toegestaan bij een hogere schaal, maar niet bij een lagere (gemiddelde; intervalschaal →
ook ratio, maar niet nominaal of ordinaal).
1
,Typen variabelen - andere indelingen
Bijzondere meetschalen:
- Dichotoom
● Categorisch met slechts twee categorieën (geslacht (man/vrouw), woningtype
(koop/huur), studieresultaat (gehaald/gezakt)).
● Proporties of fracties p + q = 1 (rekenen als interval).
● 60 vrouwen; 40 mannen → p = 0,6 en q = 0,4
- Rangnummers
● Ordinaal
Discreet - Continu
- Discreet
● Categorisch (beperkt aantal waarden/categorieën).
● Numerieke - gehele getallen (numerieke getallen kunnen ook discreet zijn als
ze gehele getallen zijn; aantallen (geen cijfers achter de komma mogelijk)).
● STAAFDIAGRAM (staven staan los van elkaar).
- Continu
● Wel cijfers achter de komma mogelijk.
● Numeriek - doorlopende getallen
● Numeriek - ingedeeld in klassen
● HISTOGRAM (staven staan tegen elkaar aan).
Frequentieverdeling
Stap 1:
Beschrijvende statistiek: welke antwoorden zijn er gegeven + hoe vaak komt bepaald
antwoord voor → frequentietabel (overzicht + absolute aantallen/frequenties → = f +
relatieve frequenties → proporties/fracties = p (f/n) / = %).
Staafdiagram
- Grafiek met een titel (boven de grafiek + aangeduid met Figuur) en een bron (achter
titel of onder figuur).
- Horizontale as: element
- Verticale as: frequentie
Kruistabel - Vergelijken categorieën
- Gebruik als je twee categorische variabelen tegen elkaar wilt afzetten (geslacht -
vervoermiddelen).
- Kolommen: variabelen waarvoor de groepen willen vergelijken.
- Rijen: variabelen die we willen vergelijken.
2
, - Totaal: onderaan en meest rechtse rij.
- Titel en bron nodig.
- Om de gegevens te vergelijken moet je gebruik maken van kolompercentages.
- Kolompercentages geven de relatieve verdeling per groep + tellen op tot 100%.
Staafdiagrammen - verdeling vervoermiddelen per geslacht
- Grafisch weergeven van een kruistabel: samengesteld staafdiagram
(aantallen/procenten + naast elkaar/op elkaar).
- Absolute verdeling (zien hoe vaak iets echt voorkomt + slecht met elkaar te
vergelijken).
- Relatieve verdeling (verdelingen goed te vergelijken + zegt niks over de aantallen
antwoorden die gegeven zijn).
Frequentieverdeling - geclassificeerde gegevens
→ Klassen lopen in elkaar over, dus: gebruik maken van een histogram.
Histogram - geclassificeerde gegevens
- Horizontale as: klassen + zorg dat de klassengrenzen altijd onder het midden onder
de staaf staan (niet onder de hoekpunten want dat zijn de exacte grenzen) +
klassenmiddens ook onder de staven.
- Verticale as: absolute aantallen/relatieve aandeel.
- Titel en bron.
Cumulatieve frequentieverdeling
- Geven het aantal waarnemingen aan tot een bepaalde bovengrens.
- Cumulatieve frequentieverdeling = F.
- Absoluut/relatief.
Cumulatieve of somfrequentiepolygoon
- Horizontale as: bovengrenzen van de klassen.
- Verticale as: cumulatieve frequenties/percentages (% het meest gekozen).
- Steile lijn: klassen hebben een hoge frequentie
- Afgevlakte lijn: er komt weinig frequentie bij bij de klassen.
3
, HC1.b Beschrijvende Statistiek - Centrummaten - paragraaf 3.1
- Stap 1: beschrijvende statistiek + frequentietabel (kan ook in grafiek).
- Stap 2: berekenen van statistische maten (samenvatten van alle waarden in een
paar karakteristieke getallen).
Statische maten
- Centrummaten (Indicatie van het middelpunt/zwaartepunt van de gegevens).
● Modus (meest voorkomende waarde → alle meetschalen).
● Mediaan (middelste waarde → minimaal ordinale schaal).
● Rekenkundig gemiddelde (zwaartepunt → intervalschaal/ratioschaal).
- Spreidingsmaten (HC2 → Verdeling van de gegevens).
- Scheefheidsmaten (HC2 → Symmetrisch of niet).
Modus
- Mo.
- Meest voorkomend.
- Kan gebruikt worden bij kwantitatieve en kwalitatieve gegevens.
Mediaan
- Md.
- Middelste waarde.
- 1. Zet de gegevens op volgorde (ordinale schaal) → 2. Bepaal de middelste
waarneming. → 3. Md = waarde van de middelste waarneming.
- Middelste =
Mediaan bij klassen
- Formule =
Rekenkundig gemiddelde
- Zwaartepunt.
- Meetschaal: interval of ratio.
4