Statistiek I - Psychologie
DEEL 1: BESCHRIJVENDE STATISTIEK
STEEKPROEF
Hoofdstuk 2 en 3
Outliers!
Meetniveau!
Klassen
(interval)
Optelling (ordinaal)
:n
(interval)
(ordinaal)
Hoofdstuk 4
1
,UNIVARIATE (1 VARIABELE)
Hoofdstuk 2: visualiseren van data
Data overzichtelijker maken:
(1) Cirkeldiagram ( pie() )
• Voornamelijk nominaal meetniveau
• Absolute frequenties ( table() )
- Absolute frequentie van x is het aantal keer dat de waarde x in de steekproef
voorkomt
- Bv. het aantal mannen en vrouwen in een steekproef (variabele: geslacht)
• Absolute frequentieverdeling
- De absolute frequentieverdeling van X is een tabel met twee rijen waar de eerste rij
de mogelijke waarden van X weergeeft en de tweede rij de overeenkomstige absolute
frequenties.
- De steekproefgrootte (mannen + vrouwen) = aantal elementen in de steekproef
• Relatieve frequenties
- De relatieve frequentie van x is de absolute frequentie gedeeld door de
steekproefgrootte n
(2) Staafdiagram ( barplot() )
• Voornamelijk voor variabelen van nominaal of ordinaal meetniveau
• Relatieve frequenties waarbij de hoogte gelijk is aan de relatieve frequentie (breedte
vrij te kiezen zolang even breed, afstand tussen de rechthoeken moet dezelfde zijn)
• Kan ook adhv absolute frequenties
2
, (3) Histogram ( hist() )
• Histogram = data groeperen > klassen ( cut() ) of intervallen
• Gebruikersafhankelijk
• Gegroepeerde frequentieverdeling
- van een variabele X is een tabel met twee kolommen waar de eerste kolom de
klassen van X weergeeft en de tweede de overeenkomstige frequenties
• Klassenbreedte = b – a
• Relatieve frequenties = absolute frequenties : n
• Oppervlakte van de rechthoek = relatieve frequentie
• Hoogte rechthoek = relatieve frequentie : de breedte
• Aantal klassen bepalen volgens vuistregel =
Scheve verdeling:
Verschillen tussen staafdiagram en histogram:
• Bij een histogram raken de rechthoeken elkaar en kunnen de breedtes van rechthoeken verschillen
• Een staafdiagram wordt vooral gebruikt voor ordinale en nominale variabelen (omdat ze vaak
een beperkt aantal waarden hebben)
• Een histogram wordt vaak gebruikt voor interval- ratioschaal variabelen (door groot aantal waarden)
(4) Cumulatieve frequentiecurve
3
, Ongegroepeerde data
• Cumulatieve absolute frequentie F(x) = absolute frequenties optellen
• Cumulatieve relatieve frequentie ( ecdf () + plot () ) = relatieve frequenties optellen
• Cumulatieve frequenties ( cumsum() ) = “het aantal personen weergeven die
een bepaalde leeftijd hebben of jonger zijn”
• Cumulatieve frequentie van de oudste persoon = n
Gegroepeerde data
• Groepen leidt tot informatieverlies > rekenregel
• Cumulatieve absolute frequentie = aantal elementen in die klasse + het aantal
elementen in de lagere klassen
• Cumulatieve absolute gegroepeerde frequentieverdeling = de klassen weergeven +
de overeenkomstige cumulatieve absolute frequenties
• Rekenregel om cumulatieve frequentie te berekenen van een waarde die in een
interval ligt:
- Kijken wat de absolute frequentie is van de vorige klasse (35-40) = 71
- Kijken hoeveel waarden er liggen huidige interval (40-50) = 10 dus werken met
een breuk op 10 (hier 43, dus 3/10)
- Kijken hoeveel verschil er zit tussen cumulatieve frequentie eerste klasse en
tweede klasse 79 – 71 = 8
Hoofdstuk 3: samenvatten van data
4
DEEL 1: BESCHRIJVENDE STATISTIEK
STEEKPROEF
Hoofdstuk 2 en 3
Outliers!
Meetniveau!
Klassen
(interval)
Optelling (ordinaal)
:n
(interval)
(ordinaal)
Hoofdstuk 4
1
,UNIVARIATE (1 VARIABELE)
Hoofdstuk 2: visualiseren van data
Data overzichtelijker maken:
(1) Cirkeldiagram ( pie() )
• Voornamelijk nominaal meetniveau
• Absolute frequenties ( table() )
- Absolute frequentie van x is het aantal keer dat de waarde x in de steekproef
voorkomt
- Bv. het aantal mannen en vrouwen in een steekproef (variabele: geslacht)
• Absolute frequentieverdeling
- De absolute frequentieverdeling van X is een tabel met twee rijen waar de eerste rij
de mogelijke waarden van X weergeeft en de tweede rij de overeenkomstige absolute
frequenties.
- De steekproefgrootte (mannen + vrouwen) = aantal elementen in de steekproef
• Relatieve frequenties
- De relatieve frequentie van x is de absolute frequentie gedeeld door de
steekproefgrootte n
(2) Staafdiagram ( barplot() )
• Voornamelijk voor variabelen van nominaal of ordinaal meetniveau
• Relatieve frequenties waarbij de hoogte gelijk is aan de relatieve frequentie (breedte
vrij te kiezen zolang even breed, afstand tussen de rechthoeken moet dezelfde zijn)
• Kan ook adhv absolute frequenties
2
, (3) Histogram ( hist() )
• Histogram = data groeperen > klassen ( cut() ) of intervallen
• Gebruikersafhankelijk
• Gegroepeerde frequentieverdeling
- van een variabele X is een tabel met twee kolommen waar de eerste kolom de
klassen van X weergeeft en de tweede de overeenkomstige frequenties
• Klassenbreedte = b – a
• Relatieve frequenties = absolute frequenties : n
• Oppervlakte van de rechthoek = relatieve frequentie
• Hoogte rechthoek = relatieve frequentie : de breedte
• Aantal klassen bepalen volgens vuistregel =
Scheve verdeling:
Verschillen tussen staafdiagram en histogram:
• Bij een histogram raken de rechthoeken elkaar en kunnen de breedtes van rechthoeken verschillen
• Een staafdiagram wordt vooral gebruikt voor ordinale en nominale variabelen (omdat ze vaak
een beperkt aantal waarden hebben)
• Een histogram wordt vaak gebruikt voor interval- ratioschaal variabelen (door groot aantal waarden)
(4) Cumulatieve frequentiecurve
3
, Ongegroepeerde data
• Cumulatieve absolute frequentie F(x) = absolute frequenties optellen
• Cumulatieve relatieve frequentie ( ecdf () + plot () ) = relatieve frequenties optellen
• Cumulatieve frequenties ( cumsum() ) = “het aantal personen weergeven die
een bepaalde leeftijd hebben of jonger zijn”
• Cumulatieve frequentie van de oudste persoon = n
Gegroepeerde data
• Groepen leidt tot informatieverlies > rekenregel
• Cumulatieve absolute frequentie = aantal elementen in die klasse + het aantal
elementen in de lagere klassen
• Cumulatieve absolute gegroepeerde frequentieverdeling = de klassen weergeven +
de overeenkomstige cumulatieve absolute frequenties
• Rekenregel om cumulatieve frequentie te berekenen van een waarde die in een
interval ligt:
- Kijken wat de absolute frequentie is van de vorige klasse (35-40) = 71
- Kijken hoeveel waarden er liggen huidige interval (40-50) = 10 dus werken met
een breuk op 10 (hier 43, dus 3/10)
- Kijken hoeveel verschil er zit tussen cumulatieve frequentie eerste klasse en
tweede klasse 79 – 71 = 8
Hoofdstuk 3: samenvatten van data
4