2 Frequentieverdelingen
Onderzoek levert gewoonlijk zeer grote hoeveelheid ongeordende, dus onoverzichtelijke,
gegevens (=data) op, bedoeling is datareductie of snelle informatieoverdracht d.m.v.
figuren te bekomen
Verdeling / distributie: opsomming in tabel of grafiek van al voorkomende uitslagen
waarin aangegeven is hoe vaak elke uitslag voorkomt frequentie van voorkomen, m.a.w.
frequentieverdeling: verdeling van waarnemingsgetallen over verschillende mogelijke
uitkomsten weergegeven in frequentietabel en/of grafiek
2.1 Frequentietabel
Tabel die frequentieverdeling van variabele weergeeft frequentietabel, bevat per
meetwaarde informatie over absolute en relatieve frequentie. Voor variabelen van
ordinaal meetniveau of hoger worden meetwaarden in oplopende volgorde gerangschikt
Frequentietabel bevat rijen (horizontaal) en kolommen (verticaal) met velden (of cellen),
enkele richtlijnen i.v.m. opstellen van (frequentie)tabel:
- tabel moet overzichtelijker zijn dan de lijst aparte waarnemingen
- bij voorkeur indelen naar maximum drie gezichtsvelden
- getallen met meer dan 3 cijfers worden afgerond (of uitgedrukt in miljoenen,
duizendtallen, duizendste van eenheden, …)
1
- internationale afspraken voor gebruik van tekens (APA-standaard)
Voorbeeld :
leeftijd turfstaat fi rel.fi (%) Fk Fg rel. Fk rel. Fg
ΣF ΣF- fi
17 II 2 8,3 2 24 26 24 8,3 100
18 IIII IIII 9 37,5 11 22 33 24 45,8 91,7
19 IIII II 7 29,2 18 13 31 24 75,0 54,2
20 III 3 12,5 21 6 27 24 87,5 25,0
21 I 1 4,2 22 3 25 24 91,7 12,5
22 II 2 8,3 24 2 26 24 100 8,3
totaal 24 100,0 0 24 24 0,0
Deze tabel dient ook als voorbeeld voor absolute, relatieve en cumulatieve frequentie
2.1.1 De absolute frequentie
Totaal aantal waarnemingen, populatiegrootte (N) of steekproefgrootte (n), wordt telkens
vermeld onderaan de tabel
Absolute frequentie (fi): aantal keer dat kenmerk (Xi) wordt waargenomen (geteld)
In symbolen kunnen we dus besluiten:
𝑛
∑ 𝑓𝑖 = 𝑛
𝑖=1
waarbij n= totaal aantal waarnemingen
= 1, 2, … n
1
,= de absolute frequentie waarmee elke uitkomst Xi voorkomt
Om databestanden digitaal op te slaan wordt er gebruik gemaakt van Officeprogramma
Access, hierbij moet rekening gehouden worden dat opbouw van databestand
gebruiksmogelijkheden zal bepalen, programma werkt in 3 stappen: selecteren uit
databestand, sorteren van selectie en tellen van aantal dat aan bepaalde voorwaarde voldoet
Voorbeeld: Klantenbestand van een bedrijf:
Mercator : naam van de klant
123456: code voor bvb type klant en soort product waarin interesse, wijze van betaling,…
9000: postcode
Gent: gemeente
Henleykaai 84: adres
09.267.11.00: telefoonnummer
12-08-2009: datum laatste bestelbon
Opstellen van gerichte mailing bvb aan alle Gentse scholen die klant zijn en voorbije jaar
geen enkele bestelling plaatsten. Eerst wordt er geselecteerd op kenmerken “postcode” en
“code scholen”, dan gesorteerd op kenmerk “datum laatste bestelbon” (aflopend) en
tenslotte telt men scholen die sinds 1 jaar geen bestelling plaatsten (datum<>2007)
2.1.2 De relatieve frequentie
Relatieve frequentie bekomt men door absolute frequentie te delen door totaal aantal
waarnemingen of totale frequentie (n), uitdrukken in decimalen of in procenten
𝑓𝑖 𝑓𝑖
𝑟𝑒𝑙. 𝑓𝑖 = 𝑛
= 𝑛 (in procenten moet men nog . 100%)
∑ 𝑓𝑖
𝑖=1
Dus ∑ 𝑟𝑒𝑙. 𝑓𝑖 = 1 𝑜𝑓 100%
2.1.3 De cumulatieve frequentie
Indien er tussen waarnemingsgetallen bepaalde volgorde bestaat: interessant om inzicht te
krijgen in aantal waarnemingen dat kleiner of groter is dan bepaalde waarde, cumulatieve
frequentie vanaf hoogste waarde Fg geeft aantal waarnemingen dat groter dan of gelijk
is aan bepaalde grenswaarde of: Hoeveel waarden zijn in schaalpunt of erboven gelegen?
Cumulatieve frequentie vanaf kleinste waarde Fk geeft aantal waarnemingen dat
kleiner dan of gelijk is aan bepaalde grenswaarde of: Hoeveel waarden zijn in schaalpunt
of eronder gelegen?
Relatieve cumulatieve frequenties worden op analoge manier bepaald als relatieve
frequenties
Som van cumulatieve frequenties is dan : ∑ 𝐹 = 𝐹𝑘 + 𝐹𝑔 = 𝑛 + 𝑓𝑛
2.2 Classificeren van waarnemingen
2
, Om overzichtelijkheid van (grote) reeks waarnemingsgegevens te bevorderen gaat men
meetwaarden classificeren (of groeperen of categoriseren)
Classificeren: samennemen van naburige schaalpunten van variabele in beperkt aantal
klassen met als doel datareductie
3 manieren:
- zoals het de onderzoeker uitkomt
- zó dat elke klasse evenveel van oorspronkelijke schaalpunten bevat (elke klasse is even
breed)
- zó dat iedere klasse bepaald aantal - gelijk of ongelijk - waarnemingen bevat aanbevelingen
voor classificeren van waarnemingen:
o Aantal klassen ligt bij voorkeur tussen 5 en 20; vuistregel is ongeveer 𝑛 klassen te
nemen
o men streeft naar gelijk klasseninterval (gelijke klassenbreedte)
o vermijdt lege klassen of klassen met weinig waarnemingen (frequentieverdelingen
« met een staart »), maak dan gebruik van open klassen aan één of beide uiteinden
o klassengrenzen mogen elkaar niet overlappen en moeten aaneensluiten (categorisch
systeem!)
Stap voor stap: aantal waarnemingen of meetresultaten = n
1ste stap: tellen van aantal meetwaarden door te turven geeft frequentie van elke mogelijke
waarnemingsuitkomst, stellen hoogste meetwaarde vast (Xmax) en laagste (Xmin)
2de stap: Schrappen van uitbijters (sterke afwijkingen t.o.v. rest van meetresultaten) aan
beide uiteinden
3de stap: Bepalen van variatiebreedte (range): R = Xmax - Xmin
𝑅
4de stap: Bepalen van klassenbreedte of interval: i = √𝑛
als n<40 dan R/6; als n>400 dan
R/20
𝑏𝑒𝑛𝑒𝑑𝑒𝑛𝑔𝑟𝑒𝑛𝑠(𝑏)+𝑏𝑜𝑣𝑒𝑛𝑔𝑟𝑒𝑛𝑠(𝐵)
mi = 2
Voorbeeld: Lichaamsgewicht van 61 studenten :
7 7 5 6 7 6 5 6 6 5 7 8 6 6 6 8 6 5
53 87 62 1 0 8 8 6 9 7 2 3 8 1 2 0 4 9 7 0 1
4 6 6 6 7 5 6 8 6 6 6 6 6 6 6 8 5 5
71 78 8 2 9 9 6 6 3 0 6 1 7 8 2 6 7 0 9 8
10 8 5 6 6 7 6 6 6 7 7 6 6 8 5 6 8 7 6
67 3 3 7 4 6 2 9 7 5 6 3 5 4 0 3 6 7 3 6
Aantal klassen: 61 = 8
Range: R = 103 – 48 = 55
zonder uitbijter 103: R = 87 – 48 = 39
3
Onderzoek levert gewoonlijk zeer grote hoeveelheid ongeordende, dus onoverzichtelijke,
gegevens (=data) op, bedoeling is datareductie of snelle informatieoverdracht d.m.v.
figuren te bekomen
Verdeling / distributie: opsomming in tabel of grafiek van al voorkomende uitslagen
waarin aangegeven is hoe vaak elke uitslag voorkomt frequentie van voorkomen, m.a.w.
frequentieverdeling: verdeling van waarnemingsgetallen over verschillende mogelijke
uitkomsten weergegeven in frequentietabel en/of grafiek
2.1 Frequentietabel
Tabel die frequentieverdeling van variabele weergeeft frequentietabel, bevat per
meetwaarde informatie over absolute en relatieve frequentie. Voor variabelen van
ordinaal meetniveau of hoger worden meetwaarden in oplopende volgorde gerangschikt
Frequentietabel bevat rijen (horizontaal) en kolommen (verticaal) met velden (of cellen),
enkele richtlijnen i.v.m. opstellen van (frequentie)tabel:
- tabel moet overzichtelijker zijn dan de lijst aparte waarnemingen
- bij voorkeur indelen naar maximum drie gezichtsvelden
- getallen met meer dan 3 cijfers worden afgerond (of uitgedrukt in miljoenen,
duizendtallen, duizendste van eenheden, …)
1
- internationale afspraken voor gebruik van tekens (APA-standaard)
Voorbeeld :
leeftijd turfstaat fi rel.fi (%) Fk Fg rel. Fk rel. Fg
ΣF ΣF- fi
17 II 2 8,3 2 24 26 24 8,3 100
18 IIII IIII 9 37,5 11 22 33 24 45,8 91,7
19 IIII II 7 29,2 18 13 31 24 75,0 54,2
20 III 3 12,5 21 6 27 24 87,5 25,0
21 I 1 4,2 22 3 25 24 91,7 12,5
22 II 2 8,3 24 2 26 24 100 8,3
totaal 24 100,0 0 24 24 0,0
Deze tabel dient ook als voorbeeld voor absolute, relatieve en cumulatieve frequentie
2.1.1 De absolute frequentie
Totaal aantal waarnemingen, populatiegrootte (N) of steekproefgrootte (n), wordt telkens
vermeld onderaan de tabel
Absolute frequentie (fi): aantal keer dat kenmerk (Xi) wordt waargenomen (geteld)
In symbolen kunnen we dus besluiten:
𝑛
∑ 𝑓𝑖 = 𝑛
𝑖=1
waarbij n= totaal aantal waarnemingen
= 1, 2, … n
1
,= de absolute frequentie waarmee elke uitkomst Xi voorkomt
Om databestanden digitaal op te slaan wordt er gebruik gemaakt van Officeprogramma
Access, hierbij moet rekening gehouden worden dat opbouw van databestand
gebruiksmogelijkheden zal bepalen, programma werkt in 3 stappen: selecteren uit
databestand, sorteren van selectie en tellen van aantal dat aan bepaalde voorwaarde voldoet
Voorbeeld: Klantenbestand van een bedrijf:
Mercator : naam van de klant
123456: code voor bvb type klant en soort product waarin interesse, wijze van betaling,…
9000: postcode
Gent: gemeente
Henleykaai 84: adres
09.267.11.00: telefoonnummer
12-08-2009: datum laatste bestelbon
Opstellen van gerichte mailing bvb aan alle Gentse scholen die klant zijn en voorbije jaar
geen enkele bestelling plaatsten. Eerst wordt er geselecteerd op kenmerken “postcode” en
“code scholen”, dan gesorteerd op kenmerk “datum laatste bestelbon” (aflopend) en
tenslotte telt men scholen die sinds 1 jaar geen bestelling plaatsten (datum<>2007)
2.1.2 De relatieve frequentie
Relatieve frequentie bekomt men door absolute frequentie te delen door totaal aantal
waarnemingen of totale frequentie (n), uitdrukken in decimalen of in procenten
𝑓𝑖 𝑓𝑖
𝑟𝑒𝑙. 𝑓𝑖 = 𝑛
= 𝑛 (in procenten moet men nog . 100%)
∑ 𝑓𝑖
𝑖=1
Dus ∑ 𝑟𝑒𝑙. 𝑓𝑖 = 1 𝑜𝑓 100%
2.1.3 De cumulatieve frequentie
Indien er tussen waarnemingsgetallen bepaalde volgorde bestaat: interessant om inzicht te
krijgen in aantal waarnemingen dat kleiner of groter is dan bepaalde waarde, cumulatieve
frequentie vanaf hoogste waarde Fg geeft aantal waarnemingen dat groter dan of gelijk
is aan bepaalde grenswaarde of: Hoeveel waarden zijn in schaalpunt of erboven gelegen?
Cumulatieve frequentie vanaf kleinste waarde Fk geeft aantal waarnemingen dat
kleiner dan of gelijk is aan bepaalde grenswaarde of: Hoeveel waarden zijn in schaalpunt
of eronder gelegen?
Relatieve cumulatieve frequenties worden op analoge manier bepaald als relatieve
frequenties
Som van cumulatieve frequenties is dan : ∑ 𝐹 = 𝐹𝑘 + 𝐹𝑔 = 𝑛 + 𝑓𝑛
2.2 Classificeren van waarnemingen
2
, Om overzichtelijkheid van (grote) reeks waarnemingsgegevens te bevorderen gaat men
meetwaarden classificeren (of groeperen of categoriseren)
Classificeren: samennemen van naburige schaalpunten van variabele in beperkt aantal
klassen met als doel datareductie
3 manieren:
- zoals het de onderzoeker uitkomt
- zó dat elke klasse evenveel van oorspronkelijke schaalpunten bevat (elke klasse is even
breed)
- zó dat iedere klasse bepaald aantal - gelijk of ongelijk - waarnemingen bevat aanbevelingen
voor classificeren van waarnemingen:
o Aantal klassen ligt bij voorkeur tussen 5 en 20; vuistregel is ongeveer 𝑛 klassen te
nemen
o men streeft naar gelijk klasseninterval (gelijke klassenbreedte)
o vermijdt lege klassen of klassen met weinig waarnemingen (frequentieverdelingen
« met een staart »), maak dan gebruik van open klassen aan één of beide uiteinden
o klassengrenzen mogen elkaar niet overlappen en moeten aaneensluiten (categorisch
systeem!)
Stap voor stap: aantal waarnemingen of meetresultaten = n
1ste stap: tellen van aantal meetwaarden door te turven geeft frequentie van elke mogelijke
waarnemingsuitkomst, stellen hoogste meetwaarde vast (Xmax) en laagste (Xmin)
2de stap: Schrappen van uitbijters (sterke afwijkingen t.o.v. rest van meetresultaten) aan
beide uiteinden
3de stap: Bepalen van variatiebreedte (range): R = Xmax - Xmin
𝑅
4de stap: Bepalen van klassenbreedte of interval: i = √𝑛
als n<40 dan R/6; als n>400 dan
R/20
𝑏𝑒𝑛𝑒𝑑𝑒𝑛𝑔𝑟𝑒𝑛𝑠(𝑏)+𝑏𝑜𝑣𝑒𝑛𝑔𝑟𝑒𝑛𝑠(𝐵)
mi = 2
Voorbeeld: Lichaamsgewicht van 61 studenten :
7 7 5 6 7 6 5 6 6 5 7 8 6 6 6 8 6 5
53 87 62 1 0 8 8 6 9 7 2 3 8 1 2 0 4 9 7 0 1
4 6 6 6 7 5 6 8 6 6 6 6 6 6 6 8 5 5
71 78 8 2 9 9 6 6 3 0 6 1 7 8 2 6 7 0 9 8
10 8 5 6 6 7 6 6 6 7 7 6 6 8 5 6 8 7 6
67 3 3 7 4 6 2 9 7 5 6 3 5 4 0 3 6 7 3 6
Aantal klassen: 61 = 8
Range: R = 103 – 48 = 55
zonder uitbijter 103: R = 87 – 48 = 39
3