STATISTIEK VOOR PEDAGOGEN
HOOFDSTUK 1: ÉÉN VARIABELE
HOOFDSTUK 1: VERDELING VAN GEGEVENS (ÉÉN VARIABELE)
1. HET GEGEVENSROOSTER
Voorbeeld van een gegevensrooster
Variabelen worden steeds voorgesteld door
een schuingedrukte hoofdletter (bijvoorbeeld
X)
Toevalsvariabelen zijn variabelen waarbij de
waarden realisaties zijn van het toevalsproces
2. TYPES VARIABELEN
Er zijn 3 verschillende types van variabelen:
1. Onafhankelijke en afhankelijke variabelen
2. Discrete en continue variabelen
3. Kwalitatieve en kwantitatieve variabelen
2.1 Onafhankelijke en afhankelijke variabelen
Voorbeeld van een afhankelijke
variabele: de punten die een student
behaald heeft
Voorbeeld van een onafhankelijke
variabele: de provincie waar een
student woont
X voorspellers
Y uitkomstvariabelen waarin je
geïnteresseerd bent
1
,2.2 Discrete en continue variabelen
Continue variabele: tussen elke twee waarden kan een derde waarde gevonden worden (bij reële
getallen) bv tussen 1 en 2 ligt ook 1,1, 1,5, 1,9, … bv een IQ, examenpunt, lengte, …
Discrete variabele: natuurlijke getallen bv 1, 2, 3, … aantal uren wiskunde per week in het
middelbaar
Continuïteit is een theoretische veronderstelling. Wanneer wordt iets als continue beschouwd
Als het een groot aantal waarden aanneemt
Het een manifestatie is van onderliggende continue variabele
Wanneer wordt iets als discreet beschouwd
De variabelen nemen slechts een beperkt aantal waarden aan
Discrete variabele die:
Twee waarden aaneemt = dichotome variabele
Drie waarden aanneemt = trichotome variabele
Drie of meer waarden aanneemt = polytome variabele
2.3 Kwantitatief vs. Kwalitatief
Kwalitatieve variabele = de getallen verwijzen slechts naar gelijkheden en ongelijkheden tussen de
onderzoekselementen (mbt gemeten kenmerk) getal is een naam of label bv een provincie rekenen is
hier NIET zinvol
Kwantitatieve variabele = getallen zijn toegekend zodanig dat de afstanden tussen de getallen
overeenkomen met afstanden tussen onderzoekselementen (mbt gemeten kenmerk), verschil tussen deze
getallen zegt iets (bv het verschil tussen IQ, 110 is beter dan 105) rekenen is hier WEL zinvol
Speciaal type: ordinale variabelen = getallen kunnen naar grootte vergeleken worden (volgorde) MAAR niet
zinvol om mee te rekenen bv punt van een examen: cijfer zegt iets maar niet zinvol om mee te gaan rekenen
= Hiërachie
HET BESCHRIJVEN VAN ÉÉN VARIABELE
1. VIA TABELLEN
3 soorten tabellen:
Frequentietabellen
2
, Kwalitatieve gegevens
Stamdiagrammen
1.1 Frequentietabellen:
Ruwe gegevens:
geeft niet echt een goed idee van wat het gemiddelde,
de spreiding en de verdeling van de gegevens zijn
Frequentie van een gegeven op X is het aantal keer dat
dit gegeven voorkomt genoteerd als f(X)
Bv: f(X=77) = 3 het gegeven 77 komt 3 keer voor
Frequentietabel:
deze tabel op zich zegt nog niet heel veel
Relatieve frequenties:
Relatieve frequenties of proporties zijn de frequenties gedeeld door het aantal observaties genoteerd als
p(X)
Bv: p(X=77) = 3 : 30 = 0,1 of 10% score 77 komt 3 keer voor en in totaal hebben 30 studenten de toets
afgelegd
Relatieve frequentietabel:
hoeveel van de 30 studenten hebben by
score 96 gehaald = 1 van de 30 studenten
Cumulatieve frequenties:
3
, Cumulatieve frequentie = geeft aan hoe vaak een bepaalde uitkomst èn alle uitkomsten met een kleinere
waarde waargenomen zijn genoteerd als F(X)
Bv: F(X=6) = 20 20 scores zijn gelijk aan of lager dan 20 getal van hoogste waarde moet altijd hetzelfde
zijn als van het totale aantal
Relatieve cumulatieve frequentie:
Relatieve cumulatieve frequentie of cumulatieve proportie = cumulatieve frequentie gedeeld door het aantal
observaties genoteerd als P(X)
Bv: P(X=77) = 14/30 = 0,47 of 47% 47% van de groep heeft een score gelijk aan of lager dan 77 behaald
Relatieve cumulatieve frequentietabel:
1.2 Kwalitatieve gegevens
gegevens waarbij het geen zin heeft om er mee te gaan rekenen zoals iemand zijn woonplaats
2. VIA FIGUREN
2.1 Stamdiagrammen
mix van een tabel en een figuur waarbij de stam
het tiental weergeeft en de loof de eenheid
Het eerste deel van de loof geeft de eenheden van 0-
4 weer en het tweede deel van de loof geeft de
eenheden van 5-9 weer
3. BESCHRIJVEN AAN DE HAND VAN KENGETALLEN
3.1 Percentielen
Percentiel = een score op X waaronder ten minste een specifiek % van de scores gesitueerd is
Bv: 10e percentiel komt overee met score 8 = ten minste 10% van de scores is kleiner dan of gelijk aan 8
2 manieren om percentielen te berekenen:
4
HOOFDSTUK 1: ÉÉN VARIABELE
HOOFDSTUK 1: VERDELING VAN GEGEVENS (ÉÉN VARIABELE)
1. HET GEGEVENSROOSTER
Voorbeeld van een gegevensrooster
Variabelen worden steeds voorgesteld door
een schuingedrukte hoofdletter (bijvoorbeeld
X)
Toevalsvariabelen zijn variabelen waarbij de
waarden realisaties zijn van het toevalsproces
2. TYPES VARIABELEN
Er zijn 3 verschillende types van variabelen:
1. Onafhankelijke en afhankelijke variabelen
2. Discrete en continue variabelen
3. Kwalitatieve en kwantitatieve variabelen
2.1 Onafhankelijke en afhankelijke variabelen
Voorbeeld van een afhankelijke
variabele: de punten die een student
behaald heeft
Voorbeeld van een onafhankelijke
variabele: de provincie waar een
student woont
X voorspellers
Y uitkomstvariabelen waarin je
geïnteresseerd bent
1
,2.2 Discrete en continue variabelen
Continue variabele: tussen elke twee waarden kan een derde waarde gevonden worden (bij reële
getallen) bv tussen 1 en 2 ligt ook 1,1, 1,5, 1,9, … bv een IQ, examenpunt, lengte, …
Discrete variabele: natuurlijke getallen bv 1, 2, 3, … aantal uren wiskunde per week in het
middelbaar
Continuïteit is een theoretische veronderstelling. Wanneer wordt iets als continue beschouwd
Als het een groot aantal waarden aanneemt
Het een manifestatie is van onderliggende continue variabele
Wanneer wordt iets als discreet beschouwd
De variabelen nemen slechts een beperkt aantal waarden aan
Discrete variabele die:
Twee waarden aaneemt = dichotome variabele
Drie waarden aanneemt = trichotome variabele
Drie of meer waarden aanneemt = polytome variabele
2.3 Kwantitatief vs. Kwalitatief
Kwalitatieve variabele = de getallen verwijzen slechts naar gelijkheden en ongelijkheden tussen de
onderzoekselementen (mbt gemeten kenmerk) getal is een naam of label bv een provincie rekenen is
hier NIET zinvol
Kwantitatieve variabele = getallen zijn toegekend zodanig dat de afstanden tussen de getallen
overeenkomen met afstanden tussen onderzoekselementen (mbt gemeten kenmerk), verschil tussen deze
getallen zegt iets (bv het verschil tussen IQ, 110 is beter dan 105) rekenen is hier WEL zinvol
Speciaal type: ordinale variabelen = getallen kunnen naar grootte vergeleken worden (volgorde) MAAR niet
zinvol om mee te rekenen bv punt van een examen: cijfer zegt iets maar niet zinvol om mee te gaan rekenen
= Hiërachie
HET BESCHRIJVEN VAN ÉÉN VARIABELE
1. VIA TABELLEN
3 soorten tabellen:
Frequentietabellen
2
, Kwalitatieve gegevens
Stamdiagrammen
1.1 Frequentietabellen:
Ruwe gegevens:
geeft niet echt een goed idee van wat het gemiddelde,
de spreiding en de verdeling van de gegevens zijn
Frequentie van een gegeven op X is het aantal keer dat
dit gegeven voorkomt genoteerd als f(X)
Bv: f(X=77) = 3 het gegeven 77 komt 3 keer voor
Frequentietabel:
deze tabel op zich zegt nog niet heel veel
Relatieve frequenties:
Relatieve frequenties of proporties zijn de frequenties gedeeld door het aantal observaties genoteerd als
p(X)
Bv: p(X=77) = 3 : 30 = 0,1 of 10% score 77 komt 3 keer voor en in totaal hebben 30 studenten de toets
afgelegd
Relatieve frequentietabel:
hoeveel van de 30 studenten hebben by
score 96 gehaald = 1 van de 30 studenten
Cumulatieve frequenties:
3
, Cumulatieve frequentie = geeft aan hoe vaak een bepaalde uitkomst èn alle uitkomsten met een kleinere
waarde waargenomen zijn genoteerd als F(X)
Bv: F(X=6) = 20 20 scores zijn gelijk aan of lager dan 20 getal van hoogste waarde moet altijd hetzelfde
zijn als van het totale aantal
Relatieve cumulatieve frequentie:
Relatieve cumulatieve frequentie of cumulatieve proportie = cumulatieve frequentie gedeeld door het aantal
observaties genoteerd als P(X)
Bv: P(X=77) = 14/30 = 0,47 of 47% 47% van de groep heeft een score gelijk aan of lager dan 77 behaald
Relatieve cumulatieve frequentietabel:
1.2 Kwalitatieve gegevens
gegevens waarbij het geen zin heeft om er mee te gaan rekenen zoals iemand zijn woonplaats
2. VIA FIGUREN
2.1 Stamdiagrammen
mix van een tabel en een figuur waarbij de stam
het tiental weergeeft en de loof de eenheid
Het eerste deel van de loof geeft de eenheden van 0-
4 weer en het tweede deel van de loof geeft de
eenheden van 5-9 weer
3. BESCHRIJVEN AAN DE HAND VAN KENGETALLEN
3.1 Percentielen
Percentiel = een score op X waaronder ten minste een specifiek % van de scores gesitueerd is
Bv: 10e percentiel komt overee met score 8 = ten minste 10% van de scores is kleiner dan of gelijk aan 8
2 manieren om percentielen te berekenen:
4