STATISTIEK
,1 Samenvatten en beschrijven
Exploratief en inferentieel onderzoek
• Exploratief onderzoek: doel is de werkelijkheid verkennen om daarin wetmatigheden te ontdekken →
inductief
o Wat is er aan de hand? (Beschrijvende statistiek)
o Verzamelen, classificeren en presenteren van data
o Samenvatten van uitkomsten → details gaan verloren maar geeft overzicht en inzicht
• Inferentieel onderzoek: toetst of wetenschappelijke hypothesen en theorieën in overeenstemming zijn met
de werkelijkheid
o Klopt mijn verklaring? (Inferentiële statistiek)
o Toetsen en conclusies trekken
o Kwantitatieve uitspraken van populatie op basis van uitkomsten steekproefonderzoek
→ Vullen elkaar aan: wetmatigheden → wetenschappelijke theorie → hypothesen → worden getoetst op
houdbaarheid in inferentieel onderzoek
Empirisch wetenschappelijk onderzoek
• Goed onderzoek begint bij goede vraagstelling
• Dataverzameling
o Data: feiten die verzameld worden om antwoord te kunnen geven op gestelde vragen
▪ Onderzoekseenheden
▪ Variabelen
Hypothetisch-deductieve model
toetsen
theorie werkhypothese onderzoeksopzet data verzameling data analyse
hypothese
Onderzoekseenheden
Bijvoorbeeld personen, dieren, ziekenhuizen, studenten, …
Variabelen
• Kenmerken van de onderzoekseenheid
• Meting van variabelen: waarde of getal toegekend aan een variabele
o Meetniveau:
▪ Kwalitatief: nominaal, ordinaal
▪ Kwantitatief: ratio, interval
Kwalitatieve variabelen
• Nominaal: bv. geslacht, afkomst, soort kanker, …
• Ordinaal: bv. sportprestatie (1ste, 2de, 3de), SES, opleiding, …
Kwantitatieve variabelen
• Interval: bv. temperatuur, intelligentie, … → geen absoluut nulpunt
• Ratio: bv. lengte, gewicht, bloeddruk, … → absoluut nulpunt
→ Kunnen gebruikt worden voor berekeningen → interval kan niet gebruikt worden voor verhoudingen
Tellen van uitkomsten
• Frequentietabel: nominaal, ordinaal
• Staafdiagram: nominaal, ordinaal
• Histogram: interval, ratio
• Klassenindeling: interval, ratio
• Tak-blad-grafiek: interval, ratio
1
,Frequentieverdeling
= verzameling van alle uitkomsten in een onderzoek en de met die uitkomsten geassocieerde frequenties
→ Kan grafisch weergegeven worden door frequentietabel of grafiek (bv. histogram, staafdiagram)
Frequentietabel
• Scores
• Frequenties
• Percentages
• Cumulatieve percentages
Staafdiagram
• Vat uitkomsten op variabele grafisch samen
• Waarden van variabelen op horizontale as
• Frequentie, proportie of percentage van bijhorende waarde op verticale as
• Staven raken elkaar niet: geeft aan dat er geen andere waarden mogelijk zijn
tussen 2 discrete waarden
o Geschikt voor (discrete) variabelen met beperkt aantal verschillende
waarden → te veel staven nefast voor overzichtelijkheid en informatieve waarde
o Geschikt voor uitkomsten op nominaal meetniveau (niet dwingende volgorde)
→ Te veel uitkomsten: histogram
Histogram
• Vat uitkomsten van continue variabele samen
• Uitkomsten ingedeeld door classificatie in intervallen van gelijke klassenbreedte
• Klassen op horizontale as
• Frequentie, proportie of percentage van uitkomsten in klasse op verticale as
• Kolommen grenzen aan elkaar om aan te geven dat variabele continu is
Classificeren: histogram maken
• Aantal klassen: n → n is het aantal waarnemingen (minimaal 4, maximaal 20)
• Klassenbreedte: range/aantal klassen → range is verschil tussen grootste en kleinste uitkomst
o Even breed
o Exclusief en uitputtend: iedere uitkomst slechts in 1 klasse, iedere uitkomst kan in klasse worden
ingedeeld
Classificeren: klasseindeling maken
• Range bepalen
• Aantal klassen bepalen
• Klassenbreedte bepalen
• Klassegrenzen bepalen
2
, Frequentieverdeling versus kansverdeling
Kansverdeling
• Als we klassenbreedte steeds kleiner maken en aantal waarnemingen onbeperkt laten toenemen ontstaat in
de limiet een vloeiende curve
o Normaalverdeling
o Student t-verdeling
o Chikwadraat-verdeling
o F-verdeling
Tak-blad-grafiek
• Bit = binary digit
• Software
• Boxplot
3
,1 Samenvatten en beschrijven
Exploratief en inferentieel onderzoek
• Exploratief onderzoek: doel is de werkelijkheid verkennen om daarin wetmatigheden te ontdekken →
inductief
o Wat is er aan de hand? (Beschrijvende statistiek)
o Verzamelen, classificeren en presenteren van data
o Samenvatten van uitkomsten → details gaan verloren maar geeft overzicht en inzicht
• Inferentieel onderzoek: toetst of wetenschappelijke hypothesen en theorieën in overeenstemming zijn met
de werkelijkheid
o Klopt mijn verklaring? (Inferentiële statistiek)
o Toetsen en conclusies trekken
o Kwantitatieve uitspraken van populatie op basis van uitkomsten steekproefonderzoek
→ Vullen elkaar aan: wetmatigheden → wetenschappelijke theorie → hypothesen → worden getoetst op
houdbaarheid in inferentieel onderzoek
Empirisch wetenschappelijk onderzoek
• Goed onderzoek begint bij goede vraagstelling
• Dataverzameling
o Data: feiten die verzameld worden om antwoord te kunnen geven op gestelde vragen
▪ Onderzoekseenheden
▪ Variabelen
Hypothetisch-deductieve model
toetsen
theorie werkhypothese onderzoeksopzet data verzameling data analyse
hypothese
Onderzoekseenheden
Bijvoorbeeld personen, dieren, ziekenhuizen, studenten, …
Variabelen
• Kenmerken van de onderzoekseenheid
• Meting van variabelen: waarde of getal toegekend aan een variabele
o Meetniveau:
▪ Kwalitatief: nominaal, ordinaal
▪ Kwantitatief: ratio, interval
Kwalitatieve variabelen
• Nominaal: bv. geslacht, afkomst, soort kanker, …
• Ordinaal: bv. sportprestatie (1ste, 2de, 3de), SES, opleiding, …
Kwantitatieve variabelen
• Interval: bv. temperatuur, intelligentie, … → geen absoluut nulpunt
• Ratio: bv. lengte, gewicht, bloeddruk, … → absoluut nulpunt
→ Kunnen gebruikt worden voor berekeningen → interval kan niet gebruikt worden voor verhoudingen
Tellen van uitkomsten
• Frequentietabel: nominaal, ordinaal
• Staafdiagram: nominaal, ordinaal
• Histogram: interval, ratio
• Klassenindeling: interval, ratio
• Tak-blad-grafiek: interval, ratio
1
,Frequentieverdeling
= verzameling van alle uitkomsten in een onderzoek en de met die uitkomsten geassocieerde frequenties
→ Kan grafisch weergegeven worden door frequentietabel of grafiek (bv. histogram, staafdiagram)
Frequentietabel
• Scores
• Frequenties
• Percentages
• Cumulatieve percentages
Staafdiagram
• Vat uitkomsten op variabele grafisch samen
• Waarden van variabelen op horizontale as
• Frequentie, proportie of percentage van bijhorende waarde op verticale as
• Staven raken elkaar niet: geeft aan dat er geen andere waarden mogelijk zijn
tussen 2 discrete waarden
o Geschikt voor (discrete) variabelen met beperkt aantal verschillende
waarden → te veel staven nefast voor overzichtelijkheid en informatieve waarde
o Geschikt voor uitkomsten op nominaal meetniveau (niet dwingende volgorde)
→ Te veel uitkomsten: histogram
Histogram
• Vat uitkomsten van continue variabele samen
• Uitkomsten ingedeeld door classificatie in intervallen van gelijke klassenbreedte
• Klassen op horizontale as
• Frequentie, proportie of percentage van uitkomsten in klasse op verticale as
• Kolommen grenzen aan elkaar om aan te geven dat variabele continu is
Classificeren: histogram maken
• Aantal klassen: n → n is het aantal waarnemingen (minimaal 4, maximaal 20)
• Klassenbreedte: range/aantal klassen → range is verschil tussen grootste en kleinste uitkomst
o Even breed
o Exclusief en uitputtend: iedere uitkomst slechts in 1 klasse, iedere uitkomst kan in klasse worden
ingedeeld
Classificeren: klasseindeling maken
• Range bepalen
• Aantal klassen bepalen
• Klassenbreedte bepalen
• Klassegrenzen bepalen
2
, Frequentieverdeling versus kansverdeling
Kansverdeling
• Als we klassenbreedte steeds kleiner maken en aantal waarnemingen onbeperkt laten toenemen ontstaat in
de limiet een vloeiende curve
o Normaalverdeling
o Student t-verdeling
o Chikwadraat-verdeling
o F-verdeling
Tak-blad-grafiek
• Bit = binary digit
• Software
• Boxplot
3