1. Inleiding
1.1 Soorten onderzoek
- Beschrijvende statistiek: gegevens ordenen en samenvatten
- Kansberekening: kans op bepaalde gebeurtenis bepalen
- Verklarende statistiek: bepaalde verwachtingen toetsen
1.2 Fasen onderzoek
- Ontwerpen -> verzamelen -> analyseren -> evalueren
• Focus van dit vak = Analyseren
Kwalitatief of kwantitatief onderzoek
- Kwantitatief (onderwerp van deze cursus)
• Je maakt een samenvatting van verzamelde gegevens (steekproef)
• Je toetst een aantal verwachtingen over de populatie (hypothesen)
• Keuze van de geschikte statistische methode hangt af van
verschillende factoren (meetniveau!)
• Doel is om je conclusie te verbreden naar de populatie (kansen)
=> vraag die altijd terugkomt: Zijn gevonden resultaten toevallig of niet?
- Kwalitatief
• Geen cijfermatige gegevens
• Als aanvulling op kwantitatief onderzoek
2. Overzicht cursus
Significantie = Als het resultaat van wetenschappelijk onderzoek 'statistisch
significant' is, wil dat zeggen dat verantwoorde conclusies te trekken zijn.
Overzicht cursus:
1
, Hfdst. 2 Beschrijvende statistiek – één variabele
Één variabele = kenmerk dat men gaat meten bij objecten (personen/dieren).
- Bv levensduur: hoe lang gaat lamp x mee voor het stuk gaat?
- Uitkomst/ resultaat steeds anders -> “variabel”
1. Meetniveau’s
Meetniveau = wat is de aard van je variabelen (metingen)
- Bepaalt welke statistische methode toepasbaar zijn
Soorten:
1. Nominale meetniveau: laagste, kwalitatieve meetschaal (vb. woonplaats)
• Metingen bestaan uit losse categorieën (kenmerken)
• Niets “ertussenin”, discreet (beperkt # waarden die mogelijk zijn)
• Je kan er niet mee rekenen (cijfers = codes bv ZIP)
• Frequentie/ percentages berekenen kan wel
=> Voor statistiek: liefst ook andere gegevens verzamelen dan nominale.
Speciale nominale gegevens:
- Dichotoom: slechts 2 mogelijkheden (vb. succes/faling)
- Dummy’s: lijst met antwoordmogelijkheden (vb. enquête hobby’s)
• dummy = 1 (aangevinkt) / 0 (niet aangevinkt)
• elke antwoordmogelijkheid wordt 1 of 0 bepaald
2. Ordinale meetniveau: tweede kwalitatieve meetschaal (vb. salarisschaal)
• nominaal + rangorde (logische volgorde)
• je kan er nog steeds niet mee rekenen (cijfers = codering)
• je kan wel midden bepalen van gerangschikte gegevens
Speciale ordinale gegevens:
- Likert-items: mening over een bepaald onderwerp
• keuze van 1 (= helemaal oneens) tot 7 (= helemaal eens)
▪ rekenen kan hier eig niet mee bcs 5 kan voor verschillende
mensen andere waarden hebben!
• in praktijk toch scores optellen, uitmiddelen, …
3. Interval meetniveau: laagste kwantitatieve meetschaal (vb. tijd op klok)
• getalwaarden (je kan ermee rekenen)
• geen natuurlijk nulpunt! (verhoudingen niet zinvol)
▪ bv. 4 uur is niet dubbel zo laat als 2 uur
• ordinaal + gelijke intervallen (‘afstanden’) tussen waarden
• discreet maar meestal continu (‘oneindig’ veel mogelijke waarden)
▪ bv tussen 1 minuut, zitten nog seconde, enz
2
,Speciale intervalgeschaalde gegevens:
- Likertschaal: combinatie (optellen, gemiddelde) van Likert-items
• gecombineerde variabele heeft meer mogelijke waarden
• betekenisvol? niet eender wat combineren!
4. Ratio: hoogste, kwantitatieve meetschaal (vb. # werkuren, inkomen)
• interval + betekenisvolle verhoudingen (vb. ‘dubbel zoveel’)
• er is natuurlijk nulpunt aanwezig
=> Interval en ratio = metrisch (hebben beide meeteenheid)
Let op: de meetschaal kan veranderen
- bv. Leeftijd = ratiogeschaald
• soms in onderzoek: in leeftijdscategorieën opdelen (-25;25-50;50+)
• nu = ordinaal
▪ bcs kent oorspronkelijke/ echte leeftijd niet meer, waardoor:
▪ je niet kan zeggen dat de leeftijd tussen persoon x dubbel zo
groot is als persoon y.
Overzicht:
Oefening: opgave -> oplossing
- en discreet: bcs je kan geen halve persoon in contactbubbel hebben
Extra oefeningen in boek
Kengetallen= een getal dat een eigenschap van een gegevensverzameling
(dataset) samenvat
3
, 2. Frequentieverdelingen
Voorbeeld frequentietabel van
Spaanse wijnen
- Frequentie = aantal van
bepaalde oordeel
- Percentage = frequentie t.o.v.
het totaal
=> Percentage zegt meer dan de
frequentie, aangezien deze vergelijkt
met totaliteit
- Missing values = oordeel
ontbreekt
• Geven vertekend beeld
bij percentages
- Drm: kolom “Valid percent”
• Frequentie t.o.v. total
zonder missings
Frequentietabel is oké, maar grafiek is nog overzichtelijker!
3. Grafieken van één variabele
= in één oogopslag een overzicht van een variabele
- belangrijk om juiste grafiekkeuze te maken:
• Wat is het doel van de grafiek?
• Wat is het meetniveau van je variabele?
Soorten grafieken:
1. Cirkeldiagram
• Taartpunten geven idee over verhouding tussen categorieën
▪ grootste punt is voor categorie met grootste frequentie
• Geschikt voor laag meetniveau en slechts enkele categorieën
2. Staafdiagram
• Per waarde een staafje, hoogte = (relatieve) frequentie
▪ waarde met hoogste staafje komt meeste voor
• Geschikt voor laag meetniveau of hoog meetniveau met beperkt
aantal waarden (bv. aantal kinderen per gezin)
4