2022-2023
moerman, dior
,HS 1 Kijken naar gegevens – Deel 1 Beschr
stat & kansrekenen
1 Gegevens verwerken
Populatie= Verzameling te bestuderen objecten in een onderzoek
Steekproef= Deelverzameling v. populatie
➔ # elementen= omvang n
Variabelen= Elementen die onderzocht worden (Prijs/oppervlakte/locatie v woning) -> na
verzamelen verwerkt in overzichtelijke datamatrix (excel)
1.1 Gegevens verzamelen?
1. Enquête: bevraging
2. Observationele studie: Vaststelling v economische/wetensch. Trends/evoluties.
Onderzoeker manipuleert onderzoek niet/ enkel constatatie.
Econometrisch (vb evolutie vastgoedprijzen)
→ Quality Assurance & Control= efficiëntie vn machines & personeel -> ISO-normen
3. Experimentele studies: Onderzoeker beïnvloed onderozeksobjecten -> “stuurt onderzoek”.
(testen vn nieuwe geneesmiddelen)-> ene groep pil geven, andere placebo.
Mogelijkse fouten bij onderzoek:
Experiment mislukt -> geen resultaten (geen res. ook soms een res.)
• Administratieve fouten bij verwerking datamatrix (verkeerde jaartal uitgefilterd)
1.2 Aandachtspunten
1. Operationele definitie: wie/wat wordt onderzocht? -> belangrijk v reproduceerbarheid
(=onderzoek moet kunnen worden herhaald) -> iem. Anders moet het kunnen herhalen.
2. Representatieve steekproef
= Onderzochte populatie zo goed mogelijk weerspiegelen
→ Daarom steekproef best !Aselect!= volledig willekeurig laten verlopen/ random -> elk
lid vd populatie evenveel kans om “gemeten” te worden.
3. Betrouwbaarheid
= Indien onderzoek identiek wordt herhaald: globaal gelijkaardige resultaten
• Omvang steekproef belangrijk
• Steekproef te klein -> onzekere resultaten/ te groot -> duurt te lang, populatie
“evolueert” (schaadt validiteit vd resultaten)→ weggesmeten tijd en geld
• Afhankelijk van variabiliteit v eigenschap (vb versch lengte) in populatie
-> hoe groter variabiliteit hoe moeilijker om betrouwbare conclusies te krijgen
1
, • Poweranalyse: Correcte steekproefgroote berekenen
Non-respons enquête -> geen antwoord op enquête (soms niet alle groepen bevraagd)
1.3 Variabelen
Kwalitatieve variabelen= Niet numeriek (eigenschappen, aanduidingen,merken,kleuren…)
Kwantitatieve variabelen= Numerieke waarden (getallen, prijzen,volumes,afstanden…)
• Discrete variabele= variabele die we kunnen tellen (gehele getallen)
➔ Aantallen (#)/ telbaar
• Continue variabele= kommagetallen
➔ Afstand tot school, tijdsduur v plaatsbeschr., volume v. garage…
1.4 4 schalen
1. Nominale schaal -> kwalitatieve kenmerken, eigsch. Zonder ordening, geen logische
rangschikking (kleur, merknaam,codenr…) → geen rekenkundige bewerkingen mogelijk.
2. Ordinale schaal -> Logische volgorde geen eenduidig verschil tss uitkomsten (FIFA-ranking, #
Michelin-sterren)
→ In enquêtes veel gebr: Likert-schaal (mogen niet gebr worden in rekenkundige bewerking)
3. Intervalschaal -> geg. Met eenduidig verschil tss uitkomsten met willekeurig nulpunt (tijdstip
op klok)
‘Echte ➔ Eenduidig verschil=( Vb verschil tss 19u & 21u)
getallen’
4. Ratioschaal -> geg. Met eend. Versch tss uitk. Met absoluut/natuurlijk nulpunt (maandloon
wn, wachttijd in wachtzaal)
➔ Kan niet onder nul gaan
2 Gegevens verwerken tot tabellen & grafieken
2.1 Frequentieverdelingen en grafieken
Samenvatten in een tabel:
• 1 variabele : frequentietabel/klassetabel
• > 1 variabele : Kruistabel/ contigentietabel
-> Aandachtspunten voor tabellen (p10)
2.2 Grafische voorstelling afh van data
-> Presentatie beter met grafische voorstelling dan frequentietabel
2
, -> Astitels, titels op x- en y-as, verduidelijking via legende of gegevenslabels
2.3 Verwerken van & kwalitatieve variabele
Voorbeeld (vastgoedkantoor zoekt verkopers):
“Ruwe gegevens” ”Organiseren in frequentietabel”
Relatieve frequentie: absolute frequentie/totaal
Grafische voorstelling
Voorbeeld: hoe tevreden zijn verkopers van dienstverlening
Cumulatieve freq: hoeveel pers.
hebben een tevredenheid gegeven
van x of lager?
2.4 Verwerken van 1 kwantitatieve variabele
-> Organisatie afh. van versch. # waarnemingsgetallen (=p)
• < 20: Waarnemingsgetallen afzonderlijk (niet-gegroepeerde geg.)
• > 20: Waarnemingsgetallen in klassen plaatsen (gegroepeerde gegevens)
3