Statistiek
Hoofdstuk 1: Gegevens verwerken
• Verzamelen, bewerken, interpreteren en presenteren v gegevens
• 3 deelgebieden: beschrijvende statistiek, kansrekening, inductieve/verklarende statistiek
o Beschrijvende statistiek: resultaten steekproef verzameld + verwerkt ➔ grote Q v
waarnemingsuitkomsten overzichtelijk maken:
▪ Gegevenstabel, figuur of grafiek
▪ Relevante kengetallen: gemiddelde waarde, spreiding rond gemiddelde
waarde
▪ Meer overzicht ➔ meer inzicht!
o Kansrekening: opstellen v theoretische redenering; doel = zo effectief mog.
omgaan met onzekerheden + gefundeerde keuzes maken
▪ Brug tss beschrijvende statistiek en inductieve statistiek
o Inductieve (beslissende) statistiek: nagaan in hoeverre de kenmerken v/e
steekproef ook kenmerken vd populatie z
1. Gegevens verzamelen
• Obv beperkte data/info (steekproef) voorspellingen/beslissingen maken over ganse
populatie
o = Statistisch onderzoek/Statistische gevolgtrekking
▪ Betrouwbaarheidsmaat: mate v onzekerheid gaat gepaard met S.O./S.GT.
• Concepten
o Populatie
▪ Verzameling v alle te bestuderen objecten i/h onderzoek
▪ Bv. Alle inwoners v België, woonhuizen/appartementen in Vlaanderen
o Steekproef
▪ Deelverzameling v populatie – Q elementen = omvang steekproef 𝑛
▪ Bv. Selectie v 1500 Belgen, studie v 300 appartementen in Vlaanderen
o Variabelen
▪ Kenmerken die onderzocht w
▪ Bv. Lengte, geboortegewicht, prijs, …
• Verwerking v alle gegevens in datamatrix
1.1. Populatie en steekproef
• 3 ≠ onderzoeken/hoofdvormen om gegevens te verzamelen:
o Enquête
▪ Gebruik v vragenformulier + registratie v antwoorden
▪ Bv. Welzijnsenquête op werkvloer, opiniepeiling tijdens verkiezingsjaar
o Observatie (onderzoek)
▪ Experimentele eenheden in hun nat. omgeving onderzoeken + registratie
relevante variabelen
▪ Bv. Evolutie vastgoedprijzen, efficiëntie v machines & personeel
o Experiment
▪ Handeling opleggen a/d te onderzoeken eenheden (mensen, objecten, …)
▪ Vnl. bij wet. toepassingen
▪ Bv. Invloed v Rilatine op concentratievermogen
, • Onderzoek operationeel definiëren
o Wie/wat onderzoeken we?!
o Belangrijk voor reproduceerbaarheid: experimenten moeten k w herhaald
• Steekproefkader
o Administratieve weergave v/e populatie
o Concreet: lijst v personen, bedrijven, panden, … waaruit steekproef w gehaald
o Moet populatie z goed mog. weerspiegelen
o Wat als…
▪ Steekproefkader onvolledig/slecht gedefinieerd is?
▪ Optimaal is?
• Aselecte steekproef
o Alle elementen in populatie moeten gelijke kans h om in steekproef te komen
o Randomisatie v elementen in populatie (→ willekeurige loting)
o “Bias”/onzuiver: bepaalde elementen h meer kans
• Betrouwbaarheid
o Bij herhaling v steekproeftrekking globaal zelfde resultaten
o Weliswaar variabiliteit in uitkomsten
o Sterk afh. v (steekproef)omvang
▪ Te kleine steekproef = onbetrouwbaar; onzekere resultaten + verspilling
geld, tijd & moeite
• Bij toeval 3 duurste villa’s geselecteerd voor vastgoedonderzoek
▪ Te grote steekproef: ook problematisch; verspilling geld, tijd & moeite
• Onderzoek duurt te lang, populatie “evolueert”
1.2. Variabelen
• Kenmerken/karakteristieken die bij populatie-elementen w onderzocht
• Kwalitatieve variabelen
o Geen numerieke waarden
o >> eigenschappen, aanduidingen
o Bv. kleur, merk, gebouwtype, …
• Kwantitatieve variabelen
o Numerieke waarden
o Bv. aantallen, gewicht, prijzen, …
Hoofdstuk 1: Gegevens verwerken
• Verzamelen, bewerken, interpreteren en presenteren v gegevens
• 3 deelgebieden: beschrijvende statistiek, kansrekening, inductieve/verklarende statistiek
o Beschrijvende statistiek: resultaten steekproef verzameld + verwerkt ➔ grote Q v
waarnemingsuitkomsten overzichtelijk maken:
▪ Gegevenstabel, figuur of grafiek
▪ Relevante kengetallen: gemiddelde waarde, spreiding rond gemiddelde
waarde
▪ Meer overzicht ➔ meer inzicht!
o Kansrekening: opstellen v theoretische redenering; doel = zo effectief mog.
omgaan met onzekerheden + gefundeerde keuzes maken
▪ Brug tss beschrijvende statistiek en inductieve statistiek
o Inductieve (beslissende) statistiek: nagaan in hoeverre de kenmerken v/e
steekproef ook kenmerken vd populatie z
1. Gegevens verzamelen
• Obv beperkte data/info (steekproef) voorspellingen/beslissingen maken over ganse
populatie
o = Statistisch onderzoek/Statistische gevolgtrekking
▪ Betrouwbaarheidsmaat: mate v onzekerheid gaat gepaard met S.O./S.GT.
• Concepten
o Populatie
▪ Verzameling v alle te bestuderen objecten i/h onderzoek
▪ Bv. Alle inwoners v België, woonhuizen/appartementen in Vlaanderen
o Steekproef
▪ Deelverzameling v populatie – Q elementen = omvang steekproef 𝑛
▪ Bv. Selectie v 1500 Belgen, studie v 300 appartementen in Vlaanderen
o Variabelen
▪ Kenmerken die onderzocht w
▪ Bv. Lengte, geboortegewicht, prijs, …
• Verwerking v alle gegevens in datamatrix
1.1. Populatie en steekproef
• 3 ≠ onderzoeken/hoofdvormen om gegevens te verzamelen:
o Enquête
▪ Gebruik v vragenformulier + registratie v antwoorden
▪ Bv. Welzijnsenquête op werkvloer, opiniepeiling tijdens verkiezingsjaar
o Observatie (onderzoek)
▪ Experimentele eenheden in hun nat. omgeving onderzoeken + registratie
relevante variabelen
▪ Bv. Evolutie vastgoedprijzen, efficiëntie v machines & personeel
o Experiment
▪ Handeling opleggen a/d te onderzoeken eenheden (mensen, objecten, …)
▪ Vnl. bij wet. toepassingen
▪ Bv. Invloed v Rilatine op concentratievermogen
, • Onderzoek operationeel definiëren
o Wie/wat onderzoeken we?!
o Belangrijk voor reproduceerbaarheid: experimenten moeten k w herhaald
• Steekproefkader
o Administratieve weergave v/e populatie
o Concreet: lijst v personen, bedrijven, panden, … waaruit steekproef w gehaald
o Moet populatie z goed mog. weerspiegelen
o Wat als…
▪ Steekproefkader onvolledig/slecht gedefinieerd is?
▪ Optimaal is?
• Aselecte steekproef
o Alle elementen in populatie moeten gelijke kans h om in steekproef te komen
o Randomisatie v elementen in populatie (→ willekeurige loting)
o “Bias”/onzuiver: bepaalde elementen h meer kans
• Betrouwbaarheid
o Bij herhaling v steekproeftrekking globaal zelfde resultaten
o Weliswaar variabiliteit in uitkomsten
o Sterk afh. v (steekproef)omvang
▪ Te kleine steekproef = onbetrouwbaar; onzekere resultaten + verspilling
geld, tijd & moeite
• Bij toeval 3 duurste villa’s geselecteerd voor vastgoedonderzoek
▪ Te grote steekproef: ook problematisch; verspilling geld, tijd & moeite
• Onderzoek duurt te lang, populatie “evolueert”
1.2. Variabelen
• Kenmerken/karakteristieken die bij populatie-elementen w onderzocht
• Kwalitatieve variabelen
o Geen numerieke waarden
o >> eigenschappen, aanduidingen
o Bv. kleur, merk, gebouwtype, …
• Kwantitatieve variabelen
o Numerieke waarden
o Bv. aantallen, gewicht, prijzen, …