DATA ONDERZOEK: INLEIDING
1. wat is statistiek?
Statistiek = wetensch vn ht verz, verwerken & interpreteren v numerieke geg over een bep onderw. Ht
toep v statistische methodes => conclusies mt bekende risico’s
= wetensch v gegevens
Een statistiek = een steekproefwaarde/steekproefgrootheid (verz geg voorgesteld mt behulp vn
tabel/grafiek
2. wrm worden er statistische methodes toegepast?
Bij enquêtes & onderzoeken (papier/digitaal) adhv tabellen, grafieken & statistische grootheden
- Verwerven inzicht in statistische methodes: in iedere opleiding noodz
- Op kritische wijze resultaten vn anderen interpreteren
Want w gebruikt om beslissingen te nemen
Statistiek is een sleutel tot management!
3. hoe wordt er in een statistisch onderzoek te werk gegaan?
STAP 1: geg observeren, verz & verz kritisch bekijken
STAP 2: geg ordenen in tabellen volgens bep kenm
STAP 3: geordende geg voorstellen in grafieken
STAP 4: geg analyseren obv grafiek & ze sv in typische cijfers om centrum & spreiding te beschrijven.
Bij analyse: soms indexcijfers ipv absolute cijfers (andere mogelijkh: verbanden onderzoeken &
beschrijven)
STAP 5: result interpreteren & veralgemenen, regelmaat ontdekken, hypothese verifiëren
Alle fasen v verzamelen tem analyse = beschrijvende statistiek
Goede verwerking v geg vraagt: in staat grafieken maken & kenggetallen berekenen
Kengetal in beschr statistiek = get dt kenm/eigensch/variabele v geg verz (= steekproef/dataset)
Titel data-onderzoek omdt meest gebruikte grafieken & kenget mogelijk maken: dataset verkennen
Interpreteren & veralgemenen = verklarende / inductieve statistiek (niet in deze cursus)
,HOOFDSTUK 1: VERZAMELEN VAN GEGEVENS
1.1. populatie & steekproef
Populatie = volledige verzameling (fysische, abstracte) objecten/individuen waarover je in een
onderzoek een uitspr wenst te doen
Statistisch onderzoek wil tot uitspr komen (verbanden leggen, beslissingen nemen, voorsp doen) vr
volledige populatie
Dus belangrijk dt zinvolle info bevat
misverstanden te vermijden bij verwerken & interpreteren geg: moet element uit populatie: heel
duidelijk & ondubbelzinnig omschreven zijn op vlak v tijd, plaats & inhoud
Meestal om diverse redenen onmogelijk geg te krijgen over alle individuen v populatie
DUS: Steekproef: moet representatief zijn om getrouw miniatuurbeeld v populatie te geven
Adhv aselect/willekeurig te trekken: elk element uit populatie moet evenveel kans krijgen om
vr steekproef gekozen te worden
Maar niet eenvoudig!:
- Verkeerde populatie bereiken
- Het succes (op voorhand vermoed dt kijkgedrag zal versch volgens leeftijd: kiezen vr gelaagde
steekproef = alle kenm die ht onderzoek kunnen beïnvl evengoed vertegenw zijn in steekproef
als in populatie)
- Voldoende groot zijn
- Ook afh vn wat je wil onderzoeken (zeldzaam)
1.2. statistische variabelen en hun meetschaal
Statistische variabelen = alle eigensch vn elementen vn populatie die in een onderzoek w
opgenomen (x,y,z)
- Belangrijk om stil te staan bij keuze eigensch/variabelen (tijdrovend & duur)
- Gewoonte om result v statistische variabelen om te zetten in getallen (versch in meetschaal)
Kwalitatieve/niet-numerieke variabele = variabele waarbij getalwaarde weinig betekenis heeft (kan
ook in letters uitdrukken) + geen zinvolle rekenkundige bewerkingen maken
• Nominale variabele: getallen: louter een code vb geslacht
• Ordinale variabele: getallen: natuurlijke volgorde vn variabele ondanks ze symbolisch zijn
Kwantitatieve/numerieke variabele = variabele w voorgesteld dr getal dt reële betekenis heeft &
kwantiteit v iets weergeeft:
, in vaste eenheid uitgedrukt
resultaat vn meting/telling en kan er zinvol mee rekenen
• intervalschaal: variabele heeft vaste eenheid mr schaal waarop w gemeten: geen vast nulpunt
1. temperatuur
2. tijdsaanduiding
3. psychologische schalen
versch tss waarnemingsgetallen hebben wel zin, maar de verhoudingen niet
• ratioschaal: variabele heeft vaste eenheid & schaal waarop w gemeten: vast nulpunt bezit
verschil tss waarnemingsgetallen hebben zin, verhoudingen ook
vb aantal x nr film kan niet negatief zijn
vb leeftijd, gewicht
tweede indeling volgens telling of meting
• discrete/discontinue variabele: waarnemingen vn variabele zijn resultaat vn telling (in gehele
getallen uitgedrukt)
• continue variabele: waarnemingen vn variabele zijn resultaat vn meting (in decimale getallen)
1.3. verwerven van gegevens
NBB
STATBEL (algemene directie statistiek)
Demografische, eco & soc gegevens: belangrijk als achtergrond vr marktonderzoeken
Richtlijnen bij gebruik v statistieken verzameld dr derden:
- Vertrek vn duidelijk probleem
- Leid af welke info je nodig hebt
- Zoek info op:
o Wrm? Voor welk doel? andere besluiten halen uit variabelen?
o Wie? Welke populatie?
o Wat? Definitie vn variabelen waarvr je geg hebt gevonden? Welke eenheid?
- Herwerk bekomen info
- Vermeld bron (volledig!)
Andere mogelijkh om aan geg te geraken: meting (instrumenteel, menselijk oordeel), observatie,
gebruik bestaande teksten, interviews, enquêtes
1. wat is statistiek?
Statistiek = wetensch vn ht verz, verwerken & interpreteren v numerieke geg over een bep onderw. Ht
toep v statistische methodes => conclusies mt bekende risico’s
= wetensch v gegevens
Een statistiek = een steekproefwaarde/steekproefgrootheid (verz geg voorgesteld mt behulp vn
tabel/grafiek
2. wrm worden er statistische methodes toegepast?
Bij enquêtes & onderzoeken (papier/digitaal) adhv tabellen, grafieken & statistische grootheden
- Verwerven inzicht in statistische methodes: in iedere opleiding noodz
- Op kritische wijze resultaten vn anderen interpreteren
Want w gebruikt om beslissingen te nemen
Statistiek is een sleutel tot management!
3. hoe wordt er in een statistisch onderzoek te werk gegaan?
STAP 1: geg observeren, verz & verz kritisch bekijken
STAP 2: geg ordenen in tabellen volgens bep kenm
STAP 3: geordende geg voorstellen in grafieken
STAP 4: geg analyseren obv grafiek & ze sv in typische cijfers om centrum & spreiding te beschrijven.
Bij analyse: soms indexcijfers ipv absolute cijfers (andere mogelijkh: verbanden onderzoeken &
beschrijven)
STAP 5: result interpreteren & veralgemenen, regelmaat ontdekken, hypothese verifiëren
Alle fasen v verzamelen tem analyse = beschrijvende statistiek
Goede verwerking v geg vraagt: in staat grafieken maken & kenggetallen berekenen
Kengetal in beschr statistiek = get dt kenm/eigensch/variabele v geg verz (= steekproef/dataset)
Titel data-onderzoek omdt meest gebruikte grafieken & kenget mogelijk maken: dataset verkennen
Interpreteren & veralgemenen = verklarende / inductieve statistiek (niet in deze cursus)
,HOOFDSTUK 1: VERZAMELEN VAN GEGEVENS
1.1. populatie & steekproef
Populatie = volledige verzameling (fysische, abstracte) objecten/individuen waarover je in een
onderzoek een uitspr wenst te doen
Statistisch onderzoek wil tot uitspr komen (verbanden leggen, beslissingen nemen, voorsp doen) vr
volledige populatie
Dus belangrijk dt zinvolle info bevat
misverstanden te vermijden bij verwerken & interpreteren geg: moet element uit populatie: heel
duidelijk & ondubbelzinnig omschreven zijn op vlak v tijd, plaats & inhoud
Meestal om diverse redenen onmogelijk geg te krijgen over alle individuen v populatie
DUS: Steekproef: moet representatief zijn om getrouw miniatuurbeeld v populatie te geven
Adhv aselect/willekeurig te trekken: elk element uit populatie moet evenveel kans krijgen om
vr steekproef gekozen te worden
Maar niet eenvoudig!:
- Verkeerde populatie bereiken
- Het succes (op voorhand vermoed dt kijkgedrag zal versch volgens leeftijd: kiezen vr gelaagde
steekproef = alle kenm die ht onderzoek kunnen beïnvl evengoed vertegenw zijn in steekproef
als in populatie)
- Voldoende groot zijn
- Ook afh vn wat je wil onderzoeken (zeldzaam)
1.2. statistische variabelen en hun meetschaal
Statistische variabelen = alle eigensch vn elementen vn populatie die in een onderzoek w
opgenomen (x,y,z)
- Belangrijk om stil te staan bij keuze eigensch/variabelen (tijdrovend & duur)
- Gewoonte om result v statistische variabelen om te zetten in getallen (versch in meetschaal)
Kwalitatieve/niet-numerieke variabele = variabele waarbij getalwaarde weinig betekenis heeft (kan
ook in letters uitdrukken) + geen zinvolle rekenkundige bewerkingen maken
• Nominale variabele: getallen: louter een code vb geslacht
• Ordinale variabele: getallen: natuurlijke volgorde vn variabele ondanks ze symbolisch zijn
Kwantitatieve/numerieke variabele = variabele w voorgesteld dr getal dt reële betekenis heeft &
kwantiteit v iets weergeeft:
, in vaste eenheid uitgedrukt
resultaat vn meting/telling en kan er zinvol mee rekenen
• intervalschaal: variabele heeft vaste eenheid mr schaal waarop w gemeten: geen vast nulpunt
1. temperatuur
2. tijdsaanduiding
3. psychologische schalen
versch tss waarnemingsgetallen hebben wel zin, maar de verhoudingen niet
• ratioschaal: variabele heeft vaste eenheid & schaal waarop w gemeten: vast nulpunt bezit
verschil tss waarnemingsgetallen hebben zin, verhoudingen ook
vb aantal x nr film kan niet negatief zijn
vb leeftijd, gewicht
tweede indeling volgens telling of meting
• discrete/discontinue variabele: waarnemingen vn variabele zijn resultaat vn telling (in gehele
getallen uitgedrukt)
• continue variabele: waarnemingen vn variabele zijn resultaat vn meting (in decimale getallen)
1.3. verwerven van gegevens
NBB
STATBEL (algemene directie statistiek)
Demografische, eco & soc gegevens: belangrijk als achtergrond vr marktonderzoeken
Richtlijnen bij gebruik v statistieken verzameld dr derden:
- Vertrek vn duidelijk probleem
- Leid af welke info je nodig hebt
- Zoek info op:
o Wrm? Voor welk doel? andere besluiten halen uit variabelen?
o Wie? Welke populatie?
o Wat? Definitie vn variabelen waarvr je geg hebt gevonden? Welke eenheid?
- Herwerk bekomen info
- Vermeld bron (volledig!)
Andere mogelijkh om aan geg te geraken: meting (instrumenteel, menselijk oordeel), observatie,
gebruik bestaande teksten, interviews, enquêtes