Dataverwerking
Statistiek
Statistische gevolgtrekking
= maken van voorspellingen & inschattingen over een grote populatie op basis van
een kleine steekproef (beperkte dataset)
op wetenschappelijk gefundeerde wijze = geen natte-vinger-werk
4 onderdelen:
Beschrijvende Data verzamelen, organiseren, presenteren en
statistiek samenvatten in statistische getallen
Kansrekening
Verklarende Statistische getallen interpreteren & verklaren
statistiek en gebruiken voor veralgemening
Hypothesetesten
Gegevens verwerken
Verzamelen
Concepten en begrippen:
Populatie = verzameling van te bestuderen objecten in onderzoek
Bv. alle dierenartsen in Vlaanderen, alle studenten aan de HoGent,…
Veelal grote aantallen, moeilijk te meten/bestuderen
Steekproef = deelverzameling van de populatie (aantal elementen = omvang n )
Bv. selectie van 300 dierenartsen in Vlaanderen, 50 “vrijwillige” studenten,…
Variabelen = kenmerken van onderzoeksitems die onderzocht kunnen worden
Bv. leeftijd van behandelde dieren in praktijk, aantal verschillende boomsoorten in een
park, leeftijd/gewicht/lengte/studieresultaten van studenten, …
Wordt na verzamelen verwerkt in een grote overzichtelijke datamatrix
Excel: relatief eenvoudige software om data in te organiseren en te verwerken
Cuciale eerste stap in dataverwerking!
1. Interview: vragen met als doel inzicht te krijgen in hun gedrag, waarnemingen,
gevoelens, overtuigingen, meningen,...
Wanneer nuttig:
• Bij de start als oriëntering van het onderzoek
• Verdiepende info van bepaalde stakeholders
• Op het einde om de resultaten van een onderzoek te verduidelijken
Voordelen: Geschikt voor minder taalvaardige mensen, doorvragen mogelijk,
nieuwe inzichten door onverwachte antwoorden, handig bij gevoelige info
Nadelen: Tijdrovend en arbeidsintensief, beïnvloedbaar door factoren zoals: lawaai,
geheugen,…, niet anoniem, moeilijk om te generaliseren
2. Enquête: eenzelfde vragenlijst voor steekproef/-groep, bij kwantitatief onderzoek
Hoe opstellen:
• Goede onderzoeksvragen formuleren
• Gebruik gesloten vragen voor statistische verwerking en generalisatie
• Kies het juiste doelpubliek voor de onderzoeksvraag
Voordelen: Nuttig voor grote groep
,3. Observationele studie: gedrag en handelingen observeren, zowel kwalitatief als
kwantitatief onderzoek
Wanneer gebruiken:
• Beschrijven van een bepaald gedrag, observeren van vergeten gedrag of bij het
vermoeden van onwaarheden
• Nuttig wanneer er weinig info beschikbaar is over het te onderzoeken thema of
voor gedrag in een bepaalde setting
Voordelen: Inzicht in werkelijk gedrag en de context, relatief goedkope
Nadelen: Beperkt aantal eenheden observeren, tijdrovend, moeilijk om objectief te
blijven, niet alles is observeerbaar zoals motieven, opvattingen…
4. Experiment: hypotheses testen en oorzakelijke verbanden onderzoeken
Voorbeelden:
• Testen medicatie: groep A: echte medicatie, groep B: placebo
• Testen droogtestress bij planten
Voordelen: Veel controle wat zorgt voor hoge interne validiteit, beperkt aantal
proefpersonen
Nadelen: Niet altijd geschikt voor alle onderzoeksvragen, niet alle factoren zijn te
controleren, moeilijk om gedachten en gevoelens te meten, duur, onethisch,
gevaarlijk: moeilijk om resultaten te verkrijgen
5. Focusgroep: combo van interview en discussie in een groep van 7-10 personen,
meestam homogene groep zonder hiërarchie
Vaak meerdere sessies, meeste info uit 1ste 2 focusgroepen
Gebruik:
• Polsen naar percepties, ideëen, meningen over een product, service, concept
• Bij de start van het onderzoek om een onderwerp te verkennen, of aan het einde
om de uitkomsten te evalueren
• Niet voor gevoelige onderwerpen of verbaal zwakke mensen
Voordelen: Inzicht in verschillende meningen, groepsdynamiek en discussie bieden
meer diepgang, flexibel, relatief goedkoop, informeel, sneeuwbaleffect
Nadelen: Geen kwantitatieve resultaten, moeilijk te generaliseren, beperkte
controle over het verloop van het gesprek, groepsdynamiek kan de resultaten
beïnvloeden
Aandachtspunten:
I. Omschrijving van het onderzoek
Wie of wat wordt onderzocht?
Reproduceerbaarheid: Het onderzoek moet herhaalbaar zijn met
gelijkaardige resultaten
II. Opstellen van de steekproef
Administratieve weergave van de populatie moet objectief zijn:
o Bedrijven BTW-nummers
o Personen Rijksregisternummers
o Panden Perceelcodes
Random selectie is essentieel om vertekening te voorkomen
III. Representatieve steekproef
Elk element moet evenveel kans hebben om geselecteerd te worden
Geen willekeurige selectie risico op bias (vertekening)
Concrete selectievoorbeelden:
, o Personen via rijksregisternummer
o Panden via kadasternummer
o Bedrijven via BTW-nummer
o Makelaars via BIV-nummer
IV. Betrouwbaarheid van het onderzoek
Onderzoek moet herhaalbaar zijn met gelijkaardige resultaten
Steekproefgrootte is cruciaal:
o Te klein Onzekere resultaten
o Te groot Te tijdrovend, duur en onderzoek kan onvolledig blijven
o Populatie kan evolueren tijdens een langdurig onderzoek
o Correcte grote berekenen = COMPLEX
Variabiliteit binnen de populatie moet in rekening worden gebracht
Uitschieters kunnen een grote impact hebben
V. Problemen bij waarnemingen
Fouten in administratie of verwerking:
o Slechte filtering in Excel
o Foutieve vragen in een enquête
Experiment kan mislukken:
o Soms levert een experiment geen resultaat, wat ook een waardevolle
uitkomst kan zijn
Non-respons:
o Bij enquêtes kan het ontbreken van antwoorden de resultaten beïnvloeden
Variabelen:
Definitie: kenmerken of eigenschappen van een populatie die onderzocht worden.
Soorten variabelen
Type Kenmerken Voorbeelden
Kwalitatieve Niet-numeriek Kleur, merk, diersoort
variabelen
Kwantitatieve Numerieke Aantallen, afstanden,
variabelen waarden prijzen
Kwantitatieve variabelen
Discrete variabelen (aftelbare waarden, gehele getallen ℤ)
o Aantal bomen in een bos
o Aantal kamers in een huis
o Aantal auto’s per gezin
Continue variabelen (waardes uit ℝ, reële getallen/kommagetallen)
o Tijdsduur van een dierenartsbezoek
o Afstand tot een school
o Oppervlakte van een park
Schalen van variabelen
Schaal Rekenkundige Kenmerken Voorbeelden
bewerking?
Nominale Nee Kwalitatieve kenmerken Kleur, merknaam,
schaal zonder logische ordening gebouwtype
Ordinale Nee Geordend, maar zonder FIFA-ranking, Michelin-
schaal betekenisvolle sterren,
verschillen opleidingsniveau
Statistiek
Statistische gevolgtrekking
= maken van voorspellingen & inschattingen over een grote populatie op basis van
een kleine steekproef (beperkte dataset)
op wetenschappelijk gefundeerde wijze = geen natte-vinger-werk
4 onderdelen:
Beschrijvende Data verzamelen, organiseren, presenteren en
statistiek samenvatten in statistische getallen
Kansrekening
Verklarende Statistische getallen interpreteren & verklaren
statistiek en gebruiken voor veralgemening
Hypothesetesten
Gegevens verwerken
Verzamelen
Concepten en begrippen:
Populatie = verzameling van te bestuderen objecten in onderzoek
Bv. alle dierenartsen in Vlaanderen, alle studenten aan de HoGent,…
Veelal grote aantallen, moeilijk te meten/bestuderen
Steekproef = deelverzameling van de populatie (aantal elementen = omvang n )
Bv. selectie van 300 dierenartsen in Vlaanderen, 50 “vrijwillige” studenten,…
Variabelen = kenmerken van onderzoeksitems die onderzocht kunnen worden
Bv. leeftijd van behandelde dieren in praktijk, aantal verschillende boomsoorten in een
park, leeftijd/gewicht/lengte/studieresultaten van studenten, …
Wordt na verzamelen verwerkt in een grote overzichtelijke datamatrix
Excel: relatief eenvoudige software om data in te organiseren en te verwerken
Cuciale eerste stap in dataverwerking!
1. Interview: vragen met als doel inzicht te krijgen in hun gedrag, waarnemingen,
gevoelens, overtuigingen, meningen,...
Wanneer nuttig:
• Bij de start als oriëntering van het onderzoek
• Verdiepende info van bepaalde stakeholders
• Op het einde om de resultaten van een onderzoek te verduidelijken
Voordelen: Geschikt voor minder taalvaardige mensen, doorvragen mogelijk,
nieuwe inzichten door onverwachte antwoorden, handig bij gevoelige info
Nadelen: Tijdrovend en arbeidsintensief, beïnvloedbaar door factoren zoals: lawaai,
geheugen,…, niet anoniem, moeilijk om te generaliseren
2. Enquête: eenzelfde vragenlijst voor steekproef/-groep, bij kwantitatief onderzoek
Hoe opstellen:
• Goede onderzoeksvragen formuleren
• Gebruik gesloten vragen voor statistische verwerking en generalisatie
• Kies het juiste doelpubliek voor de onderzoeksvraag
Voordelen: Nuttig voor grote groep
,3. Observationele studie: gedrag en handelingen observeren, zowel kwalitatief als
kwantitatief onderzoek
Wanneer gebruiken:
• Beschrijven van een bepaald gedrag, observeren van vergeten gedrag of bij het
vermoeden van onwaarheden
• Nuttig wanneer er weinig info beschikbaar is over het te onderzoeken thema of
voor gedrag in een bepaalde setting
Voordelen: Inzicht in werkelijk gedrag en de context, relatief goedkope
Nadelen: Beperkt aantal eenheden observeren, tijdrovend, moeilijk om objectief te
blijven, niet alles is observeerbaar zoals motieven, opvattingen…
4. Experiment: hypotheses testen en oorzakelijke verbanden onderzoeken
Voorbeelden:
• Testen medicatie: groep A: echte medicatie, groep B: placebo
• Testen droogtestress bij planten
Voordelen: Veel controle wat zorgt voor hoge interne validiteit, beperkt aantal
proefpersonen
Nadelen: Niet altijd geschikt voor alle onderzoeksvragen, niet alle factoren zijn te
controleren, moeilijk om gedachten en gevoelens te meten, duur, onethisch,
gevaarlijk: moeilijk om resultaten te verkrijgen
5. Focusgroep: combo van interview en discussie in een groep van 7-10 personen,
meestam homogene groep zonder hiërarchie
Vaak meerdere sessies, meeste info uit 1ste 2 focusgroepen
Gebruik:
• Polsen naar percepties, ideëen, meningen over een product, service, concept
• Bij de start van het onderzoek om een onderwerp te verkennen, of aan het einde
om de uitkomsten te evalueren
• Niet voor gevoelige onderwerpen of verbaal zwakke mensen
Voordelen: Inzicht in verschillende meningen, groepsdynamiek en discussie bieden
meer diepgang, flexibel, relatief goedkoop, informeel, sneeuwbaleffect
Nadelen: Geen kwantitatieve resultaten, moeilijk te generaliseren, beperkte
controle over het verloop van het gesprek, groepsdynamiek kan de resultaten
beïnvloeden
Aandachtspunten:
I. Omschrijving van het onderzoek
Wie of wat wordt onderzocht?
Reproduceerbaarheid: Het onderzoek moet herhaalbaar zijn met
gelijkaardige resultaten
II. Opstellen van de steekproef
Administratieve weergave van de populatie moet objectief zijn:
o Bedrijven BTW-nummers
o Personen Rijksregisternummers
o Panden Perceelcodes
Random selectie is essentieel om vertekening te voorkomen
III. Representatieve steekproef
Elk element moet evenveel kans hebben om geselecteerd te worden
Geen willekeurige selectie risico op bias (vertekening)
Concrete selectievoorbeelden:
, o Personen via rijksregisternummer
o Panden via kadasternummer
o Bedrijven via BTW-nummer
o Makelaars via BIV-nummer
IV. Betrouwbaarheid van het onderzoek
Onderzoek moet herhaalbaar zijn met gelijkaardige resultaten
Steekproefgrootte is cruciaal:
o Te klein Onzekere resultaten
o Te groot Te tijdrovend, duur en onderzoek kan onvolledig blijven
o Populatie kan evolueren tijdens een langdurig onderzoek
o Correcte grote berekenen = COMPLEX
Variabiliteit binnen de populatie moet in rekening worden gebracht
Uitschieters kunnen een grote impact hebben
V. Problemen bij waarnemingen
Fouten in administratie of verwerking:
o Slechte filtering in Excel
o Foutieve vragen in een enquête
Experiment kan mislukken:
o Soms levert een experiment geen resultaat, wat ook een waardevolle
uitkomst kan zijn
Non-respons:
o Bij enquêtes kan het ontbreken van antwoorden de resultaten beïnvloeden
Variabelen:
Definitie: kenmerken of eigenschappen van een populatie die onderzocht worden.
Soorten variabelen
Type Kenmerken Voorbeelden
Kwalitatieve Niet-numeriek Kleur, merk, diersoort
variabelen
Kwantitatieve Numerieke Aantallen, afstanden,
variabelen waarden prijzen
Kwantitatieve variabelen
Discrete variabelen (aftelbare waarden, gehele getallen ℤ)
o Aantal bomen in een bos
o Aantal kamers in een huis
o Aantal auto’s per gezin
Continue variabelen (waardes uit ℝ, reële getallen/kommagetallen)
o Tijdsduur van een dierenartsbezoek
o Afstand tot een school
o Oppervlakte van een park
Schalen van variabelen
Schaal Rekenkundige Kenmerken Voorbeelden
bewerking?
Nominale Nee Kwalitatieve kenmerken Kleur, merknaam,
schaal zonder logische ordening gebouwtype
Ordinale Nee Geordend, maar zonder FIFA-ranking, Michelin-
schaal betekenisvolle sterren,
verschillen opleidingsniveau