STATISTIEK
BEDRIJFSKUNDE
,Module 1: Inleiding tot de statistiek
Gegevens en tekst -> kwalitatieve onderzoeksmethoden nodig (vb interviews)
Cijfers -> kwantitatieve onderzoeksmethoden
Kwantitatieve onderzoeksmethoden: een set van tools en technieken die gebruikt wordt
voor het beschrijven, organiseren en interpreteren van informatie of gegevens.
Onderzoeksproces:
- Wat je doet (een onderzoeksplan genereren)
Raadpleeg een theorie
Genereer een hypothese
Verzamel data om de hypothese te testen
o Meet variabelen
Analyseer de data
o Beschrijvende en inferentiële statistiek
Veralgemeen de resultaten
- Hoe je het doet (observeer de wereld)
- Waar je het op doet
Populatie
Theorie: een uitleg of een set van principes die een breed fenomeen verklaart en die goed
onderbouwd is door herhaaldelijk te zijn getest
Populatie: een theoretische groep waarover je conclusies wilt trekken
Hypothese: een vooropgestelde verklaring voor een vrij beperkt fenomeen of reeks
waarnemingen
Een dataset is een verzameling van gegevens. Het bevat een variabele en een case.
Variabele: alles dat kan worden gemeten en dat kan verschillen (of veranderen of variëren)
tussen entiteiten of in de tijd.
Case: de gegevens uit één bron van één of meerdere variabelen.
Variabelen
Kwalitatief (categorisch) vb. Hond, kat, koe
o Meetniveau: nominaal
Nationaliteiten, soorten chocolade, kleuren
Je kan ze niet rangschikken
Een kleur is vb niet superieur aan de ander
o Meetniveau: ordinaal
Olympische medailles, tevredenheid
Een bepaalde volgorde ‘van hoog naar laag’
Je kan ze ordenen
, Kwantitatief (schaalvariabelen) vb. Lengte, gewicht, leeftijd
o Interval
Kalenderjaar, temperaturen
Geen betekenisvol nulpunt
Intervallen tussen categorieën gelijk
100°C is niet zo warm als 2 keer 50°C
Afstand tussen bepaalde waarden is gelijk
0° betekent niet dat er geen temperatuur is.
o Ratio
Zinvol 0-punt (geeft een afwezigheid weer van het ding dat je
aan het meten bent)
Vb: lengte, gewicht, leeftijd, punten
Verhoudingsschalen
100 kg is 2 keer 50 kg
0 kg = gewichtloos
Kwantitatieve getallen kunnen discreet of continu zijn
Discreet: je krijgt de getallen door te tellen. Vb: 19, 20 leerlingen
Continu: leeftijd (jaren, maanden, dagen) of graden
Soms behandelen we getallen die continu zijn alsof ze discreet zijn vb: leeftijd
enkel in jaren uitdrukken
Of discrete waarden naar continu getallen: vb aantal partners gestegen van
3,4 naar 3,7
Er is nog een verschil:
Direct meetbare variabelen: lengte, leeftijd, gewicht
Indirect meetbare variabelen: geluk, tevredenheid, depressie
= constructen: kenmerken of eigenschappen die niet direct kunnen worden gemeten
Binaire of dichotome variabele: er zijn maar twee categorieën
Vb: dood of levend, roker of niet-roker
Codering: categorische variabelen een getal geven. Is niet numeriek van aard.
Kwalitatieve variabelen: je kan ermee rekenen, je kan het optellen.
Meten met een Likertschaal: vb 7-punt of 5puntschaal (hoe hard ga je akkoord met een
stelling)
Crombach’s alpha analyse: elk item in de schaal moet voldoende gecorreleerd zijn met elk
ander item in de schaal
Interne consistentie betrouwbaarheid: meten de items in de schaal samen eenzelfde
construct?
Likertschalen lijken intervalschalen en worden vaak zo beschouwd, maar zijn toch vaak
ordinaal.
, Voorspellende variabele (onafhankelijke variabele of verklarende variabele)
Uitkomstvariabele (afhankelijke variabele of verklaarde variabele)
Steekproef: een kleinere set van entiteiten uit een populatie
Parameter: is iets dat de populatie samenvat
Statistiek: is iets dat de steekproef samenvat
Steekproef moet representatief zijn: zorgen dat elk soort mens er in voorkomt. Vb
gescheiden moeders, oude moeders, jonge moeders…
Eenvoudige willekeurige steekproef: willekeurig mensen selecteren voor je steekproef
(proberen zo representatief mogelijk te maken)
Steekproefvertekening (sample bias) is een soort vertekening die wordt veroorzaakt door
het kiezen van niet- willekeurige gegevens voor statistische analyses. De vertekening bestaat
door een fout in het steekproefselectieproces, waarbij een subset van de gegevens
systematisch wordt uitgesloten vanwege een bepaald kenmerk. Vb: vliegtuigen uit WOII die
terugkwamen. Welke zaken extra beschermen?
Steekproefvariatie: verschil tussen twee verschillende steekproeven
Steekproeven kunnen soms verschillen van de populatie. Grote steekproeven beter dan
kleine steekproeven (geeft correcter beeld)
Correlationeel onderzoek ( =/causaliteit)
Cross-sectioneel: Variabelen meten op een moment over verschillende cases heen
Longitudinaal: variabelen herhaaldelijk op verschillende tijdstippen te meten
Quasi experiment: geen willekeurige toewijzing van proefpersonen. Vb: werknemers
mogen kiezen of ze deelnemen aan een training. Je hebt vrijwilligers en niet-
vrijwilligers.
Experiment (causaliteit bekijken)
Controlegroep en oorzaakgroep
Oorzaakgroep gaan manipuleren
Beschrijvende statistiek: kan alleen worden gebruikt om de gegevens te beschrijven die uit
een steekproef zijn verzameld.
Inferentiële statistiek: stelt ons in staat om de gegevens die uit een steekproef zijn
verzameld te generaliseren naar de populatie waaruit die steekproef afkomstig is.