KWANTITATIEVE METHODEN VOOR
BEDRIJFSKUNDE
SCHAKELJAAR BEDRIJFSKUNDE
VRIJE UNIVERSITEIT BRUSSEL
,INHOUDSOPGAVE
1 Module 1 – Inleiding tot de statistiek ..................................................................................................... 4
1.1 Onderzoeksproces .......................................................................................................................... 4
1.1.1 Wat je doet ................................................................................................................................. 4
1.1.2 Hoe je het doet ........................................................................................................................... 5
1.1.3 Waar je het op doet ................................................................................................................... 8
1.1.4 Format van een onderzoekspaper ........................................................................................... 10
2 Module 1: SPSS ..................................................................................................................................... 11
2.1 Inleiding ........................................................................................................................................ 11
2.2 Data import .................................................................................................................................. 11
2.2.1 Data importeren vanuit Excel ................................................................................................... 11
3 Module 2 – Beschrijvende Statistiek en Grafieken ............................................................................... 12
3.1 Format van een onderzoekspaper................................................................................................ 12
3.2 Beschrijvende statistiek ................................................................................................................ 12
3.2.1 Verdeling (distribution) ............................................................................................................ 12
3.2.2 Centrummaten (central tendency)........................................................................................... 18
3.2.3 Spreidingsmaten (variability) ................................................................................................... 20
3.2.4 Welke spreidingsmaat gebruiken? ........................................................................................... 23
3.3 Boxplot.......................................................................................................................................... 23
4 Module 2 – SPSS.................................................................................................................................... 24
5 Module 3 – De grondbeginselen van de inferentiële statistiek: Hypothesetoetsing ........................... 25
5.1 Inleiding ........................................................................................................................................ 25
5.2 Definitie ........................................................................................................................................ 25
5.3 Logica ............................................................................................................................................ 25
5.4 Hypothesetoetsing ....................................................................................................................... 25
5.4.1 Hypothesetoetsing stappen ..................................................................................................... 26
6 Module 4 – Verschil en variantieanalyse: t-Testen en One-Way ANOVA ............................................. 31
6.1 One-Sample t-test......................................................................................................................... 31
6.1.1 Voorbeeld – OV1 ...................................................................................................................... 31
6.1.2 Betrouwbaarheidsinterval (CI) ................................................................................................. 33
6.1.3 Voorbeeld – OV2 ...................................................................................................................... 34
6.2 Two samples t-test ....................................................................................................................... 36
6.2.1 Independent samples t-test ..................................................................................................... 36
6.2.2 Paired samples t-test ................................................................................................................ 36
6.2.3 Casestudy ................................................................................................................................. 36
6.3 One-Way ANOVA .......................................................................................................................... 44
Pagina 1 van 78
, 6.3.1 Voorbeeld ................................................................................................................................. 45
6.3.2 Casestudy ................................................................................................................................. 45
7 Module 4: SPSS ..................................................................................................................................... 49
7.1 T-test and ANOVA......................................................................................................................... 49
7.2 Paired-Samples t-test ................................................................................................................... 49
7.3 Independent-Samples T-test ........................................................................................................ 49
7.4 One-Way ANOVA .......................................................................................................................... 49
7.5 Post hoc test ................................................................................................................................. 49
8 Module 5 – Pearson correlatie.............................................................................................................. 50
8.1 Definitie ........................................................................................................................................ 50
8.2 Pearson’s correlatiecoëfficiënt (Pearson r) .................................................................................. 50
8.2.1 Richting ..................................................................................................................................... 51
8.2.2 Sterkte ...................................................................................................................................... 51
8.2.3 Veelgemaakte fout: .................................................................................................................. 52
8.3 Casestudy 1................................................................................................................................... 52
8.3.1 Stap 1: Hypothese .................................................................................................................... 52
8.3.2 Stap 2: Significantie .................................................................................................................. 52
8.3.3 Stap 3: Steekproef en statistische test ..................................................................................... 52
8.3.4 Stap 4: bereken de p-waarde ................................................................................................... 53
8.3.5 Stap 5: Conclusie ...................................................................................................................... 53
8.4 Let op!........................................................................................................................................... 53
8.5 Determinatiecoëfficiënt (r²) ......................................................................................................... 54
8.5.1 Definitie .................................................................................................................................... 54
8.5.2 Betekenis .................................................................................................................................. 54
8.6 Casestudy 2................................................................................................................................... 54
8.6.1 Stap 1: Hypothese .................................................................................................................... 55
8.6.2 Stap 2: Significantieniveau ().................................................................................................. 55
8.6.3 Stap 3: Steekproef en statistische test ..................................................................................... 55
8.6.4 Stap 4: p-waarde ...................................................................................................................... 55
8.6.5 Stap 5: Conclusie ...................................................................................................................... 55
9 Module 5 – SPSS.................................................................................................................................... 56
9.1 Pearson correlation ...................................................................................................................... 56
10 Module 6 – Lineaire regressie ............................................................................................................... 57
10.1 Inleiding ........................................................................................................................................ 57
10.2 Regressie....................................................................................................................................... 57
10.2.1 Voorbeeld 1 .......................................................................................................................... 57
10.2.2 Voorbeeld 2 .......................................................................................................................... 57
Pagina 2 van 78
, 10.3 Lineaire regressie.......................................................................................................................... 58
10.3.1 Enkelvoudige lineaire regressie:........................................................................................... 58
10.3.2 Meervoudige lineaire regressie:........................................................................................... 58
10.3.3 Enkelvoudige lineaire regressie............................................................................................ 58
10.3.4 Meervoudige lineaire regressie............................................................................................ 63
10.4 Assumpties ................................................................................................................................... 67
10.4.1 Lineariteit ............................................................................................................................. 67
10.4.2 Normaal-verdeelde fouten................................................................................................... 68
10.4.3 Onafhankelijke fouten.......................................................................................................... 69
10.4.4 Homoscedasticiteit ............................................................................................................... 69
10.4.5 Multicollineariteit ................................................................................................................. 70
11 Module 6 – SPSS.................................................................................................................................... 71
11.1 Simple linear regression ............................................................................................................... 71
11.2 Multiple linear regression............................................................................................................. 71
11.3 Assumptions ................................................................................................................................. 71
11.3.1 Linearity : scatterplot ........................................................................................................... 71
11.3.2 Normality of residuals .......................................................................................................... 71
11.3.3 Independent errors: Durbin-Watson ................................................................................... 71
11.3.4 Homoscedasticity: scatterplot – residuals against predicted values ................................... 71
12 Module 7 – Kies de juiste statistische test ............................................................................................ 72
12.1 Statistische toetsen ...................................................................................................................... 72
12.1.1 Parametrische toetsen ......................................................................................................... 72
12.1.2 Niet-parametrische toetsen ................................................................................................. 75
12.2 Welke toets uitvoeren? ................................................................................................................ 75
12.2.1 Stap 1: Interpreteer de onderzoeksvraag ............................................................................ 75
12.2.2 Casestudy ............................................................................................................................. 77
13 Module 7 – SPSS.................................................................................................................................... 78
13.1 Normally distributed errors: Kolmogorov-Smirnov and qq-plot .................................................. 78
Pagina 3 van 78
,1 MODULE 1 – INLEIDING TOT DE STATISTIEK
Wetenschap gaat over het verzamelen van data en verklaringen te zoeken voor die data.
- Kwalitatieve onderzoeksmethoden: wanneer gegevens bestaan uit woorden of tekst (vb.
interviews)
- Kwantitatieve onderzoeksmethode: wanneer data bestaat uit cijfers.
= een set van tools en technieken die gebruikt wordt voor het beschrijven, organiseren en
interpreteren van informatie of gegevens.
1.1 ONDERZOEKSPROCES
1.1.1 Wat je doet
1.1.1.1 Onderzoeksvraag genereren
Elk onderzoek begint met een duidelijk geformuleerde vraag of probleem waarop het onderzoek een
antwoord wil bieden → vraag moet ondubbelzinnig geformuleerd worden, zodat we precies weten welke
doelgroepen we willen bestuderen.
1.1.1.2 Raadplegen van een theorie
= Eerste stap om een onderzoeksvraag te beantwoorden.
- Theorie = een uitleg of set van principes die een breed fenomeen verklaart en die goed
onderbouwd is door herhaaldelijk te zijn getest. Theorieën zijn heel algemeen van toepassing op
alle entiteiten of toepassingen.
- Een hele set van entiteiten = een populatie → een theoretische groep waarover je conclusies wilt
trekken.
o Voorbeeld: alle potentiële klanten
1.1.1.3 Hypothesen genereren
Op basis van de voorgaande theorieën genereren we hypothesen.
- Hypothese = een vooropgestelde verklaring voor een vrij beperkt fenomeen of reeks
waarnemingen. Een theorie verklaart een breed scala aan fenomenen en werd reeds getest,
hypotheses proberen een enger fenomeen te verklaren en zijn nog niet getest geweest.
Pagina 4 van 78
, 1.1.1.4 Verzamelen van data
Verzamel data om de gegenereerde hypothese te testen.
- Om hypotheses te testen moeten we gegevens verzamelen die we achteraf zullen analyseren.
1.1.1.5 Analyseer de data
Dit kan door beschrijvende en inferentiële statistiek.
1.1.1.6 Veralgemeen de resultaten
1.1.2 Hoe je het doet
1.1.2.1 Observeer de wereld of lees
De onderzoeksvraag kan voorkomen door iets dat je vaststelt doordat je de wereld observeert of
voorgaande literatuur leest waar er leemtes in zitten.
- Variabele: wordt in een dataset weergegeven als een kolom. 𝜋 is bijvoorbeeld een constante, is
altijd deze waarde, pi verandert nooit. Is dus geen variabele.
- Case: hoe weten we dan welke waarde uit één en dezelfde bron zijn verzameld, eenmaal we al de
variabelen hebben?
→ een case/observatie = een groep van gegevens verzameld over één of meerdere variabelen,
maar van één of dezelfde bron. Een case wordt weergegeven als een rij.
- Dataset = verzameling van gegevens die op één of andere manier aan elkaar gekoppeld zijn. Dit is
een spreadsheet met variabelen als kolommen en cases of observaties als rijen.
o Elke variabele vertegenwoordigt een verzameling van één enkel type gegeven.
o Case of observatie: alle gegevens over alle variabelen in de dataset uit één enkel bron.
1.1.2.2 Meet variabelen
Om onze hypothese te testen moeten we data verzamelen, wat gedaan wordt door het meten van
variabelen. Verschillende soorten variabelen vereisen verschillende soorten analyses.
Kwalitatieve variabelen (categorische variabelen)
Opgebouwd uit categorieën waarbij een entiteit in slechts één van de categorieën kan worden geplaatst.
vb.: dieren (koe, kat, hond) → een dier is OF een kat OF een hond, kan niet beide zijn.
- Binaire of dichotome variabele = een categorische variabele met slechts twee categorieën
(man/vrouw, ja/nee, levend/dood).
- Niet numeriek van aard → kunnen als cijfers worden gecodeerd. Cijfers worden soms
toegewezen aan kwalitatieve variabelen voor data-analyse, maar worden nog steeds
geclassificeerd als kwalitatieve variabelen → dit principe staat gekend als codering.
Pagina 5 van 78
, De cijfers betekenen niets meer dan de namen van de categorieën. Je kan er dus geen berekening
mee maken, of het is zinloos om dit te doen. Je kan een hond bv niet optellen met een kat. (geen
appelen met peren vergelijken)
- Nominaal:
o eenvoudigste meetschaal → beschrijvingen of labels zonder orde (vb.: geslacht,
chocoladesoort, kleur). We kunnen vrouwen en mannen niet rangschikken of zeggen dat
de ene kleur superieur is aan de andere.
- Ordinaal:
o Vb.: olympische medailles, militaire rangen, tevredenheid.
o Ordinale variabelen hebben een betekenisvolle volgorde. De intervallen tussen de
waarden in de schaal zijn echter niet gelijk. (kleiner verschil tussen tevreden en zeer
tevreden dan tussen ontevreden en tevreden).
Kwantitatieve variabelen (scale variabelen)
Hebben een bepaalde numerieke weergave hebben en die numerieke informatie bevatten.
vb: lengte, leeftijd en gewicht → Je kan berekeningen maken, zoals de leeftijd van twee personen
optellen.
- Interval:
o Vb: temperatuur en kalenderjaren
o Geordende categorieën + vereist ook dat de intervallen tussen de categorieën gelijk zijn.
Intervallen hebben geen echt nulpunt, waarden onder nul kunnen. → verhoudingen of
ratio’s hebben geen zin. Ratio’s of verhoudingen van kalenderjaren hebben geen zin
omdat de keuze van het jaar nul willekeurig is en niet het begin van de tijd betekent.
100°C is niet twee keer zo warm als 50°C. 0 graden is geen echt nulpunt.
- Ratio:
o Eist dat naast de vereisten van de intervalvariabelen de verhoudingen of ratio’s van
waarden zinvol moeten zijn. Gaat dus een stap verder dan interval. Schalen moeten dus
een echt en zinvol nulpunt hebben, waar er dus een volledige afwezigheid is van hetgeen
je aan het meten bent. Intervallen zijn consistent, maar ze hebben ook betekenisvolle
nulpunten. We kunnen dus bv praten van 0kg, betekent dat er geen gewicht is + 10 kg is
2*5kg
o Vb.: gewicht, leeftijd, lengte, behaalde punten op het examen.
- Discreet:
o Kunnen een eindig aantal verschillende gehele waarden aannemen. Waarden voor deze
variabelen worden meestal verkregen door te tellen.
o Vb.: aantal studenten kan 19 zijn, maar niet 19,3.
o Discrete variabelen kunnen behandeld worden alsof ze continu zijn. Het gemiddeld
aantal kinderen in een gezin kan in een tijdschrift bv stijgen van 1,9 naar 2,1.
- Continu:
o Continue variabelen hebben een oneindig aantal kommagetallen. Waarden voor deze
variabelen kunnen niet worden geteld, aangezien je oneindig ver na de komma kan gaan.
o Continue variabelen kunnen wel in discrete termen worden gemeten. Bij leeftijden
gebruiken we bv nooit nanoseconden, maar gewoonweg jaren. Door het afronden
maken we van een discrete variabele een continue variabele.
- Direct meetbare variabele:
o Je kan iemands lengte direct meten met een meetlat, een gewicht kan direct op een
weegschaal geplaatst worden…
Pagina 6 van 78
, - Indirect meetbare variabele:
o Depressie, angst, intelligentie, klanttevredenheid…
o = constructen = kenmerken of eigenschappen die van belang zijn voor een populatie, zijn
conceptueel gedefinieerd (hebben in theorie betekenis) maar ze zijn niet direct
waarneembaar.
o Om constructen te meten heb je operationele definities nodig van constructen. Dit is een
(reeks) procedure(s) om gegevens te kwantificeren. → = Omzetting van een abstract of
hypothetisch begrip in concrete handelingen om belangrijke aspecten van dat begrip
constateerbaar en meetbaar te maken.
Meetniveau of meetschaal
= De relatie tussen wat wordt gemeten en de getallen die vertegenwoordigen wat er wordt gemeten.
Variabelen kunnen veel verschillende vormen en niveaus van verfijning aannemen.
Oefening:
Oplossing:
Variabele Kwalitatief of Meetniveau Continu of discreet
kwantitatief
Winkel Kwalitatief Nominaal Discreet
Q1 Kwantitatief/kwalitatief Ordinaal/Interval Discreet
Q2 Kwantitatief Ratio Discreet
Q3 Kwalitatief Nominaal Discreet
- Kwalitatieve variabelen zijn altijd discreet.
Om hypotheses te testen moeten we variabelen meten. De meeste hypotheses kunnen worden
uitgedrukt in termen van twee variabelen:
- Voorspellende variabele:
o Onafhankelijke variabele: de waarde ervan is niet afhankelijk van andere variabelen.
o Verklarende variabele: het kan worden gebruikt om de scores van een andere variabele
te voorspellen.
- Uitkomstvariabele:
o Afhankelijke variabele: de waarde ervan is afhankelijk van de voorspellende variabele.
o Verklaarde variabele: we trachten de uitkomstvariabele te verklaren door de
voorspellende variabele.
Pagina 7 van 78
,Vb.: hypothese: klantentevredenheid verschilt per winkellocatie.
- Voorspellende variabele = winkellocatie → we verklaren of voorspellen de klanttevredenheid op
basis van de winkel waar de klant naartoe is gegaan.
- Uitkomstvariabele = klanttevredenheid → de waarde ervan is afhankelijk van de winkellocatie,
dus is afhankelijk van de voorspellende variabele. We trachten ook de klantentevredenheid te
verklaren door de winkellocatie.
2 variabelen want we kunnen (1) de locatie variëren en (2) de klanten anders tevreden zullen zijn. Der
sleutel tot het testen van hypothese is het meten van deze twee variabelen.
Oefening:
Oplossing:
- Afhankelijke variabele: (1) Verkoop; (2) prestatie
- Onafhankelijke variabele: (1) reclame-uitgaven; (2) attitude
1.1.2.3 Beschrijvende en inferentiële statistiek
Na het analyseren van de data kan je twee zaken doen met de gegevens.
Beschrijvende statistiek
je kan om de steekproef te beschrijven een grafiek maken of een samenvattende, beschrijvende gegevens
berekenen. Beschrijvende statistiek kan alleen gebruikt worden om de gegevens te beschrijven die uit een
steekproef zijn verzameld.
Inferentiële statistiek
Stelt ons in staat om de gegevens die uit een steekproef zijn verzameld, te generaliseren of extrapoleren
naar de populatie waaruit die steekproef afkomstig is. Eens we inferentiële statistiek hanteren is het
belangrijk om ervan bewust te zijn dat onze steekproef representatief is voor de populatie waartoe we
veralgemenen.
1.1.3 Waar je het op doet
We proberen een vraag te beantwoorden m.b.v. gegevens. Het probleem is dat je conclusies wil trekken
over de hele populatie, maar het is meestal onhaalbaar om gegevens te verzamelen van elke entiteit. Als
gevolg daarvan gaan we een steekproef gebruiken.
1.1.3.1 Populatie
= een theoretische groep waarover je conclusies wilt trekken. Verwijst naar het totaal aantal dingen
waarin we geïnteresseerd zijn. Een populatie kan allerlei zijn, zoals huizen, mensen, katten.
Pagina 8 van 78
, Parameter:
- Iets dat de populatie samenvat.
- Gemiddelde klanttevredenheid in de populatie = parameter
- Parameters kunnen we alleen maar schatten, op basis van de steekproefgegevens.
1.1.3.2 Steekproef
= een kleinere set van entiteiten uit een populatie. Dit is dus een subgroep van de populatie die gebruikt
wordt voor onderzoek. Hieruit trekken we conclusies voor de hele populatie.
Statistiek
- We kunnen de gegevens in de steekproef gebruiken om statistieken te berekenen. Statistieken
worden rechtstreeks berekend op basis van de gegevens uit de steekproef die we verzamelen.
- Een statistiek is een waarde dat de steekproef beschrijft, vat de steekproef samen. We kunnen
deze waarde gebruiken om te schatten wat de waarde zou zijn geweest als we de gegevens van
de hele populatie hadden verzameld.
- Gemiddelde klanttevredenheid in de steekproef = statistiek.
Welke garanties hebben we dat onze conclusies uit de steekproef gelden voor de ganse populatie? Door
niet-representatieve steekproeven kunnen we potentieel verkeerde conclusies trekken. De kans op
representativiteit kunnen we verhogen door onze observaties willekeurig te selecteren.
- Eenvoudige willekeurige steekproef = subset van een populatie waarin elk lid van de subset een
gelijke kans heeft om gekozen te worden.
o Is bedoeld om de steek zo representatief mogelijk te maken.
- Steekproefvertekening (sample bias) = een soort vertekening die wordt veroorzaakt door het
kiezen va niet-willekeurige gegevens voor statistische analyses. De vertekening bestaat door een
fout in het steekproefselectieproces, waarbij een subset va de gegevens systematisch wordt
uitgesloten vanwege een bepaald kenmerk (zie lesopname 1: minuut 33 – 35).
We willen dus dat de entiteiten die we kiezen voor onze steekproef representatief zijn voor de bredere
populatie. Dat kunnen we doen door ze willekeurig te selecteren. Gevolg:
1. Statistieken variëren tussen verschillende steekproeven → steekproefvariatie (sample variation)
2. Omdat we naar een subgroep van de populatie kijken, krijgen we niet alle informatie over die
populatie. Vanwege natuurlijke variatie zal elke steekproef slechts de populatie benaderen. Het
verschil tussen wat de populatieparameter werkelijk is en de waarde die op basis van de
steekproef wordt geschat, staat bekend als de steekproeffout (sample error).
Je gebruikt dus de gegevens (statistieken) in de steekproef om de parameters in de populatie te schatten.
Deze schatting kan onjuist zijn omdat steekproeven van elkaar verschillen en omdat steekproeven ook
kunnen verschillen van de populatie. Hoe kleiner de steekproef, hoe groter de kans op een potentiële
steekproeffout. Hoe representatiever en groter de steekproef, hoe beter de generalisering naar de
populatie.
1.1.3.3 Hoe worden al deze gegevens verzameld?
Twee belangrijke benaderingen:
Observationeel onderzoek (correlationeel onderzoek)
Je onderzoekt wat er in de natuur gebeurt zonder u er als onderzoeker mee te moeien. Dit geeft een heel
natuurlijk beeld van de vraag dat we onderzoeken, omdat we geen invloed hebben op wat er gebeurt en
de metingen van de variabelen niet mogen worden beïnvloed door de aanwezigheid van de onderzoeker.
Pagina 9 van 78