Contents
Hoofstuk 1: Begrippen...............................................................................................................................................1
1. Soorten Analytics..................................................................................................................................................1
2. Fases in Kwantitatieve Analyse..............................................................................................................................2
3. Statistische Basisconcepten...................................................................................................................................2
4. Afhankelijke en Onafhankelijke Variabelen...........................................................................................................4
5. Sample en Populatie..............................................................................................................................................5
hoofdstuk 2 : Beschrijven van data...........................................................................................................................7
Hoofdstuk 3: Centrum-en spreidingsmaten..............................................................................................................9
Hoofstuk 4: Correlatie en regressie.........................................................................................................................16
6. Samenhang tussen variabelen............................................................................................................................16
7. Significantieniveau...............................................................................................................................................17
8. Scatterplot lezen..................................................................................................................................................17
9. Correlatiecoëfficiënt berekenen en interpreteren..............................................................................................18
10. Regressie............................................................................................................................................................18
11. Verklarende variantie........................................................................................................................................19
12. Voorspelling op basis van regressievergelijking................................................................................................19
Hoofstuk 5: chikwadraat..........................................................................................................................................20
Hoofdstuk 6: Gemiddelde scores van twee groepen vergelijken............................................................................21
1. T-test....................................................................................................................................................................21
2. significantieniveau...............................................................................................................................................21
3. Soorten t-test.......................................................................................................................................................22
Wat is Business Analytics?
Hoofstuk 1: Begrippen
Wat is BA: Proces van verzamelen, analyseren en interpreteren van gegevens.
Doel: Ondersteunen en verbeteren van bedrijfsbeslissingen.
Omvat het gebruik van:
Statistische analyses
Datavisualisatie
Voorspellende modellen
Om Inzicht in zakelijke prestaties en identificatie van trends en patronen.
1. Soorten Analytics
Descriptive Analytics: Wat is er gebeurd?
1
, Diagnostic Analytics: Waarom is het gebeurd?
Predictive Analytics: Wat zal er waarschijnlijk gebeuren?
( voorspellen wat er in de toekomst zal gebeuren)
Prescriptive Analytics: Wat moeten we doen?
( advies geven over welke acties je moet nemen op basis van voorspellingen)
1
2. Fases in Kwantitatieve Analyse
Stappen:
1. Probleem formuleren
2. Vorige bevindingen herzien
3. Modelleren
4. Gegevens verzamelen
5. Data-analyse
6. Resultaten communiceren en actie ondernemen
3. Statistische Basisconcepten
Variabelen: Een variabele is een eigenschap of kenmerk van ene object die verschillende waarden kan
aannemen. Variabelen kunne kwantitatief zijn, dat wil zeggen in getallen uit te drukken, zoals lengte en
leeftijd,zoals omzet en winst. Maar varibelen kunnen ook kwalitatief zijn en dan laten de kenmerken zich alleen
in woorden omschrijven; geslacht,haarkleur,beroep.
Meetniveaus: Categorieën van variabelen die meer vertellen over welke statistische technieken mijn kan
gebruiken om data te verwerken
Nominaal: Categorisering zonder rangorde. ( vaak tekst)
Hier: dichotome variabelen (= kan slechts 2 mogelijke waarden aannemen).
Bv. geslacht, tramnummer, land, rugnummer … Berekeningen hebben weinig zin.
Ordinaal: Categorisering met duidelijke rangorde.
Vb 1ste – 2de – 3de plaats in de marathon => orde
Zegt wel iets meer over de loopkwaliteiten van deze 3 winnaars, dan het rugnummer
1ste is beter dan 2de, 2de is beter dan 3de
Maar we weten niet precies ‘hoeveel’ beter (diegene die 6de werd is niet perse 2 keer minder goed dan de 3 de
finalist) – de afstand tussen de categorieën kennen we niet exact
Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en de intervallen (afstanden)
tussen de categorieën zijn gelijk (bijvoorbeeld steeds een stap van 10).
2
, Het verschil tussen 10 en 20 is hetzelfde als het verschil tussen 60 en 70
Het gaat om schalen, bedacht door de mens: IQ, angstschaal (psychologie), het jaar 0, Celcius…, voorzien van
een arbitrair nulpunt (het jaar 0, 0 graden, een IQ vna 100)
Er kunnen waarden onder en boven 0 liggen
Het nulpunt is GEEN absoluut nulpunt: 0 wil niet zeggen dat het kenmerk afwezig is
Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de intervallen tussen de
categorieën zijn gelijk en er is een betekenisvol nulpunt
Vb: Tijd van 2u14min28sec = indicatie van een hoeveelheid
Verhouding tussen getallen kan rechtstreeks geïnterpreteerd worden (want er zijn gelijke intervallen)
2u14m28s = twee keer zoveel als 1u7m14s
Nulpunt (0 sec)=> heeft ook een betekenis, nl. geen tijd (dit is dus een absoluut nulpunt)
Voorbeelden van ratiovariabelen: gewicht, hoogte, bloeddruk, tijd, revenu, budget,…
Categorische variabelen kunnen opgesplitst worden in :
Binaire variabelen
Dichotoom
Ja/neen
Kop/munt
Nominale variabelen :Categorieën die niet op een natuurlijke wijze kunnen worden gerangschikt
Kleuren
Namen van diersoorten
Merken van auto’s
Ordinale variabelen :Categorieën die op een natuurlijke wijze kunnen worden gerangschikt
Opleidingsniveau
Taalvaardigheid
Er zijn twee soorten kwantitatieve variabelen:
Discrete variabelen (geheel getal)
3
Hoofstuk 1: Begrippen...............................................................................................................................................1
1. Soorten Analytics..................................................................................................................................................1
2. Fases in Kwantitatieve Analyse..............................................................................................................................2
3. Statistische Basisconcepten...................................................................................................................................2
4. Afhankelijke en Onafhankelijke Variabelen...........................................................................................................4
5. Sample en Populatie..............................................................................................................................................5
hoofdstuk 2 : Beschrijven van data...........................................................................................................................7
Hoofdstuk 3: Centrum-en spreidingsmaten..............................................................................................................9
Hoofstuk 4: Correlatie en regressie.........................................................................................................................16
6. Samenhang tussen variabelen............................................................................................................................16
7. Significantieniveau...............................................................................................................................................17
8. Scatterplot lezen..................................................................................................................................................17
9. Correlatiecoëfficiënt berekenen en interpreteren..............................................................................................18
10. Regressie............................................................................................................................................................18
11. Verklarende variantie........................................................................................................................................19
12. Voorspelling op basis van regressievergelijking................................................................................................19
Hoofstuk 5: chikwadraat..........................................................................................................................................20
Hoofdstuk 6: Gemiddelde scores van twee groepen vergelijken............................................................................21
1. T-test....................................................................................................................................................................21
2. significantieniveau...............................................................................................................................................21
3. Soorten t-test.......................................................................................................................................................22
Wat is Business Analytics?
Hoofstuk 1: Begrippen
Wat is BA: Proces van verzamelen, analyseren en interpreteren van gegevens.
Doel: Ondersteunen en verbeteren van bedrijfsbeslissingen.
Omvat het gebruik van:
Statistische analyses
Datavisualisatie
Voorspellende modellen
Om Inzicht in zakelijke prestaties en identificatie van trends en patronen.
1. Soorten Analytics
Descriptive Analytics: Wat is er gebeurd?
1
, Diagnostic Analytics: Waarom is het gebeurd?
Predictive Analytics: Wat zal er waarschijnlijk gebeuren?
( voorspellen wat er in de toekomst zal gebeuren)
Prescriptive Analytics: Wat moeten we doen?
( advies geven over welke acties je moet nemen op basis van voorspellingen)
1
2. Fases in Kwantitatieve Analyse
Stappen:
1. Probleem formuleren
2. Vorige bevindingen herzien
3. Modelleren
4. Gegevens verzamelen
5. Data-analyse
6. Resultaten communiceren en actie ondernemen
3. Statistische Basisconcepten
Variabelen: Een variabele is een eigenschap of kenmerk van ene object die verschillende waarden kan
aannemen. Variabelen kunne kwantitatief zijn, dat wil zeggen in getallen uit te drukken, zoals lengte en
leeftijd,zoals omzet en winst. Maar varibelen kunnen ook kwalitatief zijn en dan laten de kenmerken zich alleen
in woorden omschrijven; geslacht,haarkleur,beroep.
Meetniveaus: Categorieën van variabelen die meer vertellen over welke statistische technieken mijn kan
gebruiken om data te verwerken
Nominaal: Categorisering zonder rangorde. ( vaak tekst)
Hier: dichotome variabelen (= kan slechts 2 mogelijke waarden aannemen).
Bv. geslacht, tramnummer, land, rugnummer … Berekeningen hebben weinig zin.
Ordinaal: Categorisering met duidelijke rangorde.
Vb 1ste – 2de – 3de plaats in de marathon => orde
Zegt wel iets meer over de loopkwaliteiten van deze 3 winnaars, dan het rugnummer
1ste is beter dan 2de, 2de is beter dan 3de
Maar we weten niet precies ‘hoeveel’ beter (diegene die 6de werd is niet perse 2 keer minder goed dan de 3 de
finalist) – de afstand tussen de categorieën kennen we niet exact
Interval: de data kunnen worden gecategoriseerd, er is sprake van een rangorde en de intervallen (afstanden)
tussen de categorieën zijn gelijk (bijvoorbeeld steeds een stap van 10).
2
, Het verschil tussen 10 en 20 is hetzelfde als het verschil tussen 60 en 70
Het gaat om schalen, bedacht door de mens: IQ, angstschaal (psychologie), het jaar 0, Celcius…, voorzien van
een arbitrair nulpunt (het jaar 0, 0 graden, een IQ vna 100)
Er kunnen waarden onder en boven 0 liggen
Het nulpunt is GEEN absoluut nulpunt: 0 wil niet zeggen dat het kenmerk afwezig is
Ratio: de data kunnen worden gecategoriseerd, er is sprake van een rangorde, de intervallen tussen de
categorieën zijn gelijk en er is een betekenisvol nulpunt
Vb: Tijd van 2u14min28sec = indicatie van een hoeveelheid
Verhouding tussen getallen kan rechtstreeks geïnterpreteerd worden (want er zijn gelijke intervallen)
2u14m28s = twee keer zoveel als 1u7m14s
Nulpunt (0 sec)=> heeft ook een betekenis, nl. geen tijd (dit is dus een absoluut nulpunt)
Voorbeelden van ratiovariabelen: gewicht, hoogte, bloeddruk, tijd, revenu, budget,…
Categorische variabelen kunnen opgesplitst worden in :
Binaire variabelen
Dichotoom
Ja/neen
Kop/munt
Nominale variabelen :Categorieën die niet op een natuurlijke wijze kunnen worden gerangschikt
Kleuren
Namen van diersoorten
Merken van auto’s
Ordinale variabelen :Categorieën die op een natuurlijke wijze kunnen worden gerangschikt
Opleidingsniveau
Taalvaardigheid
Er zijn twee soorten kwantitatieve variabelen:
Discrete variabelen (geheel getal)
3