Real world project
Voor het project van real world project heb ik gebruik gemaakt van de data set van de website www.kaggle.com-
consumentengedrag en winkelgewoonten.
De data bestaat onder andere uit de volgende variabelen:
- Leeftijd
- Geslacht
- Gekocht item en de categorie
- Aankoopbedrag
- Seizoen van aankoop
Het totaal van consumenten in de dataset bedraagt 3900 (N=3900). De dataset is gebruik gemaakt om te kijken
in welke seizoen consumenten meer besteden en hoe groot deze bestedingen per aankoop zijn. Deze dataset
wordt gebruikt om te kunnen sturen op marketingstrategieën van bedrijven.
De volgende testen zullen gaan worden uitgevoerd:
1. Een test op het gemiddelden waarbij het gemiddelde van de uitgaven in het voorjaar zal worden
vergeleken met het gemiddelde van de uitgaven in het najaar.
2. Een test op de proportie van de consumenten welke meer dan 50 euro uitgeven per aankoop.
Voor beide testen is een significantieniveau van a= 0.05 gehanteerd. Aangezien het onderzoek geen informatie
omvat welke van levensbelang zijn is voor een gemiddeld ofwel normaal significantieniveau gekozen. Het niet
van levensbelang zijn wil zeggen dat indien er een afwijking kan zijn van meer dan 1% zonder dat het grote
consequenties heeft voor het sociale of bedrijven aspect.
Aan het einde van het onderzoek kan worden geconcludeerd of er in een bepaald seizoen meer aankopen
worden gedaan en of hoeveel procent van de totaal populatie meer dan 50 euro uitgeeft per aankoop.
Hypothese 1 Hypothese 2
Twee gemiddelde, twee populaties X
Proportie van een populatie X
Voor het project van real world project heb ik gebruik gemaakt van de data set van de website www.kaggle.com-
consumentengedrag en winkelgewoonten.
De data bestaat onder andere uit de volgende variabelen:
- Leeftijd
- Geslacht
- Gekocht item en de categorie
- Aankoopbedrag
- Seizoen van aankoop
Het totaal van consumenten in de dataset bedraagt 3900 (N=3900). De dataset is gebruik gemaakt om te kijken
in welke seizoen consumenten meer besteden en hoe groot deze bestedingen per aankoop zijn. Deze dataset
wordt gebruikt om te kunnen sturen op marketingstrategieën van bedrijven.
De volgende testen zullen gaan worden uitgevoerd:
1. Een test op het gemiddelden waarbij het gemiddelde van de uitgaven in het voorjaar zal worden
vergeleken met het gemiddelde van de uitgaven in het najaar.
2. Een test op de proportie van de consumenten welke meer dan 50 euro uitgeven per aankoop.
Voor beide testen is een significantieniveau van a= 0.05 gehanteerd. Aangezien het onderzoek geen informatie
omvat welke van levensbelang zijn is voor een gemiddeld ofwel normaal significantieniveau gekozen. Het niet
van levensbelang zijn wil zeggen dat indien er een afwijking kan zijn van meer dan 1% zonder dat het grote
consequenties heeft voor het sociale of bedrijven aspect.
Aan het einde van het onderzoek kan worden geconcludeerd of er in een bepaald seizoen meer aankopen
worden gedaan en of hoeveel procent van de totaal populatie meer dan 50 euro uitgeeft per aankoop.
Hypothese 1 Hypothese 2
Twee gemiddelde, twee populaties X
Proportie van een populatie X