Voor dit Real World Project heb ik gekeken naar de verschillen in de schoolresultaten van
Amerikaanse middelbare school studenten voor het vak schrijven tussen studenten die wel de
voorbereidingscursus hebben afgerond en de studenten die niet de voorbereidingscursus
hebben afgerond. Deze verschillen heb ik onderzocht door het uitvoeren van twee statistische
toetsen, deze zullen hieronder verder worden toegelicht.
De data heb ik samen met twee medestudenten verzameld en bevat de schoolresultaten van
Amerikaanse middelbare scholieren op drie vakken, namelijk: wiskunde, lezen en schrijven.
De dataset hebben wij verkregen van: https://www.kaggle.com/spscientist/students-
performance-in-exams en deze bevat de volgende variabelen:
1. Geslacht (man/vrouw)
2. Ras/etniciteit (American Indian of Alaskan Native/Asian of Pacific Islander/ Black
of African American/ Hispanic of Latino/ White)
3. Opleidingsniveau van de ouders (associate’s degree/bachelor’s degree/master’s
degree/some college/high school/some high school)
4. Prijs van de lunch van studenten (standaard/ gratis of verlaagde prijs)
5. Voorbereidingscursus (wel/niet afgerond)
6. Wiskunde score (score van 0 tot 100 punten)
7. Lees score (score van 0 tot 100 punten)
8. Schrijf score (score van 0 tot 100 punten)
Het doel van dit onderzoek is om te kijken of er een significant verschil is de scores voor
schrijven wanneer studenten wel de voorbereidingscursus hebben afgerond (n=108) en
wanneer studenten niet de voorbereidingscursus hebben afgerond (n=192).
Voor dit onderzoek heb ik de volgende twee toetsen uitgevoerd:
1. Een hypothese toets op het gemiddelde cijfer voor schrijven tussen studenten die wel
de voorbereidingscursus hebben afgerond en studenten die niet de
voorbereidingscursus hebben afgerond.
2. Een hypothese toets op proportie van studenten die wel de voorbereidingscursus
hebben afgerond en het vak schrijven hebben gehaald.
Zie ook de tabel 1 hieronder.
Allebei de toetsen zijn uitgevoerd met een significantieniveau van a=0,05, omdat er geen
sprake is van een situatie van leven of dood, maar de resultaten ook niet geheel onbelangrijk
zijn. Derhalve is het “normale” significantieniveau van 5% gehanteerd.
De uitkomsten van dit onderzoek gecombineerd met de uitkomsten van mijn medestudenten
op de andere variabelen, kunnen bijdragen aan het verklaren van de verschillen tussen de
schoolresultaten van Amerikaanse middelbare school studenten op de vakken: wiskunde,
lezen en schrijven.
Gemiddelde Proportie Totaal
Eén populatie - 1 1
Twee populaties 1 - 1
Totaal 1 1 2
Tabel 1: Overzicht van de uitgevoerde analyses in dit onderzoek