CORRELATIE & REGRESSIE
(OEFENSESSIE 7)
• relatie tussen 2 nominale variabelen
of
• een nominale en een ratiovariabele
→ hebben in vorige oefensessie behandeld:
Voorbeeld:
• is de tevredenheid over de dienstverlening (nominaal) afhankelijk van het
bankkantoor (nominaal)?
→ Dit probleem werd opgelost met behulp van kruistabellen & de
chikwadraattest
• is de (gemiddelde) verkoopprijs van een pand (ratio) afhankelijk van de
gemeente (nominaal)?
→ Dit probleem lossen we op met een ANOVA en/of de T-test
Hoe controleren we nu of er een relatie is tussen twee kwantitatieve
(ratio-)variabelen?
Bijvoorbeeld:
• is het examenresultaat voor wiskunde (ratio) gerelateerd aan de scores voor een
instaptest aan de start van het semester (ratio)?
• Is de waarde van een halfopen bebouwing (ratio) afhankelijk van de
perceeloppervlakte (ratio)?
→ Deze problemen lossen we op met correlatie-en regressieanalyse
, 1 ONDERSTEUNENDE OEFENING – RESULTATEN WISKUNDE
1.1 VISUEEL VERBAND – SPREIDINGSGRAFIEKEN
1. Haal JASP-bestand “7.1 Resultaten wiskunde” af;
→ Hier in vinden test- en examenresultaten wiskunde van een aantal studenten
houttechnologie.
Kijken of het vermoeden van een relatie correct is
• doen we met behulp van de spreidingsgrafieken.
→ Hiervoor laden we zowel de scores voor de basistest als het examen in
bij de variables
2. Via descriptives – Basic plotsvragen we de correlation plots op:
In outputvenster:
• krijgen we behalve klassieke steekproefparameters
• nu ook de correlatiegrafieken,
→ waarop we een eventueel lineair verband tussen
de twee variabelen kunnen zien.
eerste variabele in het variables-venster: wordt als 𝑦-
waarde genomen
de tweede: als 𝑥-waarde;
→ we kunnen deze desgewenst in het variables-
venster omdraaien zodat we de scores voor de
basistest op de 𝑋-as plaatsen, tegenover de
examenscores op de 𝑌-as
→ We willen namelijk weten of de scores voor
de basistest de examenresultaten kunnen voorspellen
We zien op het zicht:
(OEFENSESSIE 7)
• relatie tussen 2 nominale variabelen
of
• een nominale en een ratiovariabele
→ hebben in vorige oefensessie behandeld:
Voorbeeld:
• is de tevredenheid over de dienstverlening (nominaal) afhankelijk van het
bankkantoor (nominaal)?
→ Dit probleem werd opgelost met behulp van kruistabellen & de
chikwadraattest
• is de (gemiddelde) verkoopprijs van een pand (ratio) afhankelijk van de
gemeente (nominaal)?
→ Dit probleem lossen we op met een ANOVA en/of de T-test
Hoe controleren we nu of er een relatie is tussen twee kwantitatieve
(ratio-)variabelen?
Bijvoorbeeld:
• is het examenresultaat voor wiskunde (ratio) gerelateerd aan de scores voor een
instaptest aan de start van het semester (ratio)?
• Is de waarde van een halfopen bebouwing (ratio) afhankelijk van de
perceeloppervlakte (ratio)?
→ Deze problemen lossen we op met correlatie-en regressieanalyse
, 1 ONDERSTEUNENDE OEFENING – RESULTATEN WISKUNDE
1.1 VISUEEL VERBAND – SPREIDINGSGRAFIEKEN
1. Haal JASP-bestand “7.1 Resultaten wiskunde” af;
→ Hier in vinden test- en examenresultaten wiskunde van een aantal studenten
houttechnologie.
Kijken of het vermoeden van een relatie correct is
• doen we met behulp van de spreidingsgrafieken.
→ Hiervoor laden we zowel de scores voor de basistest als het examen in
bij de variables
2. Via descriptives – Basic plotsvragen we de correlation plots op:
In outputvenster:
• krijgen we behalve klassieke steekproefparameters
• nu ook de correlatiegrafieken,
→ waarop we een eventueel lineair verband tussen
de twee variabelen kunnen zien.
eerste variabele in het variables-venster: wordt als 𝑦-
waarde genomen
de tweede: als 𝑥-waarde;
→ we kunnen deze desgewenst in het variables-
venster omdraaien zodat we de scores voor de
basistest op de 𝑋-as plaatsen, tegenover de
examenscores op de 𝑌-as
→ We willen namelijk weten of de scores voor
de basistest de examenresultaten kunnen voorspellen
We zien op het zicht: