Statistiek B
1-4-2021
B1) Visualiseren 20%
Standaarddeviatie: lengte van de wolk, spreiding
Gemiddelde: Midden van de wolk en dan naar onder en zijkant trekken
Hellingscoëfficiënt: Let op positief/negatief. Letterlijk de helling, hoe steil het gaat
Intercept: Regressielijn tekenen (midden van de punten en dan doortrekken naar y-as bij x=o
Lineairiteit: Kijken hoe de regressielijn zou lopen (is deze lineair). Altijd lineair tenzij het echt echt
heel duidelijk niet lineair is
Correlatie: Hoe dicht zitten de punten bij de regressielijn? Let op positief/negatief
Proportie verklaarde variantie: Positief/negatief maakt niet uit. Hoe dicht zitten de punten bij de
regressielijn. Hoe meer de correlatie van 0 af zit, hoe hoger de proportie verklaarde variantie is.
minder spreiding
B2) Elementair rapport van samenhang tussen twee
variabelen 20%
Rekenmachine in mode 3. Invullen: [x-score] [,] [y-score] [mt+]. N controleren.
Let op spelling!
1. Design
Afhankelijke (Y = vermoede gevolg) en onafhankelijke variabele (X = verwachte oorzaak) X -> Y +
meetniveau ’s.
(Kwantitatieve variabele) erachter
Vb: afhankelijke variabele hartslag (kwantitatief)
2. Correlatie (r) = een maat voor de sterkte en de richting van de samenhang tussen twee
kwantitatieve variabelen. Deze ligt tussen 1 en -1.
Regressielijn = rechte lijn door de puntenwolk getrokken: Y = a+bX
3. Hellingscoëficiënt (b) = hoe steil de lijn is
4. Intercept (a) = op welke hoogte de regressielijn de y-as (bij x=o) snijdt.
5. Lineairiteit = maken van spreidingstabel
N te klein = min 20 nodig anders niks erover kunnen zeggen.
Non-lineaire = als de linker- en rechterhelft van de puntenwolk zichtbaar verschillende
regressielijnen hebben.
Lineair = bandgemiddelde komen precies op een rechte lijn, dus regressielijn.
Tenzij echt geschonden, anders altijd lineair.
6. Invloedrijke waarnemingen = weglating zou leiden tot drastische verandering van de
regressielijn of de correlatie.
Weglaten punt zorgt ervoor dat het kwadraat van de correlatie meer dan 0.20 verandert.
Letten op gigantisch hoge of lage y-waarden en dan of ze vooral aan begin of eind van de lijn:
dus of een lage of juist hele hoge x waarden met een extreme y waarde. De invloed van een
waarneming neemt toe als de X-score verder van het gemiddelde is verwijderd of de Y-score
verder van de regressielijn afwijkt.
1-4-2021
B1) Visualiseren 20%
Standaarddeviatie: lengte van de wolk, spreiding
Gemiddelde: Midden van de wolk en dan naar onder en zijkant trekken
Hellingscoëfficiënt: Let op positief/negatief. Letterlijk de helling, hoe steil het gaat
Intercept: Regressielijn tekenen (midden van de punten en dan doortrekken naar y-as bij x=o
Lineairiteit: Kijken hoe de regressielijn zou lopen (is deze lineair). Altijd lineair tenzij het echt echt
heel duidelijk niet lineair is
Correlatie: Hoe dicht zitten de punten bij de regressielijn? Let op positief/negatief
Proportie verklaarde variantie: Positief/negatief maakt niet uit. Hoe dicht zitten de punten bij de
regressielijn. Hoe meer de correlatie van 0 af zit, hoe hoger de proportie verklaarde variantie is.
minder spreiding
B2) Elementair rapport van samenhang tussen twee
variabelen 20%
Rekenmachine in mode 3. Invullen: [x-score] [,] [y-score] [mt+]. N controleren.
Let op spelling!
1. Design
Afhankelijke (Y = vermoede gevolg) en onafhankelijke variabele (X = verwachte oorzaak) X -> Y +
meetniveau ’s.
(Kwantitatieve variabele) erachter
Vb: afhankelijke variabele hartslag (kwantitatief)
2. Correlatie (r) = een maat voor de sterkte en de richting van de samenhang tussen twee
kwantitatieve variabelen. Deze ligt tussen 1 en -1.
Regressielijn = rechte lijn door de puntenwolk getrokken: Y = a+bX
3. Hellingscoëficiënt (b) = hoe steil de lijn is
4. Intercept (a) = op welke hoogte de regressielijn de y-as (bij x=o) snijdt.
5. Lineairiteit = maken van spreidingstabel
N te klein = min 20 nodig anders niks erover kunnen zeggen.
Non-lineaire = als de linker- en rechterhelft van de puntenwolk zichtbaar verschillende
regressielijnen hebben.
Lineair = bandgemiddelde komen precies op een rechte lijn, dus regressielijn.
Tenzij echt geschonden, anders altijd lineair.
6. Invloedrijke waarnemingen = weglating zou leiden tot drastische verandering van de
regressielijn of de correlatie.
Weglaten punt zorgt ervoor dat het kwadraat van de correlatie meer dan 0.20 verandert.
Letten op gigantisch hoge of lage y-waarden en dan of ze vooral aan begin of eind van de lijn:
dus of een lage of juist hele hoge x waarden met een extreme y waarde. De invloed van een
waarneming neemt toe als de X-score verder van het gemiddelde is verwijderd of de Y-score
verder van de regressielijn afwijkt.