100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4,6 TrustPilot
logo-home
Samenvatting

Summary Beschrijvende Statistiek Hoorcollege 4 (H3.3&3.4)

Beoordeling
-
Verkocht
-
Pagina's
6
Geüpload op
12-02-2023
Geschreven in
2022/2023

Dit is een samenvatting voor de leerstof van hoorcollege 4 van Beschrijvende Statistiek in de pre-master Orthopedagogiek aan de Universiteit van Amsterdam. Het behandelt hoofdstuk 3.3 en 3.4 van Statistics van Algresti & Franklin.










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
H3.3&3.4
Geüpload op
12 februari 2023
Aantal pagina's
6
Geschreven in
2022/2023
Type
Samenvatting

Voorbeeld van de inhoud

3.3. Predicting the outcome of a variable
Exploring the relationship between 2 quantitative variables graphically  scatterplot

Straight-line pattern?  correlation coefficient describes its strength numerically

Further analysis  finding an equation for the straight line that best describes that pattern

This equation can be used to predict the value of the variable designated as the response variable
from the value of the variable designated as the explanatory variable.

Regression line = predicts the value for the response variable y as a straight-line function of the
value x of the explanatory variable. Let ^y denote the predicted value of y.

- The equation for the regression line has
the form: ^y =a+bx
- a denotes the y-intercept and b denotes
the slope.



y-intercept = the predicted value of y when x = 0

slope = equals the amount that ^y changes when
x increases by one unit.

- For two x values that differ by 1.0, the ^y
values differ by b.




When the slope is negative  ^y decreases as x
increases. The straight line then goes downward,
and the association is negative.

When the slope = 0, the regression line is
horizontal (parallel to the x-axis). ^y stays constant
at the y-intercept for any value of x. ^y does not
change as x changes and the variables don’t




exhibit association.

, The absolute value of the slope describes the magnitude of the change in ^y for a 1-unit change in x.
The larger the absolute value, the steeper the regression line.

Prediction error / residuals = difference between the actual y value and the predicted y value.
Residual = y− ^y

Each observation has a residual

A positive residual occurs when the actual y is larger than ^y , so that y− ^y > 0

A negative residual results when the actual y is smaller than ^y , so that y− ^y < 0

The smaller the absolute value of the residual, the closer the predicted value is to the actual value,
so the better the prediction.

If the predicted value is the same as the actual value, the residual is zero: y− ^y =0

In a scatterplot, the vertical distance between the point and the regression line is the absolute value
of the residual.



How is the equation for the regression line found?

The actual summary measure used to evaluate regression lines is called the residual sum of squares
residual ∑ of squares=Σ( residual)2=Σ( y− ^y )2
This formula squares each vertical distance between a point and the line and then adds up these
squared values. The better the line, the smaller the residuals tend to be, and the smaller the residual
sum of squares tends to be.

For each potential line, we have a set of predicted values, a set of residuals and a residual sum of
squares. The line that the software reports is the one having the smallest residual sum of squares.
This is why selecting a line is called the least squares method.

This regression line:

- Makes the errors as small as possible
- Has some positive residuals and some negative residuals, and the sum (and mean) of the
residuals equals 0
o Too-high predictions are balanced by too-low predictions
- Passes through the point ( x , y )
o The center of the data

sy
Formula for slope is b=r ( )
sx

Formula for y-intercept is a= y−b( x)

The slope b is directly related to the correlation r and the y-intercept depends on the slope.



We’ve used correlation to describe the strength of the association.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
sevendeboer Universiteit van Amsterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
17
Lid sinds
2 jaar
Aantal volgers
13
Documenten
17
Laatst verkocht
3 maanden geleden

5,0

2 beoordelingen

5
2
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen