100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting ALLE tentamenstof Statistiek 2 (SOBA108A)

Beoordeling
-
Verkocht
9
Pagina's
10
Geüpload op
12-11-2022
Geschreven in
2020/2021

Samenvatting van ALLE tentamenstof voor het tentamen van Statistiek 2. In dit document zijn alle belangrijke concepten, zowel van het boek als de colleges, uitgewerkt en uitgelegd. Dit document geeft de kern van het vak Statistiek 2 weer. Ik heb zelf een 9.5 gehaald op het tentamen van Statistiek 2 met dit bestand.

Meer zien Lees minder
Instelling
Vak









Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Heel boek samengevat?
Ja
Geüpload op
12 november 2022
Aantal pagina's
10
Geschreven in
2020/2021
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Statistiek 2

H0: gemiddelden zijn gelijk (de curves van de normale verdeling
vallen op elkaar).
Ha: gemiddelden zijn ongelijk (de curves zijn ten opzichte van
elkaar verschoven (en de mate van overlap bepaalt de hoogte van
de p-waarde)).
Significante p-waarde: je kan de resultaten van de steekproef generaliseren naar de populatie.

Steekproefverdeling: univariate verdeling voor een variabele.
Steekproevenverdeling: verdeling van de statistics die uitgerekend zijn bij de steekproef. SD =
standaardfout.

Marginale verdeling = univariate verdeling → veel onzekerheid bij voorspelling y.
→ Geschatte SD: √Σ(y-ȳ)²/ n-1 (Sy)
Conditionele verdeling: verdeling van y gegeven de waarde van x → minder onzekerheid.
Beschrijft de variabiliteit in de y waarden voor een gegeven/vaste x.


Skewness (scheefheid) Kurtosis (gepiektheid)
- Symmetrische verdeling: = 0 - Normale verdeling: = 0
- Rechtsscheve verdeling: > 0 - Gepiekte verdeling: > 0
- Linksscheve verdeling: < 0 - Platte verdeling: < 0


Causaal verband tussen 2 variabelen
- Er moet een verband zijn die asymmetrisch is (dus van x naar y).
- Er moet een volgorde in de tijd zijn. De oorzaak x moet eerder gebeuren dan het
gevolg y.
- Er mogen geen alternatieve verklaringen z bestaan.
➔ In observationeel onderzoek komt de alternatieve verklaring vaak door de 3e
variabele. Causaliteit in observationeel onderzoek is niet te bewijzen omdat de
3e variabele nooit helemaal uitgesloten kan worden. Controleren voor een
variabele gebeurt door het maken van groepen en het bij benadering constant
houden van de variabele binnen de groepen.
→ In experimenteel onderzoek kan causaliteit wel bewezen worden.
Invloed van de 3e variabele z op de relatie tussen x en y verwijderen (controleren voor de 3e
variabele) door ze voor iedereen constant te houden.

- Deterministisch model: y = α + βx --> voor elke waarde van x is er 1 enkele waarde
voor y.
- Probabilistisch model: E(y)= α + βx → De gemiddelde waarde van y bij een bepaalde
waarde van x. De lijn ŷ = a +bx schat dus het gemiddelde voor y voor alle observaties in
de populatie die dezelfde x waarde kennen.
➔ Aanname dat conditionele verdeling van y normaal verdeeld is.


1

, ➔ Conditioneel gemiddelde/ verwachte waarde: E(y)= α + βx
➔ Conditionele SD: spreiding van de y-waarden rond hun conditionele gemiddelde
(de regressielijn). Aanname dat de SD constant is voor elke waarde van x. →
geschatte SD: √Σ(y-ŷ)²/ n-2 (in SPSS: std. Error of the estimate). De vergelijking
E(y)= α + βx kent 2 onbekende parameters dus vandaar is df= n-2.
➔ SSE: Σ(y-ŷ)² = Σe²
➔ Variantie: S² = SSE/ n-2 =MSE (mean squared error)
- Statistisch model voor lineaire regressie: y = α + βx + ε.
➔ ε = error term → geeft de fout weer die ontstaat voor het gebruiken van ȳ in
plaats van een bepaalde waarde voor y die geldt voor een bepaalde waarde van
x.
➔ Elke observatie heeft zijn eigen ε waarde.
➔ Het gemiddelde van de ε waarden is 0 (= op regressielijn).
➔ Als ε positief is dan is y = α + βx + ε groter dan y = α + βx en valt de observatie
boven ȳ (boven regressielijn)
➔ Als ε negatief is dan valt de observatie onder ȳ (onder regressielijn).

Betere voorspellingen van y als we x gebruiken? Ja → x en y sterke samenhang
1. Voorspel y zonder gebruik te maken van x. Gebruik het steekproefgemiddelde ӯ.
→ met totaal fouten e1 = Σ(y-ȳ)² = TSS
2. Voorspel y door gebruik te maken van x. als de relatie lineair is dan is de
voorspellingslijn ŷ=a +bx, dit is dan de beste voorspeller voor y.
→ met totaal fouten e2 = Σ(y-ŷ)² = SSE
3. Proportionele afname van fouten berekenen: r²= e1-e2 /e1 = TSS-SSE/TSS
➔ de proportionele reductie in fouten van het gebruikmaken van de voorspellingslijn
ten opzichte van slechts ӯ.

Regressie: modelleren van het verband
→ Enkelvoudige regressie geeft het verband tussen x
en het gemiddelde van y.
- Regressiemodel: rechte lijn door een
puntenwolk/spreidingsdiagram trekken en de
waarden van y voorspellen uit de gegeven
waarden van x.
➔ Model: ŷ = α + βx (ŷ=
geschatte/voorspelde waarde)
➔ Constante (α): waarde van y als x gelijk is aan nul
➔ Helling (β): stijging in y als x met 1 stijgt
- Model kan geschat worden least square principe (fouten minimaliseren). Geschatte
model: ŷ = a + bx
1. Spreidingsdiagram: voor elke set van waarden (x en y) een punt.
➔ a: ȳ - bx̄
➔ b: Σ(x-x̄)(y-ȳ) / Σ(x-x̄)² = covariantie/ variantie




2

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
RUGsocio Rijksuniversiteit Groningen
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
90
Lid sinds
4 jaar
Aantal volgers
55
Documenten
17
Laatst verkocht
2 dagen geleden
RUG socio

4,3

15 beoordelingen

5
6
4
8
3
1
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen