100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Class notes

Colleges 'Practicum en data-analyse

Rating
-
Sold
3
Pages
28
Uploaded on
13-01-2025
Written in
2024/2025

Dit is een samenvatting van alle colleges (1 t/m 7) van practicum en data-analyse. Inclusief plaatjes en formules.

Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
January 13, 2025
Number of pages
28
Written in
2024/2025
Type
Class notes
Professor(s)
Caspar j. van lissa
Contains
All classes

Subjects

Content preview

Practicum data-analyse
College 1: Schatten en toetsen
Schatten = op basis van een steekproef een gok doen over een waarde in de populatie
Toetsen = vaststellen of de populatieparameter (waarschijnlijk) afwijkt van een verwachte
waarde
- Voor beiden gebruik je een steekproef/sample

Populatieparameters schatten op basis van de sample:
- Als de sample representatief is voor de populatie, dan kunnen we een ‘’geïnformeerde
gok’’ doen over populatieparameters
- Als een sample random is, dan is het meestal representatief (iedereen even grote kans
om getrokken te worden)
- Samples zijn in de praktijk zelden willekeurig, dus denk na over manieren waarop jouw
sample verschilt van de populatie en daarom wellicht een misleidend beeld geeft

Schatting
- De gemiddelde lengte in de sample (M), weten we nu exact. Hier is geen onzekerheid
over
- Dit gemiddelde is ook onze beste gok voor de gemiddelde lengte in de ‘’populatie’’ (u)
- Dit noem je een schatting
- Er is altijd onzekerheid over schattingen

Sampling error = het verschil tussen de schatting (M) en de populatieparameter (u)

Stel je voor dat je alle mogelijke steekproeven van 5 studenten uit de zaal zou trekken en voor
elke steekproef de gemiddelde lengte zou berekenen:
- Elke steekproef heeft een ander gemiddelde
- Er is een verdeling van steekproefgemiddelden
- Het gemiddelde van ALLE steekproeven is het werkelijke populatiegemiddelde
- De standaardafwijking van deze sampling distribution kan je interpreteren als ‘’de
gemiddelde afwijking van steekproefgemiddelden tov het populatiegmiddelde’’. Ofwel
‘’hoe ver zit ik er gemiddeld genomen naast als ik een steekproef trek uit deze
populatie.
- Dit heet de standard error en het is een maat van onzekerheid over je schatting

Standaardfout schatten
Probleem: we kunnen de standard error niet uitrekenen op basis van één steekproef
- Oplossing: we schatten de standard error op basis van de sample




Standaardafwijking VS standard error
Standaardafwijking
- ‘’Gemiddelde’’ afwijking van observaties t.o.v. het gemiddelde
- Geeft weer hoe gespreid je data is
- Notatie
Standard error
- ‘’Gemiddelde’’ afwijking van steekproefgemiddelden t.o.v. het populatie gemiddelde
- Geeft weer hoe onzeker we zijn over onze schatting van het populatiegemiddelde, op
basis van de steekproef
- Notatie

,Betrouwbaarheidsinterval = een ‘’venster’’ om de schatting, gebaseerd op SE, waarbinnen
de populatieparameter waarschijnlijk valt




Interpretatie
- Als je 100 identieke samples zou trekken, en voor elk een 95%
betrouwbaarheidsinterval zou berekenen, dan bevat 95% van die interval de
populatieparameter. Je weet nooit zeker of dit betrouwbaarheidsinterval de
populatiewaarde bevat of waar die valt

Je kan een betrouwbaarheidsinterval ook gebruiken om te toetsen…
- De interval bevat 95% zekerheid de populatieparameter, dus elke waarde buiten het
interval kan verworpen worden (als nulhypothese) met een foutmarge van 5%

NOIR meetniveau
1. Nominaal = categorisch, verschilt enkel in naam (mannen en vrouwen)
2. Ordinaal = categorieën met volgorde (SES groepen)
3. Interval = continu met betekenisvolle afstanden (stap 1 tot 2 is net zo groot als 2 tot 3)
4. Ratio = heeft een absoluut 0-punt en daarom zijn verhoudingen ook betekenisvol

We gebruiken toetsen wanneer we een uitspraak willen doen over de waarschijnlijke waarde
in de populatie. Omdat we geen data hebben over de gehele populatie, is het onmogelijk om
te bewijzen dat, bijvoorbeeld, het populatiegemiddelde groter is dan 0. Dus we draaien de
boel om: we tonen aan dat het heel onwaarschijnlijk is om onze data te verkrijgen, als het
populatiegemiddelde 0 zou zijn.
- Wat is de kans om data te observeren die ‘’minstens zo extreem zijn’’ als onze
steekproef, als de nulhypothese waar zou zijn dat het populatiegemiddelde 0 is?

Stappenplan toetsen
1. Hypotheses formuleren
- H0: het populatiegemiddelde van lengte is kleiner of gelijk aan
- Ha: het populatiegemiddelde van lengte is groter dan 0
2. Test-statistiek berekenen
- Deze beschrijft hoeveel standaarderrors het steekproefgemiddelde afligt van het
gemiddelde onder de nulhypothese
3. P-waarde uitrekenen (kans op deze data of nog extremer, als H0 waar is)
4. Conclusie trekken over nulhypothese

Hypothese = een toetsbare verwachting over een populatieparameter
- Ha: alternatieve hypothese = wat we denken dat er echt aan de hand is
- H0: nulhypothese = dat er ‘’niets aan de hand is’’
- We proberen de nulhypothese t verwerpen

Non-directionele/ongerichte hypothese
- H0: het gemiddelde van mannen en vrouwen verschilt niet
- Ha: het gemiddelde van mannen en vrouwen verschilt
Directionele/gerichte hypothese
- H0: het gemiddelde van mannen is gelijk of kleiner dan het gemiddelde van vrouwen
- Ha: het gemiddelde van mannen is groter dan het gemiddelde van vrouwen

, Teststatistiek = een waarde die aangeeft hoeveel SE’s je geobserveerde data afliggen van
de verwachting onder de nulhypothese




De standaardfout is



Dan kijken we hoe ‘’ver’’ onze geobserveerde steekproefgemiddelde (M) is t.o.v. de
nulhypothese:




Wanneer we vinden dat de kans op de data onder de nulhypothese zo klein is, dat we H0
kunnen verwerpen?
- We moeten een drempelwaarde afspreken. Als de kans (p-waarde) kleiner is dan deze
drempelwaarde verwerpen we H0
 Significantieniveau (alfa)

De drempel waarde voor het verwerpen van H0 noemen we alfa. In de sociale wetenschappen
hanteren we meestal alfa = .05.

Bij een non-directionele hypothese is alfa = .05 verdeeld over beide staarten van de sampling
distribution.




Bij een directionele hypothese ligt alfa = .05 volledig in één staart van de sampling
distribution.




Met een eenzijdige toets heb je meer power om een nulhypothese te verwerpen als het effect
in de verwachtte richting is. Je hebt echter geen power om de nulhypothese te verwerpen bij
een effect in de omgekeerde richting.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
eviedonk Universiteit Utrecht
Follow You need to be logged in order to follow users or courses
Sold
73
Member since
1 year
Number of followers
10
Documents
40
Last sold
2 weeks ago

4.0

7 reviews

5
3
4
2
3
1
2
1
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions