100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
College aantekeningen

Colleges 'Practicum en data-analyse

Beoordeling
-
Verkocht
3
Pagina's
28
Geüpload op
13-01-2025
Geschreven in
2024/2025

Dit is een samenvatting van alle colleges (1 t/m 7) van practicum en data-analyse. Inclusief plaatjes en formules.











Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
13 januari 2025
Aantal pagina's
28
Geschreven in
2024/2025
Type
College aantekeningen
Docent(en)
Caspar j. van lissa
Bevat
Alle colleges

Onderwerpen

Voorbeeld van de inhoud

Practicum data-analyse
College 1: Schatten en toetsen
Schatten = op basis van een steekproef een gok doen over een waarde in de populatie
Toetsen = vaststellen of de populatieparameter (waarschijnlijk) afwijkt van een verwachte
waarde
- Voor beiden gebruik je een steekproef/sample

Populatieparameters schatten op basis van de sample:
- Als de sample representatief is voor de populatie, dan kunnen we een ‘’geïnformeerde
gok’’ doen over populatieparameters
- Als een sample random is, dan is het meestal representatief (iedereen even grote kans
om getrokken te worden)
- Samples zijn in de praktijk zelden willekeurig, dus denk na over manieren waarop jouw
sample verschilt van de populatie en daarom wellicht een misleidend beeld geeft

Schatting
- De gemiddelde lengte in de sample (M), weten we nu exact. Hier is geen onzekerheid
over
- Dit gemiddelde is ook onze beste gok voor de gemiddelde lengte in de ‘’populatie’’ (u)
- Dit noem je een schatting
- Er is altijd onzekerheid over schattingen

Sampling error = het verschil tussen de schatting (M) en de populatieparameter (u)

Stel je voor dat je alle mogelijke steekproeven van 5 studenten uit de zaal zou trekken en voor
elke steekproef de gemiddelde lengte zou berekenen:
- Elke steekproef heeft een ander gemiddelde
- Er is een verdeling van steekproefgemiddelden
- Het gemiddelde van ALLE steekproeven is het werkelijke populatiegemiddelde
- De standaardafwijking van deze sampling distribution kan je interpreteren als ‘’de
gemiddelde afwijking van steekproefgemiddelden tov het populatiegmiddelde’’. Ofwel
‘’hoe ver zit ik er gemiddeld genomen naast als ik een steekproef trek uit deze
populatie.
- Dit heet de standard error en het is een maat van onzekerheid over je schatting

Standaardfout schatten
Probleem: we kunnen de standard error niet uitrekenen op basis van één steekproef
- Oplossing: we schatten de standard error op basis van de sample




Standaardafwijking VS standard error
Standaardafwijking
- ‘’Gemiddelde’’ afwijking van observaties t.o.v. het gemiddelde
- Geeft weer hoe gespreid je data is
- Notatie
Standard error
- ‘’Gemiddelde’’ afwijking van steekproefgemiddelden t.o.v. het populatie gemiddelde
- Geeft weer hoe onzeker we zijn over onze schatting van het populatiegemiddelde, op
basis van de steekproef
- Notatie

,Betrouwbaarheidsinterval = een ‘’venster’’ om de schatting, gebaseerd op SE, waarbinnen
de populatieparameter waarschijnlijk valt




Interpretatie
- Als je 100 identieke samples zou trekken, en voor elk een 95%
betrouwbaarheidsinterval zou berekenen, dan bevat 95% van die interval de
populatieparameter. Je weet nooit zeker of dit betrouwbaarheidsinterval de
populatiewaarde bevat of waar die valt

Je kan een betrouwbaarheidsinterval ook gebruiken om te toetsen…
- De interval bevat 95% zekerheid de populatieparameter, dus elke waarde buiten het
interval kan verworpen worden (als nulhypothese) met een foutmarge van 5%

NOIR meetniveau
1. Nominaal = categorisch, verschilt enkel in naam (mannen en vrouwen)
2. Ordinaal = categorieën met volgorde (SES groepen)
3. Interval = continu met betekenisvolle afstanden (stap 1 tot 2 is net zo groot als 2 tot 3)
4. Ratio = heeft een absoluut 0-punt en daarom zijn verhoudingen ook betekenisvol

We gebruiken toetsen wanneer we een uitspraak willen doen over de waarschijnlijke waarde
in de populatie. Omdat we geen data hebben over de gehele populatie, is het onmogelijk om
te bewijzen dat, bijvoorbeeld, het populatiegemiddelde groter is dan 0. Dus we draaien de
boel om: we tonen aan dat het heel onwaarschijnlijk is om onze data te verkrijgen, als het
populatiegemiddelde 0 zou zijn.
- Wat is de kans om data te observeren die ‘’minstens zo extreem zijn’’ als onze
steekproef, als de nulhypothese waar zou zijn dat het populatiegemiddelde 0 is?

Stappenplan toetsen
1. Hypotheses formuleren
- H0: het populatiegemiddelde van lengte is kleiner of gelijk aan
- Ha: het populatiegemiddelde van lengte is groter dan 0
2. Test-statistiek berekenen
- Deze beschrijft hoeveel standaarderrors het steekproefgemiddelde afligt van het
gemiddelde onder de nulhypothese
3. P-waarde uitrekenen (kans op deze data of nog extremer, als H0 waar is)
4. Conclusie trekken over nulhypothese

Hypothese = een toetsbare verwachting over een populatieparameter
- Ha: alternatieve hypothese = wat we denken dat er echt aan de hand is
- H0: nulhypothese = dat er ‘’niets aan de hand is’’
- We proberen de nulhypothese t verwerpen

Non-directionele/ongerichte hypothese
- H0: het gemiddelde van mannen en vrouwen verschilt niet
- Ha: het gemiddelde van mannen en vrouwen verschilt
Directionele/gerichte hypothese
- H0: het gemiddelde van mannen is gelijk of kleiner dan het gemiddelde van vrouwen
- Ha: het gemiddelde van mannen is groter dan het gemiddelde van vrouwen

, Teststatistiek = een waarde die aangeeft hoeveel SE’s je geobserveerde data afliggen van
de verwachting onder de nulhypothese




De standaardfout is



Dan kijken we hoe ‘’ver’’ onze geobserveerde steekproefgemiddelde (M) is t.o.v. de
nulhypothese:




Wanneer we vinden dat de kans op de data onder de nulhypothese zo klein is, dat we H0
kunnen verwerpen?
- We moeten een drempelwaarde afspreken. Als de kans (p-waarde) kleiner is dan deze
drempelwaarde verwerpen we H0
 Significantieniveau (alfa)

De drempel waarde voor het verwerpen van H0 noemen we alfa. In de sociale wetenschappen
hanteren we meestal alfa = .05.

Bij een non-directionele hypothese is alfa = .05 verdeeld over beide staarten van de sampling
distribution.




Bij een directionele hypothese ligt alfa = .05 volledig in één staart van de sampling
distribution.




Met een eenzijdige toets heb je meer power om een nulhypothese te verwerpen als het effect
in de verwachtte richting is. Je hebt echter geen power om de nulhypothese te verwerpen bij
een effect in de omgekeerde richting.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
eviedonk Universiteit Utrecht
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
73
Lid sinds
1 jaar
Aantal volgers
10
Documenten
40
Laatst verkocht
2 weken geleden

4,0

7 beoordelingen

5
3
4
2
3
1
2
1
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen