100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting Statistiek III: Univariate data-analyse (hoorcolleges)

Rating
-
Sold
3
Pages
108
Uploaded on
09-01-2023
Written in
2022/2023

Volledige samenvatting van hoorcolleges + eigen notities (inclusief afbeeldingen).

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
January 9, 2023
Number of pages
108
Written in
2022/2023
Type
Summary

Subjects

Content preview

Statistiek III: Univariate Data-Analyse
Inleiding
Statistiek I: Meetschalen en Beschrijvende Statistiek
1. Ordeningstechnieken (tabellen en figuren),
2. Reductietechnieken (statistische grootheden: positie, spreading, vorm),
3. Associatietechnieken (spreidingsdiagram, contingentietabellen, correlatie)
Statistiek II: Kansrekening en Inferentiële statistiek
4. Kansrekening: de studie van het toeval
5. SteekproeVENverdelingen (Sampling distributions)
6. Inleiding tot inferentie (betrouwbaarheidsinterval, overschrijdingskans,
significantietoetsen)

(Een steekproevenverdeling is een frequentieverdeling van steekproefresultaten, niet voor
populatie)

è Inductieve technieken




è 95% betrouwbaarheidsinterval
= een omgeving rondom het resultaat van 1 replicatie zodat in 95% van de replicaties een
interval wordt gevonden dat de echte populatiewaarde van de onderzochte variabele (het
resultaat op populatie niveau) bevat




1

,è Betrouwbaarheidsniveau (Confidence Level)
• Steekproefgemiddelde varieert met elke steekproef.
• Betrouwbaarheidsinterval [schatter ± foutmarge] zal bij C% van de steekproeven de
onbekende populatieparameter µ “vangen”.
• C% is het “algemene vangpercentage”




è Gedrag van de betrouwbaarheid




Een klein betrouwbaarheidsinterval betekent weinig twijfel, zekerder dat je een betrouwbaar
resultaat hebt, iedere keer dat ik het onderzoek opnieuw zouden de waarden moeten vallen
binnen deze kleine grens

Volledige populatie includeren in onderzoek is onmogelijk à daarom steekproeven trekken

Geen risico willen lopen om ernaast te zitten à net groter interval à maar onmogelijk

è Waarschuwingen ivm. schatters
• Formules voor schatters gelden enkel onder de voorwaarde dat de gegevens bekomen
zijn uit een Enkelvoudige Aselecte Steekproef (de mate waarin hieraan is voldaan moet
geëvalueerd worden)
• Voor specifieke meer complexe steekproefmodellen bestaan aangepaste formules (oa.
wegingen)


2

, • Voor “gemakkelijkheidshalve” of ad hoc steekproeven met een vertekening (bias) van
onbekende omvang is er geen methode voor correcte inferentie
• Het gemiddelde is niet robuust voor uitschieters …
• Bij kleine steekproeven worden betrouwbaarheidsintervallen wellicht te klein geschat
• σ moet gekend zijn …

à Significantietoetsen: nederlandstalige en anderstalige kinderen en wiskunde
(Fictieve cijfers) Behaalde scores :
• Nederlandstalige kinderen:
28 38 42 42 46 39 45 62 34 40 44 62 58 44 49 37 37 77 32 34 50 40 44 51 55 50 53 72
55 47 75 62 48 34 11 52 44 59 40 63
• Anderstalige kinderen:
45 56 49 36 43 55 59 39 49 42 44 46 62 36 60 57 55 47 33 42 43 59 51 57 53 66 37 50
58 55 44 58 44 38 48 50

• Is er een verschil? Er zijn 2 tegenovergestelde “theorieën”:
o Anderstalige kinderen compenseren (doen dus beter wiskunde)
o Taalvoordeel speelt ook in niet-talige domeinen (anderstaligen scoren zwakker)
• Gemiddelde scores
o Nederlandstalig: 47,38
o Anderstalig: 49,06




Frequentietabellen;




Histogrammen;




3

, 2 histogrammen overeen;




Onderzoeksvraag: scoren anderstalige kinderen in het algemeen hoger op wiskunde ?
• Om dit te onderzoeken keren we nu de redenering om:
• STEL dat er in het algemeen geen verschil zou zijn tussen nederlandstalige en
anderstalige kinderen voor wiskunde, hoe groot is dan de kans (p-waarde) dat ik in een
onderzoek (zoals hiervoor) een verschil zou vinden dat minstens even groot is als het
verschil dat we hiervoor vonden ... ?

Simulatie…
• Op basis van gemiddelde en standaardafwijking voor ALLE kinderen (nederlandstalig en
anderstalig) trekken we op toevallige wijze telkens scores voor 40 nederlandstalige en
36 anderstalige kinderen.
• We berekenen voor beide groepen het gemiddelde
• We berekenen het verschil tussen de 2 gemiddelden en registreren dit verschil als “het
resultaat” van 1 simulatie.
• Dit wordt nu HEEL vaak herhaald ...
• Voor de bekomen resultaten tekenen we nu het HISTOGRAM VAN HET VERSCHIL IN
GEMIDDELDEN TUSSEN BEIDE GROEPEN

Simulatie van 10000 onderzoeken: waargenomen verschil tussen groepsgemiddelden voor
10000 replicatiestudies




4

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
emmafrateur Vrije Universiteit Brussel
Follow You need to be logged in order to follow users or courses
Sold
61
Member since
2 year
Number of followers
14
Documents
9
Last sold
2 weeks ago

4.6

10 reviews

5
7
4
2
3
1
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions