100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

samenvatting statistiek deel 4

Rating
4.0
(2)
Sold
13
Pages
60
Uploaded on
24-02-2018
Written in
2016/2017

Statistiek was voor mij een moeilijk opleidingsonderdeel. Het vinden van een correctie studeermethode was daarom aangewezen. Ik maakte een samenvatting van de cursus, ppt's en extra nota's tijdens de les. Voor mij was dit een overzichtelijk document en het leverde mij na de eerste keer een goed resultaat op.

Show more Read less
Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
February 24, 2018
Number of pages
60
Written in
2016/2017
Type
Summary

Subjects

Content preview

1. Inleiding tot het data-analytisch proces
1.1 Inleiding

Data-analyse = het proces waarbij aan de hand van gegevens en statistische methoden een antwoord
gegeven wort op de onderzoeksvragen.


1.2 Vb: De pijndata + 1.3 Voorstelling van de gegevens en notatie

Zie p. 8-9


1.4 Flow-chart van het data-analytisch proces


Exploratieve Statisitsche
Voorbereiding Presentatie
data-analyse inferentie



1.5 Exploratieve data-anlyse

- Numerieke methoden: steekproefgemiddelde, mediaan, standaarddeviaties …
- Grafische methoden: histrogram, boxplot …


1.6 Statistische inferentie

STAP 1: Formuleer modellen en hypothesen

Nulhypothese H0  beperkt model
Alternatieve hypothese H1  uitgebreid model

Beperkt model Uitgebreid model

1e groep: observaties zijn normaal verdeeld met De twee populatiegemiddelden verschillen van
gemiddelde μ en variantie σ². elkaar.
2e groep: identieke vergelijking als groep 1.
 De twee populatiegemiddelden zijn aan elkaar
gelijk.

Andere notatie mogelijk met een toevallige
afwijking ε

Men kan niet spreken over hét beperkt model of hét uitgebreid model. Men spreekt over een
verzameling beperkte modellen ω en een verzameling uitgebreide modellen Ω. De verzameling van
beperkte modellen is een deelverzameling van de verzameling uitgebreide modellen (ω C Ω). Het
beperkt model is genest in het uitgebreid model.



1

,STAP 2: Keuze van de toetsstatistiek

Om de nulhypothese te toetsen gebruiken we de t-statistiek.

SE staat voor standaardfout waarmee de grootte van de onzekerheid die bestaat over de schatting
(schatting van het verschil tussen de twee populatiegemiddelden obv. het verschil tussen de
steekproefgemiddelden).

Teller groot  evidentie tegen beperkt model (tegen H0).
Noemer groot  veel onzekerheid op de schatting  reductie van de t-statistiek  weinig evidentie
tegen H0.


STAP 3: Steekproevenverdeling van t onder H0 en bereken de p-waarde

t-statistiek berekenen

Indien H0 waar  t-statistiek volgt t-verdeling met ‘n1 + n2 – 2’ vrijheidsgraden.

Beperkt model gaat op + veel steekproeven  voor elke steekproef de t-statistiek berekenen 
histogram van de t-statistieken  histogram zal convergeren naar een t-verdeling.

Uitgebreid model gaat op + veel steekproeven  voor elke steekproef verschil Y´ 2 - Y´ 1
berekenen  histogram  histogram zal convergeren naar een normale verdelingsfunctie.

Histogram heeft 3 eigenschappen:
- Normale verdeling bij genoeg steekproeven
- Gemiddelde waarde = μ2 – μ1

- Standaarddeviatie = σ
√ 1 1
+
n1 n2

Y´ 2−Y´ 1



Alternatieve toetsstatistiek (maar meestal gebruiken we t-statistiek): z = 1 1
σ +
n1 n 2
 MAAR σ meestal niet gekend. Indien een grootheid niet gekend is, probeert men deze te schatten
obv. de steekproef en gebruikt men verder de geschatte versie. Een goede schatter voor σ is:
S pooled
2 '2 '2
- Wanneer we S pooled kwadrateren  S pooled = w 1 S1 + w2 S 2  de gepoolde
steekproefvariatie is gelijk aan de gewogen som van de twee steekproefvarianties.
- Waarom kunnen de steekproefvariaties gecombineerd worden? Bij zowel het uitgebreide
model als het beperkt model wordt verondersteld dat de variantie van de scores binnen de
'2
twee groepen gelijk zijn aan elkaar. Elk van de variaties S j apart is een schatting van σ².
Omdat zowel S '12 als S '22 een schatting opleveren van dezelfde σ² is het beter om
informatie uit beide te combineren (poolen).

p-waarde bepalen

Rekening houden met 1- of 2-staartigheid.



2

,Betekenis van de p-waarde
- De kans om een even extreme of extremere waarde van de teststatistiek te observeren onder
de steekproevenverdeling als H0 waar is.
- Een maat voor de sterkte van de evidentie tegen H0: kleine p → meer evidentie tegen H0.
Interpretatie op een continue manier:
- 0 – 0.001 Overtuigende evidentie
- 0.001 – 0.005 Sterke evidentie
- 0.005 – 0.01 Matige evidentie
- 0.01 – 0.05 Suggestieve evidentie
- > 0.05 Geen evidentie

Drempelwaarde (α) = waarde waaronder de p-waarde moet vallen opdat men van een significant
resultaat kan spreken. α = 0.001.
p < α H0 verwerpen
p > α H0 niet verwerpen


STAP 4: Bepaal de effectgrootte

p-waarde is afhankelijk van de steekproefgrootte.

Praktische significatie: is het een betekenisvol en belangrijk resultaat?

Zinvolle maat van effectgrootte: verschil tussen de twee steekproefgemiddelden  schatting van het
verschil in populatiegemiddelden  schatting = onzekerheid  mate van onzekerheid kwantificeren via
een betrouwbaarheidsinterval  100(1-α)%

Tot slot: conclusie van de analyse formuleren.


1.7 Excursie

1.8 Afronden




3

, 2. Variantie-analyse met 1 factor
Variantie-analyse is een uitbreiding van de t-toets voor onafhankelijke groepen.
T-toets = gemiddelden van 2 groepen worden met elkaar vergeleken.


2.1 Voorbeeld: BNT bij kinderen met taalontwikkelingsstoornis

4 groepen: STOS
STOS + gedagsproblemen
STOS + cognitieve ontwikkelingsproblemen
Geen STOS

OV1: is er een verschil in de gemiddelde performantie van de 4 groepen?
 F-toets
OV2: is er een verschil tussen kinderen met STOS (groep 1-3) en kinderen zonder STOS (groep 4).
 Contrastanalyse


2.2 Exploratieve data-analyse

2.3 Notatie en voorstelling van de gegevens

2 manieren van voorstelling: Tabelvorm (alle scores per groep in kolom)
Participant-dataset (per participant 1 rij)


2.4 Statistische inferentie

STAP 1: Formuleer modellen en hypothesen

Uitgebreid model: gemiddelden kunnen verschillen per groep Yij = μj + εij
Beperkt model: gemiddelde is hetzelfde voor alle groepen Yij = μ + εij

H0: μ1 = μ2 = … = μa H1: μ verschilt

Parameterschatting (zegt iets over de fit van beide modellen)

Een parameter heeft bepaalde maar onbekende waarde in de populatie. We kunnen deze schatten
met de kleinste kwadratenschatters. Men zoekt die waarde(n) voor de parameter(s), die de som van
de gekwadrateerde verschillen tussen data en modelvoorspelling zo klein mogelijk houdt.




4

Reviews from verified buyers

Showing all 2 reviews
5 year ago

6 year ago

4.0

2 reviews

5
1
4
0
3
1
2
0
1
0
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
SanneVerbeeck Lessius Hogeschool
Follow You need to be logged in order to follow users or courses
Sold
93
Member since
10 year
Number of followers
70
Documents
59
Last sold
1 year ago

3.9

30 reviews

5
5
4
19
3
5
2
0
1
1

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions