Statistiek 2
Tentamen:
- weging 60%
- 30 meerkeuzevragen
- ongeveer 20 goed voor een voldoende
- 1/3 rekenen, 1/3 kennis, 1/3 inzicht
- inhoud week 1 t/m 6 evenredig vertegenwoordigd
, 2
Inhoudsopgave
WEEK 1.............................................................................................. 3
HOORCOLLEGE 1.1..................................................................................3
HOORCOLLEGE 1.2..................................................................................7
WEEK 2............................................................................................. 13
HOORCOLLEGE 2.1................................................................................13
HOORCOLLEGE 2.2................................................................................18
WEEK 3............................................................................................. 23
HOORCOLLEGE 3.1................................................................................23
HOORCOLLEGE 3.2................................................................................28
WEEK 4............................................................................................. 32
HOORCOLLEGE 4.1................................................................................32
HOORCOLLEGE 4.2................................................................................37
WEEK 5............................................................................................. 41
HOORCOLLEGE 5.1................................................................................41
HOORCOLLEGE 5.2................................................................................46
WEEK 6............................................................................................. 51
HOORCOLLEGE 6.1................................................................................51
HOORCOLLEGE 6.2................................................................................57
, 3
Week 1
Hoorcollege 1.1
Statistiek = het verzamelen en analyseren van data. Hiervoor worden 3 elementen gebruikt:
- Design = het verzamelen van data over subjecten. Dit is meestal in een steekproef
- Beschrijvende statistiek = samenvatting data (gem, sd)
- Toetsende statistiek = voorspellingen over de populatie parameters, met behulp van
steekproef statistieken.
De kwaliteit van inferenties (uitspraak over populatie op basis van je data) is afhankelijk van
de mate waarin de steekproef de populatie weerspiegelt. Beïnvloedt door:
- steekproeffout (sampling error) = toevallige steekproefverschillen (in de ene groep
zitten per toeval iets meer vrouwen bijvoorbeeld)
- steekproefvertekening (sampling bias) = selectieve werving
- selectieve respons (non-response bias) = selectieve deelname (sommige mensen
kiezen ervoor om niet mee te doen aan het onderzoek)
- meetfout (respons bias) = incorrect antwoord
Idealiter heb je een aselecte steekproef van voldoende omvang die data oplevert over iedereen
die benaderd is met correcte responses voor alle subjecten op alle items.
Statistische methoden analyseren data over variabelen. Variabelen zijn kenmerken die
variëren tussen subjecten. Er zijn verschillende meetniveaus:
Categorisch: discreet
- nominaal: ongeordende categorieën (provincies)
- ordinaal: geordende categorieën met ongelijke afstanden (schoolniveau)
Kwantitatief: discreet of continu
- interval: ordening met gelijke afstanden (graden)
- ratio: ordening met gelijke afstanden en absoluut nulpunt (score op toets)
H0 waar HA waar
H0 afwijzen Type I fout Correct (= power!)
Kans: α Kans: 1- β
, 4
H0 Niet Correct (= betrouwbaarheid) Type II fout
afwijzen Kans: 1- α Kans: β
Beschrijvende statistiek
Bij categorische data gebruik je een staafdiagram
Bij kwantitatieve data gebruik je frequenties en histogrammen. In een histogram is van
belang:
- vorm = verdeling van de waarden
o als de piek links zit op de grafiek is de grafiek scheef naar rechts.
- centrum = de meest typische waarden
- spreiding = variatie; hoeveel mensen afwijken van de typische waarden.
- positie = locatie in de verdeling
Centrummaten
gemiddelde: y
Modus = getal dat het vaakst voorkomt
Mediaan = middelste getal als je de getallen op volgorde zet.
Bij een grafiek met 1 piek (of 1 dal) zitten de mediaan en het gemiddelde op dezelfde plek.
Bij een kamelenrug grafiek heb je twee keer een modus.
Skewed naar links (dus grafiekpiek zit rechts), dan is het gemiddelde LAGER dan de mediaan
Spreidingsmaten
- Range = verschil tussen de minimale en maximale waarde. Formule: ymax – ymin
- Deviatie = afwijking van het gemiddelde voor 1 persoon. Formule: (yi - y )
- Kwadratensommen = hoeveel zitten alle personen van het gemiddelde af, gecorrigeerd
voor de negatieve waarden. Formule: Σ (yi - y )2
- Variantie = hoeveel zitten alle personen van het gemiddelde af, nu ook gecorrigeerd
Σ( y i− y ) 2
voor het aantal mensen dat je onderzoekt. Formule: s2=
n−1
Σ( y i− y )2
- Standaarddeviatie = wortel van de variantie. formule: s=√
n−1