100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting Herhaling Statistiek 1 & 2 - Hoorcollege 1 Statistiek 3

Beoordeling
-
Verkocht
-
Pagina's
10
Geüpload op
11-04-2023
Geschreven in
2022/2023

In deze samenvatting wordt een korte herhaling gegeven over statistiek 1 & 2, die de basis vormen voor de rest van de theorie die behandeld wordt in statistiek 3. In deze samenvatting komen belangrijke begrippen terug, die wellicht een beetje zijn weggezakt. Altijd fijn om een samenvatting als deze te hebben om even terug te kunnen lezen als je even niet meer zo goed weet hoe iets nou ook alweer precies zat.

Meer zien Lees minder










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
11 april 2023
Aantal pagina's
10
Geschreven in
2022/2023
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Hoorcollege 1 - Recap STAT 1 en 2

Statistiek is de wetenschap van het verzamelen, organiseren en interpreteren van
numerieke feiten, die we data noemen.

Stappen voor het toepassen van statistiek:
1. Selecteren van een steekproef uit de populatie.
2. Beslissen of een steekproef representatief is.
3. Het doen van beschrijvende statistiek of inferentiële statistiek.
4. Meetniveaus (NOIR) en typen variabelen (categorisch/kwantitatief).
5. Kiezen van de juiste statistische analyse.
6. Experimenteel onderzoeksdesign versus een niet-experimenteel onderzoeksdesign

Methoden vakken gaan over design van onderzoek, statistiek is je toolkit voor het uitvoeren
van onderzoek.

Statistiek is van belang in pedagogische wetenschappen, er is belang bij goed empirisch
onderzoek.
→ In de pedagogiek kan je te maken krijgen met regression to the mean, dit houdt
in dat als onderzoek nogmaals wordt uitgevoerd, de effecten minder extreem zijn
(meer gemiddeld) dan in eerste instantie leek. Dit statistische feit kan ertoe leiden dat
interventies voor zeer effectief worden aangenomen, maar die na een tweede keer
testen minder effectief zijn dan in eerste instantie werd gedacht.

Statistiek bestaat uit methoden voor het verzamelen en analyseren van data om…:
→ Een onderzoeksstudie op te zetten → Uitkiezen van een design (dit is wat je leert
bij methodologie vakken)
→ Data te beschrijven (beschrijvende statistiek)
→ Conclusies te trekken o.b.v. de data (inferentiële statistiek)

Belangrijke concepten in statistiek
Beschrijvende statistiek (descriptive statistics): De populatie/steekproef samenvatten
d.m.v. grafieken, tabellen, etc.

Inferentiële statistiek (inferential statistics): Doet voorspellingen over populatie parameters,
a.d.h.v. (random) steekproefdata (je wilt uitspraken doen over de populatie en deze
uitspraken baseer je op een willekeurige steekproef).

Populatie: De totale set van participanten die relevant zijn voor de onderzoeksvraag
→ Bijv. Populatie parameter: Gemiddelde uur aan zelfstudie per week voor alle
studenten.

Steekproef (sample): Een subset van de populatie waar je data van verzameld (ofwel een
willekeurige selectie van je populatie).
→ Bijv. Steekproef statistiek: Gemiddelde uren aan zelfstudie per week van een
random geselecteerde steekproef van 800 studenten.

Om correcte uitspraken te doen over je populatie is het van belang dat je goede data hebt en
dus ook een goede steekproef, dit kan je samenvatten in 2 verschillende dimensies:
→ Betrouwbaarheid (reliability): Gaat over precisie / mate van consequentie
→ Validiteit (validity): Gaat over bias / storing (meet je gemiddeld genomen wat je
wilt meten?)

,Beschrijvende statistiek
Variabele: Meet kenmerken die kunnen verschillen tussen subjecten.

Meetschalen (NOIR):
Categorisch/kwalitatief:
→ Nominaal: Ongeordende categorieën, volgorde in categorieën maakt niet uit (bijv.
oogkleur, geslacht, etc.)
→ Ordinaal: Geordende categorieën, volgorde speelt wel een rol bij de categorieën
(bijv. niet mee eens/neutraal/mee eens)

Kwantitatief/numeriek:
→ Interval: Gelijke afstand tussen waarden (bijv. graden Celsius)
→ Ratio: Absoluut nulpunt (bijv. leeftijd)

Range = bereik van een de variabele
→ Discreet: Meeteenheid die ondeelbaar is, je kan geen halve hebben (bijv. aantal
broers of zussen; je kan niet anderhalve broer hebben)
→ Continue: Oneindig deelbare meeteenheid (ofwel oneindig nauwkeurig meten;
heel veel cijfers achter de komma zijn mogelijk) (bijv. lichaamslengte)

Drie belangrijke dimensies bij beschrijvende statistiek:
→ Central tendency: Typische observatie, wat komt het meest voor? (als je naar je
data kijkt en je zou er een observatie uit moeten pikken die het meest zegt over je
data)
Maten: Gemiddelde, Modus, Mediaan
→ Dispersion (spreiding): Variatie in observaties
Maten: Standaard deviatie, Variantie, Interkwartiel range
→ Position: Relatieve positie van observatie(s) (als je twee observaties eruit pikt wat
is dan de relatieve positie?)
Maten: Percentiel, Kwartiel

, Deze twee verdelingen hebben hetzelfde gemiddelde (central tendency) maar verschillen in
spreiding (dispersion); land A heeft meer spreiding dan land B (variantie en
standaarddeviatie verschillen dus).

Inferentiële statistiek
Doel van inferentiële statistiek: Betrouwbare en valide verklaringen/conclusies over de
populatie gebaseerd op de steekproef.
→ Steekproef statistiek zou hierbij niet moeten verschillen van de populatie
parameters.

Problemen bij inferentiële statistiek
Problemen die we hebben bij inferentiële statistiek hebben vooral betrekking op de
steekproef die gebruikt wordt.
→ Sampling error: Fout in de steekproef (denk aan standaardfout). Dit is de
natuurlijke variatie omdat je willekeurig een steekproef trekt. De ene keer zit je iets
dichter bij de populatie parameter dan de andere keer. Dit is gewoon de fout omdat je
een steekproef gebruikt en dit is ook niet zo’n groot probleem.
→ Sampling bias: Een storing in het trekken van je steekproef door selectief een
steekproef te trekken (Bijv. Je wilt de politieke voorkeur van de Nederlandse
bevolking achterhalen, maar je bevraagt hierover alleen Nederlanders in de
Randstad. Dit geeft jou geen representatief beeld van de politieke voorkeur van de
gemiddelde Nederlander).
→ Response bias: Participanten geven onjuiste antwoorden (Bijv. participant geeft
aan dat hij op partij A stemt, terwijl hij in werkelijkheid op partij B stemt).
→ Non-Response bias: Selectieve participatie (Bijv. jongeren zijn minder geneigd je
vragenlijst in te vullen, waardoor je gemiddelde leeftijd hoger ligt dan in je populatie)

Er is een belangrijk verschil tussen betrouwbaarheid (error) en validiteit (bias).
→ Betrouwbaarheid gaat meer over je standaardfout en statistische power
(onderscheidend vermogen van je test en de grootte van je steekproef).
→ Validiteit gaat echt over een storing (bias) in je steekproef

Verschillende verdelingen
Populatieverdeling (population distribution): Bijv. de proportie studenten die extra onderwijs
nodig hebben voor wiskunde (deze schat je a.d.h.v. je steekproef d.m.v. inferentiële
statistiek).

Data verdeling in je steekproef (sample data distribution): Bijv. de proportie studenten in de
steekproef (n = 1000) die extra onderwijs nodig hebben voor wiskunde
→ A.d.h.v. de steekproef schat je de populatieverdeling

Steekproevenverdeling (sampling distribution): Verdeling van de schatters (elke keer dat je
een verschillende steekproef trekt heb je een bepaalde schatter, elke keer is deze schatter
net iets anders en een verdeling van al deze schatters is je steekproevenverdeling).
→ De standaarddeviatie van de steekproevenverdeling noem je ook wel de
standaardfout en dit zegt iets over de betrouwbaarheid van je schatter.

Standaarddeviatie

π = proportie
√ π (1−π )
n

Deze formule staat op het formuleblad

Centrale limiet theorie (voor steekproevenverdeling)
Als je gaat testen wil je een standaard normaal verdeling gebruiken
€6,49
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
lisaroos2001 Vrije Universiteit Amsterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
16
Lid sinds
2 jaar
Aantal volgers
1
Documenten
5
Laatst verkocht
1 maand geleden

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen