statistiek 1 2023 + wekelijkse
formatieve toetsen
Hoorcollege 1.1 (hoofdstuk 1)
Hoorcollege 1.2 (hoofdstuk 2 & 3)
Formatieve toets week 1
Hoorcollege 2.1 (hoofdstuk 4)
Hoorcollege 2.2 (hoofdstuk 5 & 6)
Formatieve toets week 2
Hoorcollege 3.1 (hoofdstuk 6 & 7)
Hoorcollege 3.2 (hoofdstuk 6 & 7)
Formatieve toets week 3
Hoorcollege 4.1 (hoofdstuk 7 & 9)
Hoorcollege 4.2 (hoofdstuk 9)
Formatieve toets week 4
Hoorcollege 5.1 (hoofdstuk 9 & 8)
Hoorcollege 5.2 (hoofdstuk 9)
,Hoorcollege 1.1
Kansrekening vs. Statistiek: deductie en inductie
- Kansrekening: gaat veelal uit van deducties.
Bijvoorbeeld kans op jarigen in de zaal.
o Algemeen specifiek;
o Populatie steekproef;
o Model data.
- Statistiek: gaat veelal uit van inductie. Bijvoorbeeld
exitpolls verkiezingen.
o Specifiek algemeen;
o Steekproef doelpopulatie;
o Data model.
Overeenkomsten tussen kansrekening en statistiek:
- Rekenen met toeval (randomness);
- Zelfde technieken (bv. Gemiddelde) om hele populatie te beschrijven;
- Statistiek maakt aannames over populatie (bv. Nulhypothese) om deze op basis van een
steekproef te kunnen weerleggen (falsificeren).
Statistiek: (empirische) wetenschap van verzamelen, organiseren en interpreteren van numerieke
feiten (data).
- Beschrijvende statistiek: samenvatting steekproef/populatie data met nummers, tabellen en
grafieken.
- Inferentiële statistiek (inductie): op basis van mijn steekproefdata, kan ik een voorspelling
doen over een parameter (populatiegemiddelde).
Methodologie vs. Statistiek:
- Methodologie: systematische wijze van hoe je (empirirsch)
onderzoek zou moeten uitvoeren.
- Statistiek: het instrumentarium om empirisch onderzoek uit te
kunnen voeren.
Onderzoeken met behulp van data: observaties van karakteristieken
- Populatie: de totale set deelnemers, relevant voor de onderzoeksvraag
o Bv. populatiegrootheid (parameter): gemiddeld aantal uren zelfstudie per week
- Steekproef: een deel van de populatie waarover data verzameld is.
o Bv. steekproefgrootheid (statistics): gemiddeld aantal uren zelfstudie per week.
Goede data nodig om deze onderzoeksvraag te beantwoorden: betrouwbaar (nauwkeurigheid,
gevaar: steekproeffout) en valide (gevaar: steekproefvertekening, meetfout, selectieve respons).
Biased noisy noisy and biased accurate
,Variabele: gemeten karakteristiek die kan verschillen tussen subjecten.
- Soorten: gedrags-, stimulus-, subject-, fysiologische-variabelen.
- Meetniveaus (NOIR):
o Categorisch/kwalitatief:
Nominaal: ongeordende categorieën. Bv.: kleur ogen.
Ordinaal: geordende categorieën. Bv.: opleidingsniveau.
o Kwantitatief/numeriek:
Interval: gelijke afstand tussen opeenvolgende waarden. Bijvoorbeeld:
graden Celsius.
Ratio: gelijke afstand én absoluut nulpunt. Bijvoorbeeld: Kelvin
- Waardenbereik:
o Discreet: eindig ondeelbare meeteenheid. Bv.: broers/zussen.
o Continue: oneindig deelbare meeteenheid. Bv.: lichaamslengte.
Inferentiële statistiek: betrouwbare en valide uitspraken over populatie o.b.v. steekproef.
- Verschil tussen gemeten steekproefgrootheid en populatiegrootheid (parameter):
o Steekproeffout (sampling error) toevallige steekproefverschillen.
o Steekproefvertekening (sampling bias) selectieve werving.
o Meetfout (response bias) incorrect antwoord.
o Selectieve respons (non-response bias) selectieve deelname.
- Oplossing:
o Een aselecte steekproef van
voldoende omvang, die
informatie oplevert over
iedereen die benaderd is, met
correcte respons voor alle
subjecten op alle items.
, Hoorcollege 1.2
Specifiek bevat de statistische wetenschap methoden voor:
- Design: steekproefmethoden;
- Description;
- Inference.
Kiezen tussen de steekproefmethoden hangt af van samenstelling doelpopulatie, onderzoeksvraag en
haalbaarheid van de te vormen steekproef:
1. Enkelvoudige aselecte steekproef (simple random sampling):
Elke combinatie van deelnemers heeft evenveel kans om de
steekproef te vormen.
Stap 1: stel steekproefkader vast (sampling frame). Bv.: lijst met
alle studentnamen van de studentenadministratie.
Stap 2: trek willekeurig/aselect steekproef van n deelnemers.
Bijvoorbeeld: nummer toewijzen aan iedere student en dan met n
willekeurige getallen studenten kiezen voor steekproef.
2. Systematische aselecte steekproef (systematic random sampling):
Niet elke combinatie van deelnemers heeft evenveel kans om de steekproef te
vormen. Eenvoudiger en vaak goede representativiteit.
Stap 1: stel steekproefkader vast (sampling frame).
Stap 2: bepaal stapgrootte k = N/n “skip number”. Bijvoorbeeld: steekproef n =4,
populatie N = 20, k = 20/4=5
Stap 3: kies eerste deelnemer aselect en bepaal vervolgens deelnemers met
deze stapgrootte k
3. Gestratificeerde steekproef (stratified random sampling):
Binnen ieder stratum (groep) wordt de steekproef getrokken.
Kan proportioneel of disproportioneel.
i. Proportioneel: de steekproefomvang van elk stratum is gelijk
aan het aandeel van de subgroep in de populatie als geheel.
ii. Disproportioneel: de steekproefgroottes van de strata zijn
niet in verhouding met de vertegenwoordiging van de
subgroepen in de populatie als geheel.
Stap 1: stel steekproefkader op.
Stap 2: verdeel populatie in strata. Bv.: jongens en meiden.
Stap 3: trek aselect uit ieder stratum: bv.: 2 jongens en 2 meiden.
i. Handig wanneer er duidelijke categorieën zijn en wanneer
deze verschillen in omvang.
4. Cluster steekproef (cluster sampling):
Kies een steekproef van clusters.
Stap 1: stel steekproefkader op.
Stap 2: verdeel populatie in clusters. Bv.: scholen.
Stap 3: trek aselect een aantal clusters.
Stap 4: kies alle subjecten van getrokken clusters.
i. Handig wanneer het moeilijk is om alle clusters te bereiken voor
een steekproef.
5. Getrapte steekproef (multi-stage sampling):
Combinatie van meerdere steekproefmethode.