Werkcollege 1
Bij begin van statistisch onderzoek moeten altijd de volgende zaken worden gedefinieerd =
proefopzet statistisch onderzoek:
1. Onderzoeksvraag
2. Populatie: de gehele groep elementen (personen, objecten etc.) waarover informatie wordt
gewenst.
3. Steekproef: gedeelte van de populatie dat feitelijk wordt onderzocht.
4. Eenheden: de elementen van de steekproef waaraan gegevens worden verzameld. bv. mensen,
dieren
5. Variabele(n): eigenschap(pen) van de elementen uit de steekproef die worden bepaald (bv. lengte,
gewicht).
- Kwantitatieve variabelen -> getallen
1. Continu: variabele kan elke mogelijke waarde hebben. bv. lengte
2. Discreet: variabele kan slechts enkele waarden hebben, niet alle mogelijke waarden. bv. aantal
linkshandigen
- Kwalitatieve/categorische variabelen -> categorieën
1. Nominaal: variabele wordt NIET in geordende klassen gemeten. bv. haarkleur
2. Ordinaal: variabele wordt in geordende klassen gemeten. bv. hoogst genoten opleiding
Meest eenvoudige manier om steekproef uit populatie te trekken = Enkelvoudige Aselecte
Steekproef (EAS): steekproef waarbij volstrekt willekeurig een aantal eenheden uit de populatie
worden genomen.
Toevalsvariabelen/stochastische variabelen: variabelen waarvan de uitkomst (in bepaalde mate)
door toeval wordt bepaald. -> altijd aangeduid met hoofdletter
Visualisatie variabelen:
1. Kwantitatieve continue variabelen + kwantitatieve discrete variabelen met groot aantal mogelijke
uitkomsten -> histogram:
2. Kwalitatieve variabelen + kwantitatieve discrete variabelen met klein aantal mogelijke uitkomsten
-> staafdiagram:
,Hoe meer waarnemingen gedaan worden, hoe kleiner klassebreedte van histogram moet worden
gemaakt. -> oneindig groot aantal waarnemingen en dus oneindig kleine klassebreedte? -> histogram
wordt curve (kansdichtheidsfunctie)
Kans (P): relatieve frequentie op de lange termijn.
P(A) = de kans op A.
P(A) = oppervlakte onder kansdichtheidsfunctie boven A.
Totale kans = 1 -> totale oppervlakte onder kansdichtheidsfunctie = 1
Normale verdeling:
1. Formule:
2. Grafiek:
Kenmerken normale verdeling:
- Symmetrisch
- Eéntoppig/unimodaal
- Klokvormig
Notatie normale verdeling:
“variabele y is verdeeld als een normale verdeling (N) met populatiegemiddelde/verwachting μ en
populatiestandaardafwijking/populatiestandaarddeviatie σ”
, Standaard normale verdeling: normale verdeling met
populatiegemiddelde/verwachting (μ) van 0 en
populatiestandaarddeviatie/populatiestandaardafwijking (σ) van 1.
Notatie:
Gebruik van tabel standaard normale verdeling (Table 1 O&L):
Continue verdeling (bv. normale verdeling)?
Kans op precies één bepaalde waarde = 0 -> gevolg: P(Z ≤ z) = P(Z < z), dus
P(Z ≥ z) = P(Z > z) = 1 - P(Z ≤ z) = 1 - P(Z < z)
P(z1 ≤ Z ≤ z2) = P(z1 < Z < z2) = P(Z ≤ z2) – P(Z ≤ z1) = P(Z < z2) – P(Z < z1)
Discrete verdeling (bv. binomiale verdeling)?
Kans op precies één bepaalde waarde ≠ 0 -> gevolg: P(Z ≤ z) ≠ P(Z < z), dus
P(Z ≥ z) = 1 - P(Z ≤ z - 1)
P(Z > z) = 1 - P(Z ≤ z)
P(z1 ≤ Z ≤ z2) = P(Z ≤ z2) – P(Z ≤ z1 - 1)
P(z1 < Z < z2) = P(Z < z2) – P(Z ≤ z1)
Transformatie van normale verdeling naar standaard normale verdeling:
- Nodig om Table 1 in boek O&L te kunnen gebruiken
- Te gebruiken formule: