1. Gegevens verwerken
1.1 Gegevens verzamelen
Doel statistisch onderzoek → doen van voorspellignen met betrekking tot populatie, op basis van
informatie in steekproef
- Populatie: verzameling van alle te bestuderen objecten van het onderzoek
- Steekproef: deelverzameling van de populatie
- Omvang (n): aantal elementen van de steekproef
- Variabelen: kenmerken die bij elementen van populatie onderzocht worden
Verzamelde elementen → verwerkt tot datmatrix
Statistishce gevolgrtrekking: schatting, voorspelling
→ Mate onzekerheid gepaard met gevolgtrekking → betrouwbaarheidsmaat
1.1.1 Steekproef en populatie
Gegevens worden verzameld afhankelijk van het onderzoek
3 hoofdvormen:
- Enquete: vragenformulier
- Observatieonderzoek: observeert onderzoeker experimentele eenheden
- Experiment: onderozeker legt handelingen op aan de te onderzoeken eenheden
→ Wetenschappelijke toepassingen meestal via een experiment
Belangrijk weten of het operationeel gedifineerd is= duidelijk wie of wat ertoe behoort
→ Via steekproefkader: administratieve weergave van een populatie perfecte overeenkomt met de
populatie
Vereisten steekproef:
1. Representatieve steekproef → moet aselect zijn →alle elementen in de populatie moeten gelijke
kansen hebben om in steekproef terecht te komen
Steekproef onzuiver/ gebiased → bepaalde elementen een grotere kans hebben om getrokken te
worden dan andere
Randomistaie → methode voor het trekken van een aselecte steekproef
2. Betrouwbaarheid → als bij herhaling steekproeftrekking globaal zelfde resultaten wordt verkregen
o Te kleine steekproef: onzekere resulaten
o Te grote steekproef: validiteit van uitkomsten geschaad worden en onderzoek zou te lang
duren
1.1.2 Variabelen
Variabelen= kenmerken of karakteristieken die bij elementen van populatie onderzocht worden
2 soorten:
- Kantitatieve variabelen (bv gewicht): numerieke waarden
o Discrete variabele: eindig of aftelbaar oneindig aantal verschillende waarden kan aannemen
→ Bv ogen dobbelsteen
o Continue: wardenbereiek van variabele in interval of willekeurig → Bv tijd, afstand, gewicht
- Kwalitatieve variabelen (bv kleur): aanduidingen of kenmerken
,4 types variabelen om te kunnen vaststellen welke rekenkundige verwerking we er mee kunnen uitvoeren
1.1.2.1 Nominale schaal
- Geen logische volgorde
- Dikwijls gebruik gemaakt van condenummers
- Kunnen geen rekenkundige bewrekingen uitgevoerd worden
- Bv. Kleur, merknaam
1.1.2.2 Ordinale schaal
- Logische volgorde
- Niet geschikt voor rekenkundige bewerkingen
- Bv. Michelingids → goed, niet goed, matig, slecht
1.1.2.3 Intervalschaal
- Verschil tussen 2 uitkomsten een eenduidige betekenis is
- Geen natuurlijk nulpunt
- Rekenkundige bewerkingen zijn mogelijk
- Bv. Thermometer, kan ook negatief zijn
1.1.2.4 Ratioschaal
- Natuurlijk nulpunt
- Rekenkundige bewerkingen zijn mogelijk en zinvol
- Bv. Maandloon
1.1.3 Frequentieverdeling
Overzicht van betrokken variabalen te krijgen → gegevens tot frequentietabel verwerken
Soorten:
- 1-dimensionale frequentietabel: beschrijft waarnemingen van 1 betreffende variabele
- Contingentie- of kruistabel: uitkomsten van meerde variabelen
1.1.3.1 Frequentietabel
- Absolute frequentie: aantal keer dat bepaalde waarneming voorkomt
- Relatieve frequentie: procentuele frequentie
N= omvang
P= aantal verschillende waarnemingen
xi= waarneming
ni= absolute freq van de waarneming/ aantal keer dat waarneming xi voorkomt
fi= relatieve freq van waarneming xi= ni/n
,1.1.3.2 Contigentietabel of kruistabel
Verschil met frequentietabel is dat er ook rij- en kolomtotalen worden gemaakt
Verdeling van relatieve frequenties van rij- en kolomtotalen worden marginale verdeling genoemd
n = Omvang
nij = Absolute frequentie
𝑛
fi = relatieve frequentie => 𝑓𝑖 𝑛𝑖𝑗
1.1.4 Grafische voorstellingen
Beschrijf wat je illustreert en omgekeerd
→ Via tabellen en grafieken
Verschillende: pictogram, cirkeldiagram, staafdiagram, naalddiagram, stapeldiagram, stamdiagram
1.2 Het verwerken van gegevens gemeten op kwalitatief meetniveau
→ Uitkomsten uit frequentietabel in grafieken plaatsen
, 1.3 Het verwerken van gegevens op kwantitatief meetniveau
Of gegevens gegroepeerd worden of niet hangt af van het # waarnemingsgetallen
- Aantal getallen klein (<20 à 25) → niet gegroepeerd
- Aantal getallen groot (>20à25) → gegevens gegroepeerd → ingedeeld in klassen
1.3.1 Gegevens niet gegroepeerd verwerken
1.3.1.1 Frequentieverdeling
Aantal keer dat een waarde kleiner of gelijk aan een waarnemingsgetal voorkomt
→ Absolute relatieve frequentie
- n = omvang
- p = aantal verschillende waarnemingsgetallen
- r= Range= variatiebreedte
→ Verschil tussen grootste en kleinste waarnemingsgetal → xmax- xmin
- xi = waarnemingsgetal
- ni= absolute frequentie
→ Aantal waarnemingsgetallen kleiner of gelijk aan xi
𝑛
- fi = relatieve frequentie → 𝑛𝑖
- Ni = absolute cumulatieve frequentie → getallen kleiner of gelijk aan xi
- Fi = relatieve cumulatieve frequentie → f1 + f2+ … + fn