(beschrijvende statistiek)
Stappen in wetenschappelijk onderzoek:
1. Literatuurstudie
2. Hypothesevorming
3. Dataverzameling
4. Beschrijvende statistiek
5. Inductieve statistiek
6. Conclusie
(Veel oefeningen op examen)
Variabelen
= soort van “doosje” waar telkens verschillende waarden in kunnen zitten.
Leeftijd
Geslacht* (dus kwalitatief en kwantitatief)
Score op een test
=> Variabelen zijn dus allerlei zaken die je kan meten met cijfers of kan indelen in categorieën
Operationaliseren
= variabelen meetbaar maken
• Lente, intelligentie, angst, depressie, …
Variabelen operationaliseren en meten
Variabelen kunnen … zijn:
• Kwantitatief (cijfers vb. leeftijd ) of kwalitatief (categorieën vb. haarkleur)
• Continu (kommagetallen) of discreet (gehele getallen)
• Opgedeeld in verschillende meetniveaus
- Nominaal: categorie
- Ordinaal: categorie en rangorde
- Interval: categorie, rangorde en meeteenheid (verschil is altijd evenveel)
- Ratio: categorie, rangorde, meeteenheid en nulpunt
• Onafhankelijk (oorzaak, het gene wat je wilt bestuderen) of afhankelijk (gevolg, hangt samen
met wat je wilt bestuderen)
Twee voorwaarden voor meten:
• Betrouwbaarheid (hoe goed meet de test/instrument wat we willen meten?) zelfde persoon moet steeds zelfde
scores behalen
• Validiteit (meet de test/instrument wat we willen meten?)
Onafhankelijke of afhankelijke variabelen?
• Afhankelijke variabele: wat we willen
bestuderen Bv: mate van depressie
• Onafhankelijke variabele: (potentiële)* oorzaak van verschillen in de afhankelijke variabele, wat
je manipuleert
*Opletten: samenhang ≠ causaal
Experimenteel onderzoek
, = Eén of meerdere onafhankelijke variabelen manipuleren en kijken welk effect dit heeft op de
afhankelijke variabele
Steekproeven
= het deel van de populatie dat wordt onderzocht, hierop doen we beroep wanneer de populatie te
groot is om helemaal te onderzoeken (wat bijna altijd het geval is).
! Belangrijk doel van de inductieve statistiek: verantwoorde uitspraken doen over de populatie
aan de hand van een steekproef.
We willen wél uitspraken doen over de gehele populatie, dus de steekproef moet een goede
afspiegeling zijn van de populatie.
Onderzoek doen bij depressieve patiënten die momenteel in het ziekenhuis liggen om uitspraken te
doen over mensen met een depressie in het algemeen. Vraag: goede steekproef of niet?
Soorten steekproeven :
A) Aselecte steekproef
Elk individu van de populatie heeft evenveel kans om in de steekproef terecht te komen
(steekproefkader)
B) Niet-aselecte steekproef
Niet elk individu van de populatie heeft evenveel kans om in de steekproef terecht te komen
Volledig aselecte steekproef:
= elk element van de populatie een gelijke kans geven om in de steekproef te worden opgenomen
Uit de lijst van alle Vlaamse leerlingen SO randomgewijs 2000 leerlingen selecteren om het
gemiddelde IQ van Vlaamse leerlingen SO na te gaan.
Nadeel:
• Niet altijd representatief!
• Vaak moeilijk realiseerbaar in de praktijk
• Soorten van aselecte steekproeftrekking (zie statistiek 1) Verschillende vormen nog kennen
• Volledig aselecte steekproef (simple random sampling)
• Systematisch aselecte steekproef (systematic sampling)
• Gestratificeerde steekproef (stratified sampling)
• Clustersteekproef (cluster sampling)
• Getrapte steekproef (multistage sampling)
Soorten van niet-aselecte steekproeftrekking (zie statistiek 1)
• Gemakkelijkheidssteekproef (convenience sampling)
• Beoordelingssteekproef (judgement sampling)
• Sneeuwbalsteekproef (snowball sampling)
, • Quotasteekproef (quota sampling)
• Routemethode (random walk)
Belang van (goede) steekproeven
• Een goeie steekproefselectie = essentieel in onderzoek
• Bewustwording van het belang van steekproefselectie
• Keuze voor steekproef steeds kunnen onderbouwen of doordacht kunnen bediscussiëren
Belangrijke begrippen
Frequentieverdelingen
= eerste verkenning van de data
=overzicht van alle mogelijke waarden van variabelen en hoe vaak die waarden zijn voorgekomen
Er zijn verschillende soorten frequenties:
• Absolute frequenties= absoluut aantal keer dat een waarde is voorgekomen
• Relatieve frequenties= percentages
Verschillende visuele voorstellingen (afhankelijk van meetniveau):
• Taartdiagram (nominaal)
• Staafdiagram (nominaal of ordinaal)
• Stamdiagram/histogram/boxplot (interval)
Percentielscores: plaats van een score in het geheel (opdeling van een frequentieverdeling in 100
gelijke delen)
• Kwartiel
• Deciel
Centrummaten
=geven aan wat de centrale tendens is van de verdeling
=de plek in uw verdeling waar de meeste observaties zitten
• Gemiddelde = som van alle waarden gedeeld door aantal waarnemingen (minimum
interval niveau).
• Mediaan = middelste waarde bij gerangschikte waarnemingen (minimum ordinaal niveau).
• Modus = waarde die het meest voorkomt (elk meetniveau).
! Bij een symmetrische verdeling: modus = mediaan = gemiddelde:
• Mediaan minder gevoelig voor extreme waarden.
• Gemiddelde consistenter over verschillende steekproeven.
, Spreidingsmaten
= toont hoe ver scores uit elkaar liggen.
Interkwartielafstand = P75 – P25
• Variantie (s²):
- afwijking van elke uitslag ten opzichte van gemiddelde
- deze afwijking kwadrateren
- gemiddelde van deze gekwadrateerde afwijkingsscores
• Standaarddeviatie (s):
- de vierkantswortel van de variantie
- deze spreidingsmaat is makkelijker te relateren aan de originele scores
• Standaardscores (Z-scores):
- Drukt uit hoeveel standaarddeviaties een geobserveerde score boven of onder het
gemiddelde zit
Dia 42-48 -> Gemiddelde, standaardafwijking en z-scores
De normale verdeling
• Geobserveerde gegevens die passen in theoretische
verdeling (model) bieden meer mogelijkheden voor
verwerking.
• Veelgebruikt model: normale verdeling.
• Geeft de kans op het voorkomen van een bepaalde waarde.
• Normale verdelingen verschillen enkel in gemiddelde
en standaarddeviatie. De curve is altijd klokvormig en
symmetrisch.
• Dankzij dit specifieke model kunnen gemakkelijk
observaties afgeleid worden.
Veel variabelen in ‘de natuur’ zijn normaal verdeeld (bv. lengte, IQ) Carl Friedrich Gauss
• Tabel standaardnormaal verdeling: Hoeveel % van de observaties ligt onder een z-waarde van 1
Standaarddeviatie kunnen berekenen zoals statistiek 1 dia 54
Hoorcollege 2: