Hoofdstuk 1: inleiding tot de statistiek
Flowchart – 6-stappen:
- Stap 1: kiezen juiste analysemethode
- Stap 2: datacontrole
- Stap 3: hypothesen formuleren
- Stap 4: significantieniveau bepalen
- Stap 5: toetsingsgrootheid en p-waarden berekenen
- Stap 6: resultaten interpreteren en rapporteren
Hoofdstuk 2: het ABC van de statistiek
De keuze voor een statistische analyse is STEEDS afhankelijk van:
- Kenmerken bepalen
- Meetniveau bepalen
- De rol vd kenmerken (OV, AV)
Meetniveau van de variabelen:
- Nominaal:
o Waarde wordt weergegeven via een getal, maar dat getal heeft op zich geen echte getalwaarde – het getal
heeft geen functie of betekenis
o Vb. Geslacht: 0 = man, 1 = vrouw, 2 = andere
- Ordinaal:
o Bepaalde rangorde of ordening
o Waarden rangschikken volgens een natuurlijke volgorde
o Geen numerieke score met een vaste meeteenheid, gwn aanduiding vd gerangschikte categorie
o Vb. opleidingsniveau: 1 = geen diploma, een diploma lager onderwijs, 2 = een diploma middelbaar onderwijs, 3
= een diploma hoger onderwijs,..
- Metrisch:
o Variabelen vertegenwoordigen specifieke score
o Vaste meeteenheid exacte verschil tussen de verschillende waarden goed uit te rekenen
o Vb. respondenten geven hun lengte weer in cm: 159, 165, 166, 169
Discrete variabelen, geen getallen tussen bvb 0 en 1 mogelijk. Continue variabelen wel mogelijk (vb. 159,56 cm)
OV:
- Kan niet opeens veranderen ofso
- Vb. leeftijd
AV:
- Afhankelijk van de omgeving
- Vb. druggebruik
Leeftijd heeft geen invloed op druggebruik, door drugs te gebruiken ga je niet opeens ouder worden.
Door de leeftijd die men heeft kan men meer geneigd zijn om drugs te gebruiken
o Vb. er wordt verondersteld dat, hoe ouder men is, hoe minder drugs men gebruikt
Beschrijvende statistiek = wil je de gegevens die verkregen werden uit een willekeurige SP gwn beschrijven en presenteren?
Inferentiële statistiek = wil je met de SP-resultaten betrouwbare uitspraken doen over de ganse populatie waaruit de SP werd
getrokken?
Spreidingsmaten:
- Modus = waarde die het meest voorkomt
- Gemiddelde = alle waarden opgeteld, delen door aantal waarden dat je hebt
- Bereik = waarde die verschil tussen hoogste en laagste waarde toont
- Interkwartielafstand = waarde die afstand toont tussen het 1e en 3e kwartiel, twee kwartielen waartussen 50% van de
gemeten waarden ligt en waarbuiten telkens 25% vd gemeten waarden ligt
- Standaardafwijking =
- Scheefheid = toont hoe symmetrisch de gemeten waarden liggen t.o.v. het gemiddelde
- Kurtosis = toont of de gemeten waarden erg plat of eerder gepiekt rond he gemiddelde liggen
Grafische voorstellingen:
- Boxplot: wordt gebruikt om de verdeling van waarden van een bepaalde variabele tussen subgroepen te vergelijken
1
, Het belang van een normale verdeling dichtheidskromme
- Hoogte van die kromme = wordt bepaald door de frequenties vab elke waarde
- Oppervlakte onder de kromme = 100%
Normale verdeling: grootst aantal waarnemingen rond het gemiddelde (en symmetrisch nr de zijkant aflopend)
Als we weten dat een variabele normaal verdeeld is waarden van die variabele standaardiseren via het berekenen van Z-
scores
- Standaardnormale verdeling; gemiddelde = 0, standaardafwijking = 1
Pg 18 notities lessen
Steekproevenverdeling = geeft weer hoe steekproefgrootheden variëren binnen een onbeperkt aantal herhalende
steekproeftrekkingen uit dezelfde populatie met telkens dezelfde steekproefomvang
- Hier heb je dan de standaardfout = maat die de spreiding binnen de steekproevenverdeling weergeeft
o Bij steekproefverdeling is dit de standaardafwijking
- Centrale limietstelling = als men steeds opnieuw een steekproef zou nemen uit een populatie met steeds dezelfde
steekproefomvang en een frequentieverdeling opmaakt van alle gevonden gemiddelden dat die verkregen
steekproevenverdeling de grafiek van een normale verdeling benaderd
Statistische hypothese toetsing:
- H0-hypothese
- H1-hypothese
- Significantieniveau = 5% of 1% (betrouwbaarheid van 99% of 95%)
o Bij steekproeven van beide meer dan of gelijk aan 400 99%
o Minder dan 400 95%
- Indien we uit de steekproefgegevens een waarde berekenen die buiten de kritieke grenswaarde ligt (= p-waarde kleiner
dan gekozen significantieniveau) H0 verwerpen en gaan nr H1
o Verwerpingsgebied = het gebied buiten de kritieke grenswaarde
o Aanvaardingsgebied = gebied binnen de kritieke grenswaarde
Vb. het berekend verschil van 0,23 tussen de twee steekproefgemiddelden blijkt na de toetsing een
significant verschil te zijn, omdat de p-waarde van dat verschil kleiner is dan het afgesproken
significantieniveau
Module 2: inleiding tot SPSS
Hoofdstuk 3: introductie tot SPSS
Transform:
- Variabelen hercoderen (recode)
- Nieuwe variabelen aanmaken (compute)
- Voorkomen van bepaalde waarden binnen een bepaald aantal variabelen optellen en dit als nieuwe variabele opslaan
(count values within cases)
Analyze:
- Frequentietabel opvragen (descritpive statistics)
- T-toetsen uitvoeren (compare means)
- Betrouwbaarheid van een schaal meten (scale)
Graph:
- Grafische voorstellingen van data opvragen (chart builder)
3.3 DATA BEHEREN IN DE DATA EDITOR
Data view:
- Datamatrix te zien
- Columns = kolommen
- Cases = onderzoekseenheden
- Rows = rijen 1 rij geeft dus de waarden weer die 1 bepaalde onderzoekseenheid heeft voor elke variabele die
gemeten werd
Variable view:
- Codeboek om makkelijk na te gaan welke variabelen er allemaal in je databestand staan, hoe ze bevraagd worden en
welke antwoordmogelijkheden er zijn
- Name = naam
2