1 Herhaling ................................................................................................................................................. 1
2 Inductieve statistiek ................................................................................................................................. 3
3 Kwalitatieve data-analyse ........................................................................................................................ 5
4 Kansberekeningen .................................................................................................................................. 10
5 Hypothesetoetsing en betrouwbaarheidsintervallen ............................................................................. 15
6 Toetsen voor 1 populatie........................................................................................................................ 19
T-toets voor het gemiddelde (one sample t-test) ................................................................................ 20
Chikwadraattoets voor frequenties .................................................................................................... 21
7 Toetsen voor 2 populaties ...................................................................................................................... 23
T-toets voor 2 onafhankelijke steekproeven ....................................................................................... 23
Wilcoxon Rank-sum ........................................................................................................................... 25
T-toets voor 2 afhankelijke steekproeven (paired samples t-test) ........................................................ 26
8 Toetsen voor meer dan 2 populaties ...................................................................................................... 27
Eenwegs variantieanalyse (one-way ANOVA)...................................................................................... 27
9 Toetsen voor het verband tussen 2 variabelen ....................................................................................... 30
Pearson correlatietoets...................................................................................................................... 30
Rangcorrelatie van Spearman ............................................................................................................ 31
Chikwadraat voor kruistabellen.......................................................................................................... 32
10 Kiezen van de juiste toets ....................................................................................................................... 34
0
,Hoofdstuk 1: Herhaling
1 Herhaling
1.1 Variabelen en operationaliseren
Variabelen = allerlei zaken die je kan meten met cijfers of kan indelen in categorieën.
• Kwantitatief: met cijfers
• Kwalitatief: zonder cijfers
• Continu: oneindig veel waarden (lengtes: 1,77m; 1,689m)
• Discreet: aantal waardes (haarkleur: blond, bruin, …)
• Opgedeeld in meetniveaus:
1. Nominaal: enkel categorieën (geslacht, verschillende smaken chocolade)
2. Ordinaal: waarden met rangorde (opleidingsniveau, likert-schaal, militaire rang)
3. Interval: betekenisvolle verschillen tussen waarden (IQ, psychologische testscores)
4. Ratio: kan niet onder 0 gaan (gewicht, lengte, inkomen)
• Onafhankelijk: waarvan we denken dat het invloed zal hebben, gaan we manipuleren
• Afhankelijk: wat we willen meten
Operationaliseren = variabelen meetbaar maken.
→ Twee voorwaarden voor meten:
• Betrouwbaarheid: hoe goed meet de test wat we willen meten?
• Validiteit: meet de test wat we willen meten?
1.2 Steekproeven
Steekproef = het deel van de populatie dat wordt onderzocht, wanneer de populatie te groot is.
→ Inductieve statistiek: verantwoorde uitspraken doen over de populatie aan de hand van een steekproef
1.2.1 Volledig aselecte steekproef
Elk element van de populatie heeft een gelijke kans om in de steekproef te worden opgenomen
• Niet altijd representatief (meer jongens dan meisjes)
• Vaak moeilijk realiseerbaar in de praktijk
1.2.2 Niet-aselecte steekproeven
Sneeuwbalsteekproef
Vertrekt van 1 respondent aan wie vervolgens gevraagd wordt andere respondenten te contacteren
• Voordeel: mensen die moeilijk bereikbaar zijn worden makkelijker bereikt
• Nadeel: kans is groot dat mensen sterk op elkaar lijken
Gelegenheidssteekproef
Keuze van respondenten wordt overgelaten aan ondervrager → mensen die men makkelijk kan vinden
• Voordeel: goedkoop, snel
• Nadeel: niet geschikt voor populatieschattingen
Quotasteekproef
Onderzoeker bepaalt kenmerken van de populatie die men ook wil zien in steekproef (verdeling
jongens/meisjes)
1
,Hoofdstuk 1: Herhaling
1.2.3 Belang van (goede) steekproeven
• Niet-aselecte steekproeven zijn niet altijd geschikt voor inductieve statistiek
• Goede steekproefselectie is essentieel in onderzoek
• Keuze voor steekproef steeds kunnen onderbouwen
1.3 Frequentieverdelingen
• Verschillende soorten:
• Absolute frequenties: hoe vaak komt een bepaalde waarde voor in de steekproef
• Relatieve frequenties: ten opzichte van het totaal (%)
• Verschillende visuele voorstellingen (afhankelijk van meetniveau):
• Taartdiagram (nominaal)
• Staafdiagram (nominaal of ordinaal)
• Stamdiagram, histogram, boxplot (interval)
• Percentielscores: plaats van een score in het geheel
• Kwartiel (25%)
• Deciel (10%)
1.4 Centrummaten
Centrummaten geven aan wat de centrale tendens is van de verdeling → op welk punt de meeste scores zitten
• Modus = waarde die het meest voorkomt. (elk meetniveau)
• Mediaan = middelste waarde bij gerangschikte waarnemingen. (min ordinaal)
• Gemiddelde = som van alle waarden gedeeld door aantal waarnemingen. (min interval)
• Bij een symmetrische verdeling: modus = mediaan = gemiddelde
1.5 Spreidingsmaten
Spreidingmaten toont hoe ver scores uit elkaar liggen
• Interkwartielafstand: P75 – P25
• Variantie (s²): gemiddelde van de gekwadrateerde afwijkingsscores van elke uitslag ten opzichte van
gemiddelde
• Standaarddeviatie (s): de vierkantswortel van de variantie
• Standaardscores (z-scores): drukt uit hoeveel standaarddeviaties een geobserveerde score boven of
onder het gemiddelde zit
1.6 De normale verdeling
• Altijd klokvormig en symmetrisch
• Verschillen enkel in gemiddelde en standaarddeviatie
• Dankzij dit model kunnen gemakkelijk observaties afgeleid worden
2
, Hoofdstuk 2: Inductieve statistiek
2 Inductieve statistiek
2.1 De empirische cyclus
1. Ondubbelzinnige vraagstelling
2. (On)afhankelijke variabelen bepalen en operationaliseren
3. Representatieve steekproef
4. Gegevens verzamelen
5. Beschrijvende analyse: centrummaten, spreidingsmaten, …
6. Inductieve analyse: kunnen we de steekproef generaliseren naar de populatie?
7. Conclusies → kan vaak aanleiding geven tot nieuwe vraagstelling
2.2 Problemen in inductieve statistiek
• Statistiek geeft nooit 100% zekerheid:
• Onderzoek meestal in steekproeven → geen perfecte afspiegeling van populatie
• Foutieve variatie en toevallige meetfouten mogelijk
• Daarom berust het op kansberekening:
• Inschatten hoe zeker we zijn van onze conclusies
• Wanneer zijn zulke uitspraken toegestaan? => significantie
2.3 Statistische significantie
Statistische significantie = term die onderzoekers gebruiken om aan te geven dat het onwaarschijnlijk is dat hun
resultaten op toeval gebaseerd zijn.
• Zijn de verschillen tussen de resultaten betekenisvol? → statistisch significant?
• Is het verschil in scores eerder klein of is het groot genoeg?
• Klein: te wijten aan toevalligheden
• Groot: verschil zal er waarschijnlijk ook zijn in populatie
• Statistische significantie helpt ons om onze hypothesen te toetsen => hypothesetoetsing
2.4 Kansberekening
1. Vertrekpunt: “er is geen verschil” (= nulhypothese)
2. Hoe groot is de kans dat de geobserveerde data te wijten is aan toeval?
• Waarschijnlijk toeval? → nulhypothese (geen effect in populatie)
• Kleine kans dat het toeval is? → alternatieve hypothese (wel effect in populatie)
→ Kansberekening gaat ervan uit dat er in de werkelijkheid geen verschil is
• Hoe moeten we die kans berekenen?
• Kansverdelingen (standaardnormale verdeling)
• Verschillende hypothesetoetsen
• Wat is dan een ‘grote’ en een ‘kleine’ kans?
• 5% of 0.05 meest courant
2.5 Hypothesetoetsing
Toetsingssituaties kunnen heel uiteenlopend zijn → uiteenlopende toetsen
3