[Dit is een voorbeeldpagina om een algemene indruk te krijgen :) Zie de inhoudsopgave voor volledige inhoud
van de samenva:ng]
1.1 Variabelen
Variabele: een kenmerk van een gebeurtenis, object of persoon dat verschillende waarden kan
aannemen. In onderzoek manipuleren experimentatoren vaak variabelen.
o Ona@ankelijke variabele (independent variable): de variabele
die door de onderzoeker wordt aangepast of gecontroleerd.
o A@ankelijke variabele (dependent variable): de variabele die
wordt gemeten om te zien welk effect de ona@ankelijke
variabele heeC.
Onderzoeksvraag: HeeC cafeïne-inname invloed op de reac,e,jd?
• Ona3ankelijke variabele: Cafeïne-inname
(bijv. 0 mg, 100 mg, 200 mg).
• A3ankelijke variabele: ReacFeFjd
(bijv. gemeten in milliseconden bij een reacFetaak).
2.1 Kwalita0eve/categorische variabelen weergeven
FrequenFetabel: geeC weer hoe vaak elke waarde in een dataset voorkomt.
Gebruiker van Frequen.e Rela.eve frequen.e
Niets 85 0.17
Windows 60 0.12
Macintosh 355 0.71
Totaal 500 1.00
RelaFeve frequenFe: proporFe van antwoorden in elke categorie (bijv. rela,eve frequen,e in
categorie ‘Niets’ is 85/500 = 0.17).
Taartdiagram (pie chart):
o Elke taartpunt laat één categorie zien.
o De volledige cirkel = 100%.
o Alleen handig bij weinig categorieën; bij veel
categorieën is het onoverzichtelijk.
o Misleidend wanneer steekproef weinig
deelnemers bevat, omdat verhoudingen
vertekend kunnen worden.
Staafdiagram (bar chart):
o FrequenFes op Y-as.
o Categorie op X-as.
aantal gebruikers
o Laat op Y-as dus aantal observaFes
in elke categorie zien (pie chart laat
percentages zien).
o Ruimte tussen de staven.
Niets Windows Macintosh
Gebruiker van
,Statistiek: Inhoudsopgave
Statistiek: 1 – Introduction ............................................................................................................ 3
1. Variabelen .............................................................................................................................. 3
2. Percentielen ........................................................................................................................... 3
2.1. Percentiel berekenen ............................................................................................................. 4
3. Distributies ............................................................................................................................. 5
3.1. Verdeling van discrete variabelen ........................................................................................... 5
3.2. Continue variabelen .............................................................................................................. 5
3.3. Probability density ................................................................................................................. 6
3.4. Vorm van verdelingen ............................................................................................................. 6
4. Summatienotatie .................................................................................................................... 7
Statistiek: 2 – Graphing Distributions ............................................................................................. 8
1. Kwalitatieve/categorische variabelen weergeven....................................................................... 8
2. Kwantitatieve variabelen weergeven ......................................................................................... 9
2.1. Stem and leaf diagrammen .................................................................................................... 9
2.2. Histogrammen .................................................................................................................... 10
2.3. Boxplots .............................................................................................................................. 10
2.4. Bar charts/staafdiagrammen ................................................................................................ 12
Statistiek: 3 – Summarizing Distributions ...................................................................................... 13
1. Centrale tendens ...................................................................................................................13
1.1. Wat is de centrale tendens? ................................................................................................. 13
1.2. Maten van de centrale tendentie........................................................................................... 14
1.3. Mediaan en gemiddelde ....................................................................................................... 15
2. Variabiliteit ............................................................................................................................15
2.1. Maten van variabiliteit .......................................................................................................... 15
3. Vorm .....................................................................................................................................17
3.1. Vormen van distributies ....................................................................................................... 17
2
,Statistiek: 1 – Introduction
1. Variabelen
Variabele: een kenmerk van een gebeurtenis, object of persoon dat verschillende waarden kan
aannemen. In onderzoek manipuleren experimentatoren vaak variabelen.
o Ona@ankelijke variabele (independent variable): de variabele
die door de onderzoeker wordt aangepast of gecontroleerd.
o A@ankelijke variabele (dependent variable): de variabele die
wordt gemeten om te zien welk effect de ona@ankelijke
variabele heeC.
Onderzoeksvraag: HeeC cafeïne-inname invloed op de reac,e,jd?
• Ona3ankelijke variabele: Cafeïne-inname
(bijv. 0 mg, 100 mg, 200 mg).
• A3ankelijke variabele: ReacFeFjd
(bijv. gemeten in milliseconden bij een reacFetaak).
De niveaus van een ona@ankelijke variabele zijn de verschillende condiFes waarin de
variabele wordt getest; in bovenstaand voorbeeld zijn de verschillende hoeveelheden cafeïne
in mg de niveaus: 0 mg is een niveau, 100 mg is een niveau en 200 mg is een niveau.
o KwalitaFeve/categorische variabele: beschrijC eigenschappen zoals haarkleur, religie
of favoriete film en hebben geen numerieke volgorde.
o KwanFtaFeve variabele: wordt uitgedrukt in getallen, zoals lengte, gewicht of
schoenmaat.
o Discrete variabele: hebben afzonderlijke, telbare waarden (bijv. aantal kinderen in een
gezin; je kunt 2 of 3 kinderen hebben, niet 2,5 kinderen).
o ConFnue variabele: kunnen elke waarde binnen een bepaald bereik aannemen (bijv.
reac,e,jd in seconden; een appel kan 150 gram wegen of 150,345 gram en zou ook
alle waarden daartussen kunnen aannemen).
2. Percen0elen
PercenFel: geeC aan hoeveel procent van de scores lager is dan een bepaalde score (bijv. als
jouw score op een test over verlegenheid 35 is en 65% van de andere scores lager zijn, dan
bevind je je in het 65e percen,el).
Er is geen universeel geaccepteerde definiFe van een percenFel, maar er zijn twee
veelgebruikte methoden:
o Defini.e 1: Het percenFel is de laagste score die groter is dan een bepaald percentage
van de scores.
o Defini.e 2: Het percenFel is de kleinste score die gelijk aan of groter is dan een
bepaald percentage van de scores.
Deze twee methoden kunnen soms tot verschillende resultaten leiden, vooral bij kleine
datasets. Daarnaast is er een probleem met afronding, bijvoorbeeld als 65% van 50
scores 32,5 is; hoe bepaal je dan de juiste score?
3
, 2.1. Percen.el berekenen
Dat wordt opgelost met de derde definiFe van percenFelen; een berekening uitvoeren:
1) Het berekenen van de percen.elrang (R):
𝑃 P: gewenste percenFel
𝑅= ∙ (𝑁 + 1) N: aantal getallen
100
Voorbeeld:
Getal Rang Stel: er wordt gevraagd naar het 25e percenFel; P = 25.
3 1 In de tabel is te zien dat er 8 getallen zijn; N = 8.
5 2
7 3 !" %
8 4 𝑅= ∙ (8 + 1) = = 2.25
#$$ &
9 5
11 6
13 7 𝑅 = 2.25
15 8
2) Afronden en interpoleren
o Als R een geheel getal is, neem dat rangnummer. Met het voorbeeld; R = 2.25
o Als R geen geheel getal is: 1. IR = 2
1. IR & FR bepalen FR = 0.25
§ IR (integer por1on) = het gehele deel van R 2. Rang IR = 2; Rang IR + 1 = 3
§ FR (frac1onal por1on) = het decimale deel van R Het getal bij rang 2 is 5; het getal
2. Zoek de scores met rang IR en IR + 1. bij rang 3 is 7.
3. Interpoleer: vermenigvuldig het verschil tussen 3. Interpoleer:
deze scores met FR en tel dat op bij de lagere Verschil tussen scores: 7-5 = 2
score. (0.25) ∙ (7-5) + 5 = 5.5
3) Conclusie
Het berekende antwoord is het percenFel. Dit betekent dat deze waarde de grens aangeeC
waaronder een bepaald percentage van de gegevens valt.
Met het voorbeeld; R = 2.25
25e percen,el = 5.5
Conclusie: 25% van de waarnemingen in de dataset een waarde heeC die
lager is dan of gelijk is aan 5.5.
• Als je definiFe 1 had gebruikt, zou het 25e percenFel 7 zijn.
• Als je definiFe 2 had gebruikt, zou het 25e percenFel 5 zijn.
• Met de derde definiFe bereken je het percenFel dus het meest
nauwkeurig.
4