Inleiding statistiek
Week 1: Introduction: frequency distributions
Appendix A:
A.1 - Symbols and Notation:
- Rekenmethode: (1) haakjes, (2) kwadraten, (3) delen/keer & (4) optellen/aftrekken. En
van links naar rechts!
- Voorbeeld: (3+1)^2 - 4 x 7/2
- (4)^2 - 4 x 7/2
- 16 - 4 x 7/2
- 16 - 14 = -2
- Symbolen:
- > groter dan
- < kleiner dan
- Vergeet niet dat in deze som “2 + 3^2 - 6” alleen de 3 is gekwadrateerd, terwijl in deze
som “(2+3)^2” alles binnen de haakjes is gekwadrateerd.
A.2 - Proporties: breuken, decimalen en percentages:
Breuken:
- Bij breuken is het belangrijk om op zoek te gaan
naar dezelfde noemers.
- Bij keersommen met breuken doe je teller x teller
/ noemer x noemer.
- Bij delen draai je de laatste breuk om, om er zo
een keersom van te maken.
- Voor optellen en aftrekken moeten de noemers gelijk zijn.
- Als je wil weten of 3/8 of 7/16 groter is, maak je ze eerst gelijk (6/16). Nu weet je dat 6/16
< 7/16, waardoor je ook weet dat 3/8 < 7/16.
Decimalen:
- Wanneer je decimalen omzet in breuken kijk je naar het aantal getallen achter de komma.
0.1 > 1/10 en 0.5333 > 5333/10.000.
- Bij het optellen/aftrekken van decimalen kun je deze onder elkaar zetten.
- Bij keersommen met decimalen ook onder elkaar zetten.
- Bij delen met decimalen kun je deze in een breuk zetten en keer 100 te doen. In dit geval
0..6 > 25/160 = 5/32, wat je niet kleiner kunt maken.
Percentages:
- Van procent naar decimaal > gedeeld door 100 (8% > 0.08)
- Bij rekenen met procent is het handig deze naar decimalen te veranderen.
A3 - Negatieve getallen:
- min & min wordt plus (4- - 3 = 7). Dit geldt voor optellen en aftrekken, maar ook voor
keersommen.
A4: Basic Algebra
- Bij het oplossen van X, wil je X vrij hebben (X+3=7) > (X= 7 - 3) > (X= 4). Hierbij wisselt
de waarde van het getal (is het negatief wordt het positief en andersom).
, - Bij keersommen met X kun je het getal aan de X niet zomaar naar de overkant plaatsen.
Wel kun je het bijvoorbeeld wegdelen: 4X = 24 > 4X/4 = 24/4 > X=6.
- Bij delen kun je de X weghalen door keer te gebruiken: X/3 = 9 > 3*(X/3) = (3)*9 > X = 27.
A5 - Machten en Wortels
- Alles tot de macht 1, is de waarde van het getal (6^1 = 6). Alles tot de macht 0, is 1.
- Een negatief getal tot de macht, wordt uiteindelijk positief voor de oneven getallen en blijft
het negatief voor de even getallen. Het is belangrijk dat je -9^3 tussen haakjes uitschrijft,
want anders kun je andere antwoorden te zien krijgen.
Summation notation:
- “Σ” dit teken geeft “de som van” aan. Vaak wordt deze opgevolgd door een rekensom of
getal. ????
1.1 Waarom statistiek?
- Statistiek (= de wetenschap van het verzamelen, analyseren, presenteren en
interpreteren van data). Er zijn twee taken binnen de statistiek:
1. Beschrijvende statistiek (= het samenvatten en vereenvoudigen van data)
2. Inferentiële statistiek (= de statistiek die je gebruikt om je hypotheses te
beantwoorden) > hiermee zorg je dus voor een generalisatie van steekproef naar
populatie.
- Variabelen en data. Variabelen zijn alles wat kan variëren (haarkleur, lievelingseten of
gender). Data is de collectie van de observaties van mensen hun scores op onze
gekozen variabelen.
- Parameter (= een waarde die een samenvatting geeft van een populatie) > voorbeeld: het
gemiddeld of percentage adolescenten.
- Statistiek (= de steekproef van de gewenste populatie) > voorbeeld: het
steekproefgemiddelde of het percentage adolescenten in de steekproef. Deze
steekproefwaarden komen natuurlijk niet precies overeen met je populatie, het verschil
hier tussen heet de sampling (steekproef) error.
- (Inferentiële) statistiek wordt breed gezien op twee vragen toegepast:
1. Vragen over (verschillen in) gemiddelden. Voorbeeld: is het gemiddelde cijfer
van de Tilburgse studenten hoger dan de Amsterdamse studenten?
2. Vragen over de relaties tussen variabelen. Voorbeeld: leidt meer oefenen tot
betere prestaties? Het meten van deze relatie kan onder andere gedaan worden
door een correlatie onderzoek. Als je één variabel wil manipuleren, kun je ook een
experiment uitvoeren.
- Vaak wordt de term experiment snel gebruikt, maar het is pas een écht
experiment als de onderzoeker één variabel manipuleert. Anders wordt het
een quasi-experiment genoemd.
1.2 Variabelen
- De opbouw van variabelen:
1. Bepalen of een variabelen categorisch (ja/nee) of continu (geleidelijk) is.
Man/vrouw is categorisch, maar intelligentie geleidlijk.
2. Hoe komt de kern van het construct tot uiting in menselijk gedrag? Dus hoe komt
intelligentie bijvoorbeeld tot uiting in menselijk gedrag?
3. Hoe ga je dit menselijke gedrag tot uiting brengen en meten?
, - Dit proces is het operationaliseren van constructen.
- Typen variabelen:
1. Nominaal (= verschil in scores geven kwalitatieve verschillen aan) > voorbeeld:
haarkleur.
2. Ordinaal (= verschil in scores geven kwalitatieve verschillen aan én er is een
bepaalde ordening) > voorbeeld: SES.
3. Interval (= kwalitatieve verschillen met ordening én gelijke afstanden in
verschillen, maar geen echte nul) > voorbeeld: temperatuur, want ook al zeggen
wij dat er temperaturen van nul bestaan, betekent dit niet dat temperatuur
verdwijnt, het gaat gewoon onder nul.
4. Ratio (= hetzelfde als interval, maar hier is wel een echte nul) > voorbeeld: lengte,
want iets kan geen lengte hebben, hier is de nul dus afwezig, je kunt namelijk
geen negatieve lengte hebben.
- Ratio is ook de enige variabelen waarbij we kunnen zeggen dat variabelen
twee keer zo groot/klein zijn. Voorbeeld: Jan is twee keer zo lang als
Piet.
- Hierbij zijn nominaal en ordinaal discreet (= variabelen met hele getallen)
en interval en ratio continue (= variabelen met alle mogelijke getallen).
1.3 Frequentie verdelingen (distributions)
- Omdat we bij beschrijvende statistiek vaak veel data willen vereenvoudigen, worden deze
weergegeven in een figuur of tabel. Deze bevatten twee bronnen van informatie:
1. De verschillende scores die op de variabelen voorkomen.
2. De frequentie van hoe vaak deze unieke scores voorkomen.
- Vaak worden er ook proporties en percentages aan
deze tabellen toegevoegd. Bij de proportie (=
relatieve frequentie) kijk je hoe vaak een score
voorkomt in je steekproef. In dit geval gedeeld door
7 mensen (1/7). Bij percentages vermenigvuldig je
de proportie met 100 zodat dit een percentage
wordt (14,29%).
- Een frequentie tabel is niet meer overzichtelijk bij
data met continue variabelen. Omdat hierbij alle
tussenliggende waarde mogelijk zijn, zou deze tabel
groot en onoverzichtelijk worden. Daarom zou je
kunnen kiezen voor een figuur.
Week 1: Introduction: frequency distributions
Appendix A:
A.1 - Symbols and Notation:
- Rekenmethode: (1) haakjes, (2) kwadraten, (3) delen/keer & (4) optellen/aftrekken. En
van links naar rechts!
- Voorbeeld: (3+1)^2 - 4 x 7/2
- (4)^2 - 4 x 7/2
- 16 - 4 x 7/2
- 16 - 14 = -2
- Symbolen:
- > groter dan
- < kleiner dan
- Vergeet niet dat in deze som “2 + 3^2 - 6” alleen de 3 is gekwadrateerd, terwijl in deze
som “(2+3)^2” alles binnen de haakjes is gekwadrateerd.
A.2 - Proporties: breuken, decimalen en percentages:
Breuken:
- Bij breuken is het belangrijk om op zoek te gaan
naar dezelfde noemers.
- Bij keersommen met breuken doe je teller x teller
/ noemer x noemer.
- Bij delen draai je de laatste breuk om, om er zo
een keersom van te maken.
- Voor optellen en aftrekken moeten de noemers gelijk zijn.
- Als je wil weten of 3/8 of 7/16 groter is, maak je ze eerst gelijk (6/16). Nu weet je dat 6/16
< 7/16, waardoor je ook weet dat 3/8 < 7/16.
Decimalen:
- Wanneer je decimalen omzet in breuken kijk je naar het aantal getallen achter de komma.
0.1 > 1/10 en 0.5333 > 5333/10.000.
- Bij het optellen/aftrekken van decimalen kun je deze onder elkaar zetten.
- Bij keersommen met decimalen ook onder elkaar zetten.
- Bij delen met decimalen kun je deze in een breuk zetten en keer 100 te doen. In dit geval
0..6 > 25/160 = 5/32, wat je niet kleiner kunt maken.
Percentages:
- Van procent naar decimaal > gedeeld door 100 (8% > 0.08)
- Bij rekenen met procent is het handig deze naar decimalen te veranderen.
A3 - Negatieve getallen:
- min & min wordt plus (4- - 3 = 7). Dit geldt voor optellen en aftrekken, maar ook voor
keersommen.
A4: Basic Algebra
- Bij het oplossen van X, wil je X vrij hebben (X+3=7) > (X= 7 - 3) > (X= 4). Hierbij wisselt
de waarde van het getal (is het negatief wordt het positief en andersom).
, - Bij keersommen met X kun je het getal aan de X niet zomaar naar de overkant plaatsen.
Wel kun je het bijvoorbeeld wegdelen: 4X = 24 > 4X/4 = 24/4 > X=6.
- Bij delen kun je de X weghalen door keer te gebruiken: X/3 = 9 > 3*(X/3) = (3)*9 > X = 27.
A5 - Machten en Wortels
- Alles tot de macht 1, is de waarde van het getal (6^1 = 6). Alles tot de macht 0, is 1.
- Een negatief getal tot de macht, wordt uiteindelijk positief voor de oneven getallen en blijft
het negatief voor de even getallen. Het is belangrijk dat je -9^3 tussen haakjes uitschrijft,
want anders kun je andere antwoorden te zien krijgen.
Summation notation:
- “Σ” dit teken geeft “de som van” aan. Vaak wordt deze opgevolgd door een rekensom of
getal. ????
1.1 Waarom statistiek?
- Statistiek (= de wetenschap van het verzamelen, analyseren, presenteren en
interpreteren van data). Er zijn twee taken binnen de statistiek:
1. Beschrijvende statistiek (= het samenvatten en vereenvoudigen van data)
2. Inferentiële statistiek (= de statistiek die je gebruikt om je hypotheses te
beantwoorden) > hiermee zorg je dus voor een generalisatie van steekproef naar
populatie.
- Variabelen en data. Variabelen zijn alles wat kan variëren (haarkleur, lievelingseten of
gender). Data is de collectie van de observaties van mensen hun scores op onze
gekozen variabelen.
- Parameter (= een waarde die een samenvatting geeft van een populatie) > voorbeeld: het
gemiddeld of percentage adolescenten.
- Statistiek (= de steekproef van de gewenste populatie) > voorbeeld: het
steekproefgemiddelde of het percentage adolescenten in de steekproef. Deze
steekproefwaarden komen natuurlijk niet precies overeen met je populatie, het verschil
hier tussen heet de sampling (steekproef) error.
- (Inferentiële) statistiek wordt breed gezien op twee vragen toegepast:
1. Vragen over (verschillen in) gemiddelden. Voorbeeld: is het gemiddelde cijfer
van de Tilburgse studenten hoger dan de Amsterdamse studenten?
2. Vragen over de relaties tussen variabelen. Voorbeeld: leidt meer oefenen tot
betere prestaties? Het meten van deze relatie kan onder andere gedaan worden
door een correlatie onderzoek. Als je één variabel wil manipuleren, kun je ook een
experiment uitvoeren.
- Vaak wordt de term experiment snel gebruikt, maar het is pas een écht
experiment als de onderzoeker één variabel manipuleert. Anders wordt het
een quasi-experiment genoemd.
1.2 Variabelen
- De opbouw van variabelen:
1. Bepalen of een variabelen categorisch (ja/nee) of continu (geleidelijk) is.
Man/vrouw is categorisch, maar intelligentie geleidlijk.
2. Hoe komt de kern van het construct tot uiting in menselijk gedrag? Dus hoe komt
intelligentie bijvoorbeeld tot uiting in menselijk gedrag?
3. Hoe ga je dit menselijke gedrag tot uiting brengen en meten?
, - Dit proces is het operationaliseren van constructen.
- Typen variabelen:
1. Nominaal (= verschil in scores geven kwalitatieve verschillen aan) > voorbeeld:
haarkleur.
2. Ordinaal (= verschil in scores geven kwalitatieve verschillen aan én er is een
bepaalde ordening) > voorbeeld: SES.
3. Interval (= kwalitatieve verschillen met ordening én gelijke afstanden in
verschillen, maar geen echte nul) > voorbeeld: temperatuur, want ook al zeggen
wij dat er temperaturen van nul bestaan, betekent dit niet dat temperatuur
verdwijnt, het gaat gewoon onder nul.
4. Ratio (= hetzelfde als interval, maar hier is wel een echte nul) > voorbeeld: lengte,
want iets kan geen lengte hebben, hier is de nul dus afwezig, je kunt namelijk
geen negatieve lengte hebben.
- Ratio is ook de enige variabelen waarbij we kunnen zeggen dat variabelen
twee keer zo groot/klein zijn. Voorbeeld: Jan is twee keer zo lang als
Piet.
- Hierbij zijn nominaal en ordinaal discreet (= variabelen met hele getallen)
en interval en ratio continue (= variabelen met alle mogelijke getallen).
1.3 Frequentie verdelingen (distributions)
- Omdat we bij beschrijvende statistiek vaak veel data willen vereenvoudigen, worden deze
weergegeven in een figuur of tabel. Deze bevatten twee bronnen van informatie:
1. De verschillende scores die op de variabelen voorkomen.
2. De frequentie van hoe vaak deze unieke scores voorkomen.
- Vaak worden er ook proporties en percentages aan
deze tabellen toegevoegd. Bij de proportie (=
relatieve frequentie) kijk je hoe vaak een score
voorkomt in je steekproef. In dit geval gedeeld door
7 mensen (1/7). Bij percentages vermenigvuldig je
de proportie met 100 zodat dit een percentage
wordt (14,29%).
- Een frequentie tabel is niet meer overzichtelijk bij
data met continue variabelen. Omdat hierbij alle
tussenliggende waarde mogelijk zijn, zou deze tabel
groot en onoverzichtelijk worden. Daarom zou je
kunnen kiezen voor een figuur.