H1
Dataset = verzameling van gegevens van een onderzoek
Variabele = een kenmerk van objecten in je onderzoek.
Kwalitatieve variabelen = variabelen waarvan de waarden geen getallen zijn maar kenmerken of
categorieën zoals geslacht en oogkleur.
Kunnen preciezer worden gemaakt door ze te classificeren als:
- Nominaal
Kwalitatieve variabelen met namen als waarde, er zit geen rangorde in. Voorbeelden:
automerk, studierichting, oogkleur
- Ordinaal
Kwalitatieve variabelen die een betekenis hebben die je op volgorde kan zetten in termen
van meer of minder. Voorbeelden: vmbo, havo, vwo.
Kwantitatieve variabelen = variabelen waarvan de waarden getallen zijn, zoals lengte en leeftijd.
Kunnen preciezer worden gemaakt door ze te classificeren als:
- Interval
Kwantitatieve variabelen waar van de waarden op volgorde gezet kunnen worden maar geen
absoluut nulpunt hebben. Voorbeeld: graden Celsius
- Ratio
Kwantitatieve variabelen die altijd een nulpunt hebben. Voorbeeld lengte en gewicht en
graden Kelvin.
Onderscheid discreet en continu
- Discreet
Kwantitatieve variabelen waarvan de waarden altijd hele getallen zijn (afgeronde en getelde
aantallen) voorbeeld: leeftijd, rapportcijfers.
- Continu
Kwantitatieve waarden die iedere waarde aan kunnen nemen. Voorbeeld niet afgeronde
lengte en gewicht
Onafhankelijke variabele = een verklarende variabele
Afhankelijke variabele = een verklaarde variabele
Kans = dat een gebeurtenis optreed me de kans van een getal tussen 0 en 1. 0 betekent onmogelijk
en 1 betekent dat het 100% zeker is.
Centrummaten
Gemiddelde = aantal getallen gedeeld door het aantal getallen
Modus = getal die het meeste voorkomt
Mediaan = het middelste getal van een aantal getallen die op volgorde van grootte staan
General Information
, Een kans = een gebeurtenis die wordt weergegeven met een getal tussen 0 en 1, 0 betekent dat het
onmogelijk is, en 1 dat het 100% zeker is. Het wordt genoteerd als P (gebeurtenis).
Hoe meet je een kans?
H2
Beschrijvende statistiek: spreidings- en centrummaten
Centrummaten = zeggen iets over het midden van je data
- Gemiddelde: som van een aantal getallen gedeeld door het aantal getallen
- Modus: de waarde die het meeste voorkomt
- Mediaan: het middelste getal van een aantal getallen die op volgorde staan
Spreidingsmaten = zeggen iets over hoeveel variatie er in je data zit
- Variantie: het gemiddelde van alle gekwadrateerde verschillen met het gemiddelde
- Range: verschil tussen het minimum en maximum
- Standaardafwijking: hoe meer de data van elkaar verspreid is, hoe groter de
standaardafwijking. Het wordt als volgt berekend.
General Information