Introductie Statistische Methoden voor Data-analyse
(2223-GZW1026)
Blok 6
Inhoudsopgave
,Stat_ videos week 1....................................................................................................................................... 3
Seminar 1.1..........................................................................................................................................................3
Seminar 2.2........................................................................................................................................................13
Stat_ videos week 2..................................................................................................................................... 18
Seminar 2.1........................................................................................................................................................18
Seminar 2.2........................................................................................................................................................21
Stat_ videos week 3..................................................................................................................................... 27
Seminar 3.1........................................................................................................................................................27
Seminar 3.2........................................................................................................................................................33
Stat_ videos week 4..................................................................................................................................... 39
Seminar 4.1........................................................................................................................................................39
Seminar 4.2........................................................................................................................................................43
Formules...................................................................................................................................................... 44
Stat_ Termen/ Samenvatting........................................................................................................................ 48
2
,Stat_ videos week 1
Seminar 1.1
1. Types of variables (nominal, ordinal, interval, ratio)
Variabele= recorded info/characteristic
Age, weight, income, hair color, tempature, diseases
Categorical or qualitative: place people into groups
- nominal: no ordering based on magnitude (sex, birth country, disease, hair colour)
- ordinal: rank/order (size coffee, schaal van likert, place in race)
Numeric or quantitative: recorded num. quantities
- Discrete: inter only (1,2,3,4…, number of people in ER, number of births in day)
- Continues: continues scale (weight, age, income, temperature, race time)
*ratio: meaningful 0, ratio (age, 20 jaar is 2x zo oud dan 10 jaar)
*interval: non-meaningful 0 (temperature)
Indentifiers= student number, id number (geen variabele)
Can convert numeric -> categorie: age> child/adult/senior.
Categorie variables as recorded using numbers (numbers as place holders)
Hoe hoger het level of measurement, hoe meer statistische testen er kunnen worden gedaan met de
data. Het is daarom het beste om het hoogste level van measurement mogelijk te gebruiken om
informatie te verzamelen.
Van laagste naar hoogste level of measurment (NOIR):
Nominal
Ordinal
Interval
Ratio
Sommige variabelen kunnen alleen worden gemeten op nominaal level (bijv. geslacht), terwijl andere
variabelen kunnen worden gemeten op verschillende levels.
Nominal level
De nominal level is het laagste level. Variabelen in een studie worden geplaatst in discrete
categorieën. Er is geen natuurlijke volgorde van deze categorieën. De cijfers die aan deze
categorieën worden verbonden, hebben geen betekenis. Op een nominal level geef je de categorieën
alleen een naam. Nominale data worden categorical of dichotomous genoemd. Dichotomous data
vallen in twee categorieën, bijv. man of vrouw. Bij categorical data zijn er meer dan twee
3
, categorieën, bijv. haarkleur. Deze data wordt vaak gepresenteerd in staaf- of cirkeldiagrammen.
De enige metingen die kunnen worden gedaan met deze data zijn:
Mode
Modal percentage
Range
Frequency distributie
Je kunt geen gemiddelde (mean) of mediaan uitrekenen, omdat er geen volgorde in de data zit.
Ordinal level
Ordinal data wordt ook categorical genoemd. Het verschil tussen nominal en ordinal is dat er een
natuurlijke volgorde zit in de categorieën, bijv. sociaal-economische status. De cijfers die aan de
categorieën worden gegeven zijn willekeurig en er is een willekeurig nulpunt. Het is ook niet duidelijk
hoeveel verschil er tussen de verschillende categorieën zit. Het wordt vaak gebruikt om attitude te
meten (Likert schaal).
Mogelijke metingen:
Alle nominal level metingen
Median
Percentile
Semiquartile range
Rank order coefficients of correlation
Het gemiddelde kan niet worden uitgerekend
Interval level
Interval data is geordend in categorieën zoals bij het ordinal level, alleen zijn er gelijke verschillen
tussen waarden en deze zijn bekend. Er is een willekeurig nulpunt, bijv. graden Celsius. Het nulpunt
geeft niet aan dat dit de laagste mogelijke waarde is.
Mogelijke metingen:
Alle ordinal level metingen
Mean
Standard deviation
Addition and substraction
Ratio level
Ratio level is het hoogste level of measurement. Ratio data is geordend en de verschillen tussen de
waarden zijn gelijk en bekend. Het verschil met het interval level is het natuurlijk nulpunt. 0
betekent dat geen variabele is. Het is dus geen willekeurig nulpunt. Bijvoorbeeld gewicht, lengte enz.
Mogelijke metingen:
Alle metingen zijn mogelijk
Vergelijkingen zijn mogelijk (2 keer zo zwaar)
Kan add, substract, multiply, divide (ratios)
4
(2223-GZW1026)
Blok 6
Inhoudsopgave
,Stat_ videos week 1....................................................................................................................................... 3
Seminar 1.1..........................................................................................................................................................3
Seminar 2.2........................................................................................................................................................13
Stat_ videos week 2..................................................................................................................................... 18
Seminar 2.1........................................................................................................................................................18
Seminar 2.2........................................................................................................................................................21
Stat_ videos week 3..................................................................................................................................... 27
Seminar 3.1........................................................................................................................................................27
Seminar 3.2........................................................................................................................................................33
Stat_ videos week 4..................................................................................................................................... 39
Seminar 4.1........................................................................................................................................................39
Seminar 4.2........................................................................................................................................................43
Formules...................................................................................................................................................... 44
Stat_ Termen/ Samenvatting........................................................................................................................ 48
2
,Stat_ videos week 1
Seminar 1.1
1. Types of variables (nominal, ordinal, interval, ratio)
Variabele= recorded info/characteristic
Age, weight, income, hair color, tempature, diseases
Categorical or qualitative: place people into groups
- nominal: no ordering based on magnitude (sex, birth country, disease, hair colour)
- ordinal: rank/order (size coffee, schaal van likert, place in race)
Numeric or quantitative: recorded num. quantities
- Discrete: inter only (1,2,3,4…, number of people in ER, number of births in day)
- Continues: continues scale (weight, age, income, temperature, race time)
*ratio: meaningful 0, ratio (age, 20 jaar is 2x zo oud dan 10 jaar)
*interval: non-meaningful 0 (temperature)
Indentifiers= student number, id number (geen variabele)
Can convert numeric -> categorie: age> child/adult/senior.
Categorie variables as recorded using numbers (numbers as place holders)
Hoe hoger het level of measurement, hoe meer statistische testen er kunnen worden gedaan met de
data. Het is daarom het beste om het hoogste level van measurement mogelijk te gebruiken om
informatie te verzamelen.
Van laagste naar hoogste level of measurment (NOIR):
Nominal
Ordinal
Interval
Ratio
Sommige variabelen kunnen alleen worden gemeten op nominaal level (bijv. geslacht), terwijl andere
variabelen kunnen worden gemeten op verschillende levels.
Nominal level
De nominal level is het laagste level. Variabelen in een studie worden geplaatst in discrete
categorieën. Er is geen natuurlijke volgorde van deze categorieën. De cijfers die aan deze
categorieën worden verbonden, hebben geen betekenis. Op een nominal level geef je de categorieën
alleen een naam. Nominale data worden categorical of dichotomous genoemd. Dichotomous data
vallen in twee categorieën, bijv. man of vrouw. Bij categorical data zijn er meer dan twee
3
, categorieën, bijv. haarkleur. Deze data wordt vaak gepresenteerd in staaf- of cirkeldiagrammen.
De enige metingen die kunnen worden gedaan met deze data zijn:
Mode
Modal percentage
Range
Frequency distributie
Je kunt geen gemiddelde (mean) of mediaan uitrekenen, omdat er geen volgorde in de data zit.
Ordinal level
Ordinal data wordt ook categorical genoemd. Het verschil tussen nominal en ordinal is dat er een
natuurlijke volgorde zit in de categorieën, bijv. sociaal-economische status. De cijfers die aan de
categorieën worden gegeven zijn willekeurig en er is een willekeurig nulpunt. Het is ook niet duidelijk
hoeveel verschil er tussen de verschillende categorieën zit. Het wordt vaak gebruikt om attitude te
meten (Likert schaal).
Mogelijke metingen:
Alle nominal level metingen
Median
Percentile
Semiquartile range
Rank order coefficients of correlation
Het gemiddelde kan niet worden uitgerekend
Interval level
Interval data is geordend in categorieën zoals bij het ordinal level, alleen zijn er gelijke verschillen
tussen waarden en deze zijn bekend. Er is een willekeurig nulpunt, bijv. graden Celsius. Het nulpunt
geeft niet aan dat dit de laagste mogelijke waarde is.
Mogelijke metingen:
Alle ordinal level metingen
Mean
Standard deviation
Addition and substraction
Ratio level
Ratio level is het hoogste level of measurement. Ratio data is geordend en de verschillen tussen de
waarden zijn gelijk en bekend. Het verschil met het interval level is het natuurlijk nulpunt. 0
betekent dat geen variabele is. Het is dus geen willekeurig nulpunt. Bijvoorbeeld gewicht, lengte enz.
Mogelijke metingen:
Alle metingen zijn mogelijk
Vergelijkingen zijn mogelijk (2 keer zo zwaar)
Kan add, substract, multiply, divide (ratios)
4