DATASET 1: Geboortegewicht
De Jimma studie is een cohortstudie die in Ethiopië is uitgevoerd bij meer dan 8000 huishoudens om
na te gaan wat risicofactoren zijn bij het overleven van kinderen in arme regio’s en hoe
demografische factoren van de ouders hier ook een voorspellende rol in kunnen spelen. De jimma1
dataset (jimma1.csv) is een sample van 450 pasgeboren baby’s (minder dan 10 dagen oud).
Idno RATIO
Age RATIO
Sex NOMINAAL
Agem RATIO
Anv_c2 NOMINAAL
Deliv NOMINAAL
Educ ORDINAAL
Famsize RATIO
M1_2 NOMINAAL
Marital NOMINAAL
Occup NOMINAAL
Visit RATIO
Height RATIO
Weight RATIO
1
,Instellingen
2
,3
, Informatie
➔ Indien we categorische v in een regressie willen steken -> aanmaken van dummy variabelen
-> v met 0 en 1 codering (twee niveaus, kansen)
➔ Logistische r is een regressie waarbij je voorspelde v niet langer iets numeriek is
(geen interval of ratio), maar enkel uit 0 en 1 bestaat
➔ PROBLEEM: je kan je regressie niet zomaar op een categorische v uitvoeren, want je
gaat onrealistische waarde bekomen
➔ OPLOSSING: de kans hervormen, niet kijken naar de kansen dat iets gaat gebeuren,
maar de ODDS -> RESULTAAT: regressiemodel met realistische waarden
4