HOOFDSTUK 1: DATA MANIPULATIE
vector aanmaken leeftijd < - c (18, 22, 17, 19, 19 )
Basis code's > mean(leeftijd)
[1] 19
> length(leeftijd)
[1] 5
> min(leeftijd)
[1] 17
> max(leeftijd)
[1] 22
> median(leeftijd)
[1] 19
> leeftijd[1]
[1] 18
> leeftijd[2]
[1] 22
Ordinaal en Nominaal postcode <- c("9000", "2500", "8400")
niveau ( = Nodig zodat R weet dat dit gaat over nominale/ ordinale variabelen
tramnummer <- factor( c(1, 21, 22, 4, 22, 21, 1, 4) )
( = Hier is het niet nodig om "" te gebruiken. Door het commando FACTOR weet R dat dit gaat over nomin
ordinale variabelen
> uitslag <- factor( c("brons", "goud", "goud", "brons",
Ordinaal niveau "zilver","brons", "brons"),
levels = c( "brons", "zilver", "goud" ),
ordered = TRUE)
Ordered = TRUE nodig in R zodat R de volgorde weet van de waarden
> myData <- data.frame(score, iq, motivatie, geslacht, roken,
Data Frame opleiding, gewicht, lengte)
> myData$geslacht
[1] V V V M M V V V M M M V V V V M V M M M M M V V V
Levels: M V
Data frame opslaan
> write.csv(myData, file = 'myData.csv', row.names = FALSE)
Data frame openen
> read.csv(file = "myData.csv")
Om de gegevens later te kunnen gebruiken moet je ze een naam toekennen.
> myData <- read.csv(file = "myData.csv")
Missing Data, NA = Not Available
> gewicht <- c(69, 64, NA, 76, 78, 75, 74, 51)
, Hoofdstuk 2 Beschrijvende Statistiek
Frequentieverdeling
Om een frequentieverdeling in R te krijgen typ je bijvoorbeeld
> table(myData$opleiding)
ped psy soc 10 18 2
Relatieve frequentieverdeling Voor de relatieve frequentieverdeling moet je nog door de steekproefgrootte n delen:
> table( myData$opleiding ) / dim( myData )[1]
ped psy soc 0.33333333 0.60000000 0.06666667
Om de relatieve frequentieverdeling te bekomen, mag je ook de functie prop.table gebruiken:
> prop.table( table( myData$opleiding ) )
ped psy soc 0.33333333 0.60000000 0.06666667
Voor een bivariate frequentieverdeling gebruik je opnieuw de functie table, met als
Bivariate frequentieverdeling argumenten de namen van de twee variabelen. Voorbeeld:
> table( myData$geslacht , myData$opleiding )
ped psy soc M 7 7 0 V 3 11 2
vector aanmaken leeftijd < - c (18, 22, 17, 19, 19 )
Basis code's > mean(leeftijd)
[1] 19
> length(leeftijd)
[1] 5
> min(leeftijd)
[1] 17
> max(leeftijd)
[1] 22
> median(leeftijd)
[1] 19
> leeftijd[1]
[1] 18
> leeftijd[2]
[1] 22
Ordinaal en Nominaal postcode <- c("9000", "2500", "8400")
niveau ( = Nodig zodat R weet dat dit gaat over nominale/ ordinale variabelen
tramnummer <- factor( c(1, 21, 22, 4, 22, 21, 1, 4) )
( = Hier is het niet nodig om "" te gebruiken. Door het commando FACTOR weet R dat dit gaat over nomin
ordinale variabelen
> uitslag <- factor( c("brons", "goud", "goud", "brons",
Ordinaal niveau "zilver","brons", "brons"),
levels = c( "brons", "zilver", "goud" ),
ordered = TRUE)
Ordered = TRUE nodig in R zodat R de volgorde weet van de waarden
> myData <- data.frame(score, iq, motivatie, geslacht, roken,
Data Frame opleiding, gewicht, lengte)
> myData$geslacht
[1] V V V M M V V V M M M V V V V M V M M M M M V V V
Levels: M V
Data frame opslaan
> write.csv(myData, file = 'myData.csv', row.names = FALSE)
Data frame openen
> read.csv(file = "myData.csv")
Om de gegevens later te kunnen gebruiken moet je ze een naam toekennen.
> myData <- read.csv(file = "myData.csv")
Missing Data, NA = Not Available
> gewicht <- c(69, 64, NA, 76, 78, 75, 74, 51)
, Hoofdstuk 2 Beschrijvende Statistiek
Frequentieverdeling
Om een frequentieverdeling in R te krijgen typ je bijvoorbeeld
> table(myData$opleiding)
ped psy soc 10 18 2
Relatieve frequentieverdeling Voor de relatieve frequentieverdeling moet je nog door de steekproefgrootte n delen:
> table( myData$opleiding ) / dim( myData )[1]
ped psy soc 0.33333333 0.60000000 0.06666667
Om de relatieve frequentieverdeling te bekomen, mag je ook de functie prop.table gebruiken:
> prop.table( table( myData$opleiding ) )
ped psy soc 0.33333333 0.60000000 0.06666667
Voor een bivariate frequentieverdeling gebruik je opnieuw de functie table, met als
Bivariate frequentieverdeling argumenten de namen van de twee variabelen. Voorbeeld:
> table( myData$geslacht , myData$opleiding )
ped psy soc M 7 7 0 V 3 11 2