Statistische codes
Hoofdstuk 2: eerste verkenning van de software
Instructie Betekenis
mutate() Het creëren van een aangepaste dataset
Tussen de haakjes: namen van de nieuwe
kolommen die je aanmaakt
skim() Snel verkennen van vele eigenschappen
van variabelen in een dataframe
Tussen de haakjes: object
xtabs() Frequentietabel maken
Tussen de haakjes: (formule, dataset)
%>% (pipe) Geef het resultaat door aan de volgende
functie
as.data.frame() Data omzetten naar een dataframe
(=tabel)
Tussen de haakjes: niks
ggplot() Maak een grafiek
Tussen de haakjes: de dataset
select() Kolommen selecteren
Tussen de haakjes: de kolom(men)
factor() =datatype specifiek voor categoriale
variabelen: van character data een factor
maken
Tussen de haakjes: kolom, levels
=c(benaming van de elementen)
scale_x_discrete(drop = FALSE) De x-as mag de lege levels niet laten vallen
fct_relevel() Geeft de factors een nieuwe volgorde
Tussen de haakjes: kolom, nieuwe volgorde
fct_recode() Levels nieuwe namen geven
Tussen de haakjes: kolom, nieuwe naam =
oude naam
coord_flip() Grafiek draaien (horizontaal of verticaal)
Tussen de haakjes: leeg
as.logical() Verandert 0 in FALSE, 1 in TRUE
Tussen de haakjes: kolom
as.data.frame.matrix() Kruistabel
Tussen de haakjes: leeg
fill() Staven van bar (hoogte) vullen met
Tussen de haakjes: kolom die de criteria
vormt
arrange() Sorteren van dataset (tabel)
Tussen de haakjes: object, kolom, kolom…
Kolom 1 wordt gesorteerd, daarna
vervolgens kolom 2,…
filter() Filtert de rijen of kolommen eruit die aan de
filter voldoen
Tussen de haakjes: object, criteria
color() Kleuren
Tussen de haakjes: kolom
shape() Vorm geven
Tussen de haakjes: kolom
, facet_wrap() Subgrafieken maken
Tussen de haakjes: kolom op basis waarvan
het onderscheid gemaakt wordt
Hoofdstuk 3: Beschrijvende statistieken
Voor elke numerische variabele in de data
krijg je meteen het gemiddelde,
descr() standaarddeviatie, laagst geattesteerde
waarde,…
Tussen de haakjes: object
Data groeperen per kolom
group_by()
Tussen de haakjes: object of kolom
Maakt een subset van de dataset
select() Tussen de haakjes: selecteren welke
kolommen je wilt gebruiken
Rapport maken/ uitwerken van je eigen
subset aan samenvattende statistieken
summarize()
Tussen de haakjes: object, de nieuwe
kolommen
Aantal cijfers na de komma afronden
round() Tussen de haakjes: aantal cijfers na de
komma
Hoofdstuk 4: datavisualisatie
geom_bar() Staafdiagram
geom_histogram() Histogram
Van de bars van een histogram puntjes
geom_freqpoly()
maken en zo een grafiek vormen
binwidth() Breedte van de intervallen
geom_density() Dichtheidsgrafiek
geom_rug() Rug plot (tapijt)
geom_line()
Cumulatieve frequentiegrafiek
geom_point()
(point = scatter plot)
geom_step()
geom_boxplot() Boxplot
Lijn toevoegen aan het plot dat de trend
geom_smooth()
van de data volgt
Hoofdstuk 6: normaliteitstoetsen
tibble() Een dataset maken
stat_qq() Punten plotten in de grafiek
stat_qq_line() Rechte lijn plotten in de grafiek
Hoofdstuk 9: toetsen in de praktijk
df Vrijheidsgraden
var.test() (data normaal verdeeld)
ansari.test() (data niet normaal verdeeld)
mood.test() (data niet normaal verdeeld)
chisq.test() X2-toets voor goodness of fit
cramersV()
binom.test() Binominiale toets
cor.test() Correlatietest
Hoofdstuk 2: eerste verkenning van de software
Instructie Betekenis
mutate() Het creëren van een aangepaste dataset
Tussen de haakjes: namen van de nieuwe
kolommen die je aanmaakt
skim() Snel verkennen van vele eigenschappen
van variabelen in een dataframe
Tussen de haakjes: object
xtabs() Frequentietabel maken
Tussen de haakjes: (formule, dataset)
%>% (pipe) Geef het resultaat door aan de volgende
functie
as.data.frame() Data omzetten naar een dataframe
(=tabel)
Tussen de haakjes: niks
ggplot() Maak een grafiek
Tussen de haakjes: de dataset
select() Kolommen selecteren
Tussen de haakjes: de kolom(men)
factor() =datatype specifiek voor categoriale
variabelen: van character data een factor
maken
Tussen de haakjes: kolom, levels
=c(benaming van de elementen)
scale_x_discrete(drop = FALSE) De x-as mag de lege levels niet laten vallen
fct_relevel() Geeft de factors een nieuwe volgorde
Tussen de haakjes: kolom, nieuwe volgorde
fct_recode() Levels nieuwe namen geven
Tussen de haakjes: kolom, nieuwe naam =
oude naam
coord_flip() Grafiek draaien (horizontaal of verticaal)
Tussen de haakjes: leeg
as.logical() Verandert 0 in FALSE, 1 in TRUE
Tussen de haakjes: kolom
as.data.frame.matrix() Kruistabel
Tussen de haakjes: leeg
fill() Staven van bar (hoogte) vullen met
Tussen de haakjes: kolom die de criteria
vormt
arrange() Sorteren van dataset (tabel)
Tussen de haakjes: object, kolom, kolom…
Kolom 1 wordt gesorteerd, daarna
vervolgens kolom 2,…
filter() Filtert de rijen of kolommen eruit die aan de
filter voldoen
Tussen de haakjes: object, criteria
color() Kleuren
Tussen de haakjes: kolom
shape() Vorm geven
Tussen de haakjes: kolom
, facet_wrap() Subgrafieken maken
Tussen de haakjes: kolom op basis waarvan
het onderscheid gemaakt wordt
Hoofdstuk 3: Beschrijvende statistieken
Voor elke numerische variabele in de data
krijg je meteen het gemiddelde,
descr() standaarddeviatie, laagst geattesteerde
waarde,…
Tussen de haakjes: object
Data groeperen per kolom
group_by()
Tussen de haakjes: object of kolom
Maakt een subset van de dataset
select() Tussen de haakjes: selecteren welke
kolommen je wilt gebruiken
Rapport maken/ uitwerken van je eigen
subset aan samenvattende statistieken
summarize()
Tussen de haakjes: object, de nieuwe
kolommen
Aantal cijfers na de komma afronden
round() Tussen de haakjes: aantal cijfers na de
komma
Hoofdstuk 4: datavisualisatie
geom_bar() Staafdiagram
geom_histogram() Histogram
Van de bars van een histogram puntjes
geom_freqpoly()
maken en zo een grafiek vormen
binwidth() Breedte van de intervallen
geom_density() Dichtheidsgrafiek
geom_rug() Rug plot (tapijt)
geom_line()
Cumulatieve frequentiegrafiek
geom_point()
(point = scatter plot)
geom_step()
geom_boxplot() Boxplot
Lijn toevoegen aan het plot dat de trend
geom_smooth()
van de data volgt
Hoofdstuk 6: normaliteitstoetsen
tibble() Een dataset maken
stat_qq() Punten plotten in de grafiek
stat_qq_line() Rechte lijn plotten in de grafiek
Hoofdstuk 9: toetsen in de praktijk
df Vrijheidsgraden
var.test() (data normaal verdeeld)
ansari.test() (data niet normaal verdeeld)
mood.test() (data niet normaal verdeeld)
chisq.test() X2-toets voor goodness of fit
cramersV()
binom.test() Binominiale toets
cor.test() Correlatietest