Data in R
<- Toekenningsoperator, iets in een lijst steken, iets
een naam geven
c() = vector. Lijst/ doos aanmaken. Dit kan
kwantitatief of via nominale variabele.
read.csv Lezen van data.
write.csv Opslaan data.
[..,…] [rij, kolommen]
factor ( c() ) Zeggen dat de getallen in de vector als niet
numeriek beschouwd moeten worden. = een
vector van objecten en geen getallen.
factor ( c(), levels =Vector aanmaken met warden van een ordinale
c (), ordered = variabele.
TRUE)
Functies voor vectoren
mean(…$...) Gemiddelde
median(…$...) Mediaan
sum() Som
max() Grootste waarde uit vector
min() Kleinste waarde uit vector
lenght() Het aantal waarden in de vector
Functies voor data frames
dim() Hoeveel observaties en hoeveel variabelen in het
dataframe = grootte van het dataframe.
head() Eerste 6 observaties uit een dataframe te bekijken
n= Zo geef je aan hoeveel rijen van het dataframe je
wilt zien
str() Geeft je een lijst met alle variabelen die in het
dataframe zitten en meteen ook welk type
variabele het is
data.frame() Zo maak je een dataframe aan, de verschillende
vectoren die je in je dataframe wilt stoppen zet je
tussen de haakjes.
mijn_df Object opnieuw oproepen
$ Afzonderlijke vectoren in een dataframe oproepen.
Opslaan
Ctrl + s Script opslaan
write.csv() Dataframe opslaan
getwd() Opvragen waar die het dataframe heeft
opgeslagen
setwd() Na locatie op te vragen/ correct door te geven
plaats je dit altijd bovenaan om zo alles
automatisch op de juiste plaats op te slaan
Meer functies via packages
install.packages() Eenmalig uitvoeren om een externe functies te
kunnen gebruiken. Altijd tussen “” zetten
library() Elke keer opnieuw uitvoeren wanneer je de
functies uit een package wilt gebruiken
, Hoofdstuk 1: data manipulatie
Hoofdstuk 2: beschrijvende statistiek
Ordeningstechnieken
table(…$...) Frequentieverdeling opvragen (modus)
dim() Steekproefgrootte
RelFreq <- table() Relatieve frequentie verdeling
prop.table(table()) Functie om een tabel van gehele getallen om te
zetten naar proporties.
table(…,…) Opvragen van een bivariate frequentieverdeling.
(2 argumenten)
Grafische voorstellingen
pie() Opvragen van een cirkeldiagram. Heeft twee
argumenten nodig. x = vector met frequenties of
properties En labels = vector met namen van de
categorieën. OF tabel pie(table())
barplot() Lijndiagram opvragen. Heeft twee argumenten
nodig: vector met de waarde van de variabele,
vector met de corresponderende frequenties. OF
tabel barplot (table())
hits( x = …) Histogram opvragen, voor continue variabelen.
Slechts één argument nodig: lijst van alles scores
waarvoor je een histogram wenst.
breaks() Als argument in hist, aantal ‘klassen’ (staven) je
wilt in je histogram.
[1] Lengte van de tabel bevragen
[2] Breedte van de tabel bevragen
plot( x =…, y = …) Spreidingsdiagram. Heeft twee argumenten nodig:
x (lijst et alle scores van de variabele op de
horizontale as), y (lijst et alle scores van de
variabele op de verticale as)
Reductietechnieken
mean() Gemiddelde gevoelig voor outliners!
median() Mediaan berekenen. niet gevoelig voor
outliners!
as.numeric() Transformeert een vector van niveaus/ factoren in
getallen als argument in median().
table() Frequentieverdeling opvragen, hoogste score
zoeken = modus niet gevoelig aan outliners!
var() Variantie berekenen, altijd pos of nul. gevoelig
aan outliners!
Opm. nooit voor ordinale/ nominale variabelen!!
sd() of sqrt(var()) Standaarddeviatie, vierkantswortel van variantie
omdat dit meer betekenis zal geven. gevoelig
aan outliners!
<- Toekenningsoperator, iets in een lijst steken, iets
een naam geven
c() = vector. Lijst/ doos aanmaken. Dit kan
kwantitatief of via nominale variabele.
read.csv Lezen van data.
write.csv Opslaan data.
[..,…] [rij, kolommen]
factor ( c() ) Zeggen dat de getallen in de vector als niet
numeriek beschouwd moeten worden. = een
vector van objecten en geen getallen.
factor ( c(), levels =Vector aanmaken met warden van een ordinale
c (), ordered = variabele.
TRUE)
Functies voor vectoren
mean(…$...) Gemiddelde
median(…$...) Mediaan
sum() Som
max() Grootste waarde uit vector
min() Kleinste waarde uit vector
lenght() Het aantal waarden in de vector
Functies voor data frames
dim() Hoeveel observaties en hoeveel variabelen in het
dataframe = grootte van het dataframe.
head() Eerste 6 observaties uit een dataframe te bekijken
n= Zo geef je aan hoeveel rijen van het dataframe je
wilt zien
str() Geeft je een lijst met alle variabelen die in het
dataframe zitten en meteen ook welk type
variabele het is
data.frame() Zo maak je een dataframe aan, de verschillende
vectoren die je in je dataframe wilt stoppen zet je
tussen de haakjes.
mijn_df Object opnieuw oproepen
$ Afzonderlijke vectoren in een dataframe oproepen.
Opslaan
Ctrl + s Script opslaan
write.csv() Dataframe opslaan
getwd() Opvragen waar die het dataframe heeft
opgeslagen
setwd() Na locatie op te vragen/ correct door te geven
plaats je dit altijd bovenaan om zo alles
automatisch op de juiste plaats op te slaan
Meer functies via packages
install.packages() Eenmalig uitvoeren om een externe functies te
kunnen gebruiken. Altijd tussen “” zetten
library() Elke keer opnieuw uitvoeren wanneer je de
functies uit een package wilt gebruiken
, Hoofdstuk 1: data manipulatie
Hoofdstuk 2: beschrijvende statistiek
Ordeningstechnieken
table(…$...) Frequentieverdeling opvragen (modus)
dim() Steekproefgrootte
RelFreq <- table() Relatieve frequentie verdeling
prop.table(table()) Functie om een tabel van gehele getallen om te
zetten naar proporties.
table(…,…) Opvragen van een bivariate frequentieverdeling.
(2 argumenten)
Grafische voorstellingen
pie() Opvragen van een cirkeldiagram. Heeft twee
argumenten nodig. x = vector met frequenties of
properties En labels = vector met namen van de
categorieën. OF tabel pie(table())
barplot() Lijndiagram opvragen. Heeft twee argumenten
nodig: vector met de waarde van de variabele,
vector met de corresponderende frequenties. OF
tabel barplot (table())
hits( x = …) Histogram opvragen, voor continue variabelen.
Slechts één argument nodig: lijst van alles scores
waarvoor je een histogram wenst.
breaks() Als argument in hist, aantal ‘klassen’ (staven) je
wilt in je histogram.
[1] Lengte van de tabel bevragen
[2] Breedte van de tabel bevragen
plot( x =…, y = …) Spreidingsdiagram. Heeft twee argumenten nodig:
x (lijst et alle scores van de variabele op de
horizontale as), y (lijst et alle scores van de
variabele op de verticale as)
Reductietechnieken
mean() Gemiddelde gevoelig voor outliners!
median() Mediaan berekenen. niet gevoelig voor
outliners!
as.numeric() Transformeert een vector van niveaus/ factoren in
getallen als argument in median().
table() Frequentieverdeling opvragen, hoogste score
zoeken = modus niet gevoelig aan outliners!
var() Variantie berekenen, altijd pos of nul. gevoelig
aan outliners!
Opm. nooit voor ordinale/ nominale variabelen!!
sd() of sqrt(var()) Standaarddeviatie, vierkantswortel van variantie
omdat dit meer betekenis zal geven. gevoelig
aan outliners!