RStudio – Toegepaste biostatistiek
1. RStudio downloaden en bestanden invoeren
1.1 Structuur veranderen van de lay-out
Klik bovenaan op “View” → “Panes” → onderaan: “Pane lay-out”, zoals hieronder → “Apply”
Source Console
Environment Files
1.2 Data-set & R-script importeren
Dataset: Ga onderaan links naar Environment → Import dataset → from excel OF from text (base)
In dit geval gaat het over estrio en het geboortegewicht (2 variabelen). Deze moeten allebei op “numeric”
gezet worden.
Stel dat je ook de oogkleur van de moeder weet, dan wordt dit een “character”.
Indien je in de “Data Frame” (wanneer je de dataset importeert) ziet dat je een “X.” krijgt
- Links: Quote → Double quote vervangen door single quote
R-script: Klik bovenaan op File → open file
2. Beschrijvende statistiek & eenvoudige lineaire regressie
2.1 Beschrijvende statistiek
In dit voorbeeld gaat het over de dataset “greene”, waarbij estriol en het geboortegewicht (birthweight) de 2
variabelen zijn.
Namen variabelen te weten komen names(dataset)
Bijv. names(greene)
Alle waarden van een bepaalde variabele weten dataset$variabele
Bijv. greene$estriol
Attach data attach(dataset)
Bijv. attach(greene)
,2.1.1 Eenvoudig beschrijvende statistiek
mean(variabele)
Gemiddelde
Bijv. mean(estriol)
sd(variabele)
Standaarddeviatie
Bijv. sd(estriol)
median(variabele)
Mediaan
Bijv. median(estriol)
quantile(variable, hoeveelste kwantiel)
Bijv. quantile(estriol, 0,75)
Kwantiel
Specifieke waarde waarvan je weet dat 75% van
alle estriolwaarden kleiner is dan die specifieke
waarden.
boxplot(variabele)
Bijv. boxplot(estriol)
Boxplot
Boxplot wordt rechts onderaan zichtbaar bij
“Plots”.
hist(variabele, aantal onderbrekingen)
Histogram
Bijv. hist(estriol, breaks = 4)
table(variabele)
Tabellen (frequentietabel)
Bijv. table(estriol)
pie(table(variabele))
Taartdiagram van de frequentietabel
Bijv. pie(table(estriol))
require(graphics)
Scatterdiagram/plot
plot(variable1, variabele2)
Bijv. plot(estriol, birthweight)
, 2.2 Lineaire regressie
Beïnvloed variable 1, variable 2 op een significante mannier?
In dit voorbeeld: Beïnvloed het estriol gehalte het geboortegewicht op een significante manier?
Coëfficiënten intercept en RC
lm(respons variable ~ voorspelbare variable)
! Variabelen worden hier in een andere volgorde Bijv. lm(birthweight ~ estriol)
gegeven dan bij een scatterdiagram !
simple<-lm(respons variable ~ voorspelbare
Naam geven aan de lineaire regressie. variable)
In dit geval noemen we het “simple”. Bijv. simple<-lm(birthweight ~ estriol)
Door een naam te geven aan deze lineaire Als je daarna enkel “simple” ingeeft, krijg je
regressie, kan je later werken met gewoon de naam dezelfde resultaten te zien dan bij het commando
en moet je niet altijd lange commando’s ingeven. hierboven (coëfficiënten intercept en RC)
Fitten van een regressie lijn
abline(naam lineaire regressie, kleur =”kies kleur”)
Hierbij moet je wel eerst een scatterdiagram
Bijv: abline(simple, col=”red”)
plotten, anders krijg je geen regressie lijn te zien.
summary(naam lineaire regressie)
Bijv. summary(simple)
Regressie vergelijking
Is de P-waarde van de voorspelbare variabele
kleiner dan 0,05, dan mag je deze afwijzen, en is er
een significant verschil.
anova(naam l ineaire regressie)
F-test voor een simpele lineaire regressie
Bijv. anova(simple)
1. RStudio downloaden en bestanden invoeren
1.1 Structuur veranderen van de lay-out
Klik bovenaan op “View” → “Panes” → onderaan: “Pane lay-out”, zoals hieronder → “Apply”
Source Console
Environment Files
1.2 Data-set & R-script importeren
Dataset: Ga onderaan links naar Environment → Import dataset → from excel OF from text (base)
In dit geval gaat het over estrio en het geboortegewicht (2 variabelen). Deze moeten allebei op “numeric”
gezet worden.
Stel dat je ook de oogkleur van de moeder weet, dan wordt dit een “character”.
Indien je in de “Data Frame” (wanneer je de dataset importeert) ziet dat je een “X.” krijgt
- Links: Quote → Double quote vervangen door single quote
R-script: Klik bovenaan op File → open file
2. Beschrijvende statistiek & eenvoudige lineaire regressie
2.1 Beschrijvende statistiek
In dit voorbeeld gaat het over de dataset “greene”, waarbij estriol en het geboortegewicht (birthweight) de 2
variabelen zijn.
Namen variabelen te weten komen names(dataset)
Bijv. names(greene)
Alle waarden van een bepaalde variabele weten dataset$variabele
Bijv. greene$estriol
Attach data attach(dataset)
Bijv. attach(greene)
,2.1.1 Eenvoudig beschrijvende statistiek
mean(variabele)
Gemiddelde
Bijv. mean(estriol)
sd(variabele)
Standaarddeviatie
Bijv. sd(estriol)
median(variabele)
Mediaan
Bijv. median(estriol)
quantile(variable, hoeveelste kwantiel)
Bijv. quantile(estriol, 0,75)
Kwantiel
Specifieke waarde waarvan je weet dat 75% van
alle estriolwaarden kleiner is dan die specifieke
waarden.
boxplot(variabele)
Bijv. boxplot(estriol)
Boxplot
Boxplot wordt rechts onderaan zichtbaar bij
“Plots”.
hist(variabele, aantal onderbrekingen)
Histogram
Bijv. hist(estriol, breaks = 4)
table(variabele)
Tabellen (frequentietabel)
Bijv. table(estriol)
pie(table(variabele))
Taartdiagram van de frequentietabel
Bijv. pie(table(estriol))
require(graphics)
Scatterdiagram/plot
plot(variable1, variabele2)
Bijv. plot(estriol, birthweight)
, 2.2 Lineaire regressie
Beïnvloed variable 1, variable 2 op een significante mannier?
In dit voorbeeld: Beïnvloed het estriol gehalte het geboortegewicht op een significante manier?
Coëfficiënten intercept en RC
lm(respons variable ~ voorspelbare variable)
! Variabelen worden hier in een andere volgorde Bijv. lm(birthweight ~ estriol)
gegeven dan bij een scatterdiagram !
simple<-lm(respons variable ~ voorspelbare
Naam geven aan de lineaire regressie. variable)
In dit geval noemen we het “simple”. Bijv. simple<-lm(birthweight ~ estriol)
Door een naam te geven aan deze lineaire Als je daarna enkel “simple” ingeeft, krijg je
regressie, kan je later werken met gewoon de naam dezelfde resultaten te zien dan bij het commando
en moet je niet altijd lange commando’s ingeven. hierboven (coëfficiënten intercept en RC)
Fitten van een regressie lijn
abline(naam lineaire regressie, kleur =”kies kleur”)
Hierbij moet je wel eerst een scatterdiagram
Bijv: abline(simple, col=”red”)
plotten, anders krijg je geen regressie lijn te zien.
summary(naam lineaire regressie)
Bijv. summary(simple)
Regressie vergelijking
Is de P-waarde van de voorspelbare variabele
kleiner dan 0,05, dan mag je deze afwijzen, en is er
een significant verschil.
anova(naam l ineaire regressie)
F-test voor een simpele lineaire regressie
Bijv. anova(simple)