4.2.1 mean (x): gemiddelde van een vector
4.2.2 median (x): de mediaan van een vector
4.2.3 var(x): de variantie van een vector metingen x
sd(x): standaarddeviatie voor een vector metingen x
4.2.7 quantile(x,0.25): levert eerste kwartiel van een vector x
4.3.1 pnorm(x,mu,sd): kans dat een Normaal verdeelde meting kleiner of gelijk is aan een
gegeven getal x. mu = het gemiddelde, sd = standaarddeviatie
Verkort: pnorm(x): de standaardnormale verdeling
1-pnorm(x,mu,sd): kans dat een willekeurige variabele uit een normale verdeling groter is
dan x.
qnorm(p): kans op een waarde kleiner dan of gelijk aan dat kwantiel p bv. qnorm(0.05 of
0.95) voor respectievelijk het 5% of 95% percentiel van de standaardnormale verdeling μ=0,
σ=1.
Voor het berekenen van het betrouwbaarheidsinterval voor een symmetrisch tweezijdig
interval. Alpha/2 = de kans in elk van de staarten
qnorm(alpha); qnorm(alpha/2,mu,sd): linkergrens en qnorm(1-alpha/2,mu,sd): rechtergrens
4.3.2 rnor
m(n) of rnorm(n,mean,sd): lukrake standaardnormale metingen
data.frame(x): in dataset opslaan van metingen
sample(x): aangeven dat de steekproef overeenstemt met de kolom x in deze dataset
geom_qq(): voor QQ-plot, geom_qq_line(): trekt best passende rechte door de punten
> x <- rnorm(1000)
> ggplot(data.frame(x), aes(sample=x)) + geom_qq() + geom_qq_line()
X <- exp(rnorm(n)): n gegevens uit een lognormale verdeling
X <- rt(n,df=3)
4.4.2 method=’ lm’: geeft aan dat we een lineaire regressie wensen uit te voeren
geom_point(): voeg punten toe
rho <- 0.5: correlatie
mvrnorm: Deze functie genereert willekeurige steekproeven uit een multivariabele normale
verdeling. bv. > x = data.frame(mvrnorm(n, mu=mu, Sigma=Sigma))
> cor(prothrombin$TIJD): correlatiecoëfficiënt tussen variabelen
Een correlatie van 1 geeft aan dat er een perfecte positieve lineaire relatie is tussen de twee variabelen. Met
andere woorden, als de ene variabele stijgt, zal de andere ook stijgen.
Een correlatie van -1 geeft aan dat er een perfecte negatieve lineaire relatie is tussen de twee variabelen. Als
de ene variabele stijgt, zal de andere dalen.
Een correlatie van 0 geeft aan dat er geen lineaire relatie is tussen de twee variabelen.
4.4.3 tabel maken:
> data <- matrix(c(.,.)ncol=3,byrow=TRUE) : matrix opstellen met aantal kolommen
Rownames(data) <- c(“.”,”.”) : namen geven aan rijen en kolommen
Colnames(data) <- c(“.”,”.”)
Table <- as.tabel(data) : vat de matrix nu op als een tabel
> Table : toon de table
5.2 > sample (1:100,5): lukraak 5 getallen kiezen tussen 1 en 100
5.3.2 > plot1 <- ggplot(mtcars, aes(mpg, disp)) + geom_point() (ter illustratie)
grid.arrange(p1,p2,p3,p4,nrow=2,ncol=2); algemeen eerst lijst met grafische objecten en dan
de parameters die het aantal kolommen en rijen aangeven