Instellingen nieuw file
Functie Code
Clear everything remove(list=ls())
cat("\f")
Install and load all packages #install.packages("ggplot2", dependencies =
- Eerste keer package installeren: “#” TRUE)
weghalen voor eerste regel library(ggplot2)
- Daarna alleen package laden
#install.packages("stargazer", dependencies =
TRUE)
library(stargazer)
#install.packages("psych", dependencies =
TRUE)
library(psych)
#install.packages("gmodels", dependencies =
TRUE)
library(gmodels)
#install.packages("RColorBrewer",
dependencies = TRUE)
library(RColorBrewer)
#install.packages("Hmisc", dependencies =
TRUE)
library(Hmisc)
#install.packages("corrgram", dependencies =
TRUE)
library(corrgram)
#install.packages("corrplot", dependencies =
TRUE)
library(corrplot)
#install.packages("ppcor", dependencies =
TRUE)
library(ppcor)
#install.packages("readxl", dependencies =
TRUE)
library(readxl)
#install.packages("plyr", dependencies = TRUE)
library(plyr)
#install.packages("car", dependencies = TRUE)
library(car)
, #install.packages("reshape2", dependencies =
TRUE)
library(reshape2)
Set working directories dir <- "~/Erasmus/Onderzoekstraining
- pas path aan naar mappen op je eigen pc II/Tutorials/"
dirData <- paste0 (dir, "Data/")
dirProg <- paste0 (dir, "Programs/")
dirRslt <- paste0 (dir, "Results/")
Read data dsdrugstores <- read.csv (file = paste0(dirData,
- Bij foutmelding read.csv2 "Drugstores.csv"), stringsAsFactors = FALSE)
Voorbereiding
Functie Code
factor aanmaken dsLiving$fLiving <- factor (dsLiving$cLiving,
- voor categorische variabelen levels=c (1:5),
labels=c(“naam kolom1”, “etc.” ))
levels (dsLiving$Living)
Eerste 6 observaties head(naam dataset)
Laatste 6 observaties tail(naam dataset)
Los doc met alle waarden View(naam dataset)
Aantal dimensies dim(naam dataset)
Aantal rijen nrow(naam dataset)
Aantal kolommen ncol(naam dataset)
Bepalen aantal volledige observaties in een sum(complete.cases(naam dataset))
dataframe
Bepalen aantal niet-volledige observaties in een sum(!complete.cases(naam dataset))
dataframe
Bepalen van het aantal ontbrekende waarde colSums(is.na(naam dataset))
per kolom
Bepalen van het aantal ontbrekende waarde rowSums(is.na(naam dataset))
per rij
Identificeren van rijen met meer dan 1 which(rowSums(is.na(naam dataset)) > 1)
missende waarde
Structuur van objecten str (dsSchool)
Samenvatting belangrijkste stat. grootheden summary(dsSchool)
Rijen identificeren dsSchool [1, ]
Cellen identificeren dsSchool$Debts[2]
Verwijderen van missing values dsSub <- dsSub[complete.cases(dsSub), ]
Verwijderen van uitbijters dsSub <- dsSub [dsSub$pCool <= 35, ]
Cellen verwijderen d.m.v. temporary dataframe dsLiving.tmp <- dsLiving[!(dsLiving$cLiving == 5),
~ geen waardes kleiner dan 5 c(“cLiving”, “dFraternity”)]
Rijen/kolommen verwijderen/weglaten dsLiving.tmp <- [dsLiving.tmp$Location != 3, ]fis
Samenvoegen van rijen dsLiving.tmp <- dsLiving[c(“cLiving”,
~ rij 5 wordt rij 4 “dFraternity”)]
dsLiving.tmp$cLiving[dsLiving.tmp$cLiving == 5]
<- 4