Resume

Samenvatting Software R Statistiek IV - 3BA Psychologie

Note

Vendu

Pages

144

Publié le

14-01-2026

Écrit en

2024/2025

Deze samenvatting is een perfect document om te oefenen in RStudio en mee te nemen naar het software examen. In deze samenvatting staan uitgeschreven oefeningen per hoofdstuk, met bijhorende syntax, antwoorden en uitleg. Op het einde van het document vind je ook een korte samenvatting die kan helpen structuur te brengen in het maken van oefeningen en te onderscheiden welke techniek je wanneer toepast. Dit document is gebaseerd op de vragenbundel, de gegeven syntax, mijn berekende syntax, syntax gegeven door ChatGPT en de WPO slides. Ik behaalde hiermee een 16/20. DISCLAIMER: dit document bevat geen informatie over het theoriegedeelte van het examen, enkel over het softwaregedeelte.

Montrer plus Lire moins

Établissement

Cours

Oups ! Impossible de charger votre document. Réessayez ou contactez le support.

Signaler une violation de copyright

École, étude et sujet

Établissement: Vrije Universiteit Brussel (VUB)
Cours: Psychologie
Cours: Statistiek IV: multivariate data analyse (ONDRZOEK1009171BNR)

Tous les documents sur ce sujet (31)

Infos sur le Document

Publié le: 14 janvier 2026
Nombre de pages: 144
Écrit en: 2024/2025
Type: Resume

Sujets

Aperçu du contenu

RStudio
Statistiek IV
Inhoud
Libraries……………………………………………………………………………………………………………………………………………………………………………………………………
………………p2
Errors……………………………………………………………………………………………………………………………………………………………………………………………………………
………………p2
Verkenning
data……………………………………………………………………………………………………………………………………………………………………………………………p3-15
Meervoudige
regressie…………………………………………………………………………………………………………………………………………………………………………p16-38
Logistische
regressie…………………………………………………………………………………………………………………………………………………………………………p39-56
ANOVA………………………………………………………………………………………………………………………………………………………………………………………………………………
……p57-67
Factoriële
ANOVA………………………………………………………………………………………………………………………………………………………………………………………p68-79
Repeated measures & mixed design
ANOVA……………………………………………………………………………………………………………………………p80-95
Factoranalyse - Principale Componenten Analyse (PCA)
……………………………………………………………………………………p96-111
Clusteranalyse………………………………………………………………………………………………………………………………………………………………………………………
p112-123
SAMENVATTING……………………………………………………………………………………………………………………………………………………………………………………………
p124-136

Legende
Paars = oefening uit oefeningenbundel
Zwart = uitleg en notities
Groen = uitleg en notities van RStudio / antwoorden
Kaders = syntax van RStudio
Oranje = vervangbare syntax
Gele fluo = gebruikte cijfers uit syntax

1

,Libraries
install.packages("data.table") install.packages("naniar")
library(data.table) library(naniar)
install.packages("ggplot2") install.packages("effects")
library(ggplot2) library(effects)
install.packages("dplyr") install.packages("multcomp")
library(dplyr) library(multcomp)
install.packages("tidyr") install.packages("lsr")
library(tidyr) library(lsr)
install.packages("magrittr") install.packages("corpcor")
library(magrittr) library(corpcor)
install.packages("tidyverse") install.packages("GPArotation")
library(tidyverse) library(GPArotation)
install.packages("MASS") install.packages("foreign")
library(MASS) library(foreign)
install.packages("psych") install.packages("cluster")
library(psych) library(cluster)
install.packages("car") install.packages("plotly")
library(car) library(plotly)
install.packages("lmtest") install.packages(“emmeans”)
library(lmtest) library(emmeans)
install.packages("GLDEX") install.packages(“ez”)
library(GLDEX) library(ez)
install.packages("corrplot") install.packages(“nlme”)
library(corrplot) library(nlme)
install.packages("nnet") install.packages(“codingMatrices”)
library(nnet) library(codingMatrices)
install.packages("misty") install.packages(“interactions”)
library(misty) library(interactions)

Errors
 could not find function "summarise" = Package “dplyr” nog eens
installen
 could not find function "mutate" = Package “dplyr” nog eens
installen
 could not find function "recode" = Package “dplyr” nog eens
installen
 could not find function “arrange” = Package “dplyr” nog eens installen
 could not find function "%>%" = Package “magrittr” nog eens
installen
 could not find function "fread" = Package “data.table” nog eens
installen
 could not find function "stepAIC" = De package “MASS” nog eens installen
 could not find function "crPlots" = De package “car” nog eens installen
 could not find function "bptest" = Package “lmtest” nog eens
installen
 could not find function "miss_var_summary" = Package “naniar” nog eens installen
 could not find function "leveneTest" = Package “car” nog eens
installen

2

, could not find function "etaSquared" = Package “lsr” nog eens
installen
 could not find function "ezANOVA" = Package “ez” nog eens installen
 could not find function "cortest.bartlett" = Package “psych” nog eens installen
 could not find function "corPlot" = Package “psych” nog eens installen
 could not find function "principal” = Package “psych” nog eens
installen

Verkenning data
VOORBEREIDING

1. OEFENING 1: Zoek op hoe je een CSV bestand inleest en importeer het bestand. Let goed op het
scheidingsteken van de gegevens.
A. Lees de data in.

 Volgende stap is de data inlezen
 Voor volgende code moet het CSV bestand in de downloads staan van de computer
#Oefening 1
#A Data inlezen
setwd("/Users/hannahmarie/Downloads/")
df <- fread("WPO1.csv", header = TRUE, sep = ",")

B. Controleer steeds ook je data type: zijn numerieke variabelen ook ingelezen als getallen en niet als
string/character?

 Volgende stap is checken of de variabelen met characters (chr) of met numbers (num) werken
 Als er woorden staan bij de observaties dan moet er “chr” bijstaan
 Als er cijfers staan bij de observaties dan moet er “num” bijstaan
#pop_2023 en gdp_pcap_2023 lijken nog niet numeriek te zijn
#inkomensgroepen zijn text, zou ordinaal kunnen zijn

 Indien dit ergens niet het geval is dan moet dit aangepast worden
 Als iets ordinaal is en het als nominaal staat in de observaties, dan kunnen we dit als ordinaal forceren
 Door de variabele om te zetten naar een factor
#B chr variabelen naar factor, behalve country, pop_2023, gdp_pcap_2023
df$main_religion_2008 <- as.factor(df$main_religion_2008)
df <- df %>%
mutate_if(is.character, as.factor) %>%
mutate(country = as.character(country),
pop_2023 = as.character(pop_2023),
gdp_pcap_2023 = as.character(gdp_pcap_2023))

 Mogelijk alternatief dat geen “dplyr” gebruikt
#alternatief zonder dplyr
df <- as.data.frame(lapply(df, function(x) if(is.character(x)) as.factor(x) else
x))
df$country <- as.character(df$country)
df$pop_2023 <- as.character(df$pop_2023)
df$gdp_pcap_2023 <- as.character(df$gdp_pcap_2023)
?lapply

2. Zet de bevolkingsgrootte (pop_2023) om naar een numerieke variabele (M = miljoen, k = duizend).

3

, A. Transformeer de variabele zoals hierboven beschreven. (Internet is je vriend hier.)

 Wat je hier eerst wil doen is: de getallen en de getallen met letters (M & k) opsplitsen
#Oefening 2: populatie
#Laatste teken is letter
df$pop_letter <- substr(df$pop_2023, nchar(df$pop_2023), nchar(df$pop_2023))
df$pop_value <- as.numeric(substr(df$pop_2023, 1, nchar(df$pop_2023)-1))

 Of op een ‘gevorderde’ manier:
#met regular expression - gevorderd
df$pop_value <- as.numeric(gsub("[^0-9.]", "", df$pop_2023))
df$pop_letter <- gsub("[0-9.]", "", df$pop_2023)

 Je kan zien hoe deze zijn opgesplitst door alle variabelen weer te geven in je transcript
 Voeg volgende code toe & run
str(df)

 Nu de letters gesplist zijn van de getallen, moeten deze letters omgezet worden naar getallen
 Als je hiervoor eerst wil opzoeken welke letters er allemaal zijn, geef je volgende code in
unique(df$pop_letter)

 Geef volgende code in & run
 Hierbij zal een nieuwe variabele gevormd worden
#transformeer naar numerische variabele: k = *1000, M = *1000000 and B = *1000000000
df$pop_numeric <- ifelse(df$pop_letter == "k", df$pop_value * 1000,
ifelse(df$pop_letter == "M", df$pop_value * 1000000,
ifelse(df$pop_letter == "B", df$pop_value * 1000000000,
NA)))

B. Geef de totale bevolking weer per continent (world_4region)

 Geef volgende code in & run
 De ‘summarise’ zal een klein overzicht geven van de totale bevolking per continent
+ Vragen voor een overzicht van populatie in miljoenen (totaal delen door 1 miljoen)
#totale bevolking per continent
df %>%
group_by(world_4region) %>%
summarise(total_pop = sum(pop_numeric, na.rm = TRUE), total_pop_million = sum(pop_numeric, na.rm =
TRUE)/1000000)

 Alternatieven (assistent vindt deze minder mooi)
#alternatief tapply
tapply(df$pop_numeric, df$world_4region, sum, na.rm = TRUE)

#alternatief aggregate
aggregate(df$pop_numeric, by = list(df$world_4region), FUN = sum, na.rm = TRUE)

 Antwoord van RStudio:
world_4region total_pop total_pop_million
<fct> <dbl> <dbl>
1 africa 1471740000 1472.
2 americas 1034836000 1035.
3 asia 4673512000 4674.
4 europe 848500000 848.

C. Welke godsdienst heeft de meeste aanhangers? Bereken dit via de totale populatie per godsdienst en
plot dit in een gepaste grafiek.

 Als je de eerste code hier runt, dan zie je dat er een lege categorie is
 Deze zet je daarna als NA = n.v.t. (je kan die ook een andere naam geven zoals “other”)

4

€15,99

Accéder à l'intégralité du document:

Garantie de satisfaction à 100%

Disponible immédiatement après paiement

En ligne et en PDF

Tu n'es attaché à rien

Faites connaissance avec le vendeur

hannahjasperse

Faites connaissance avec le vendeur

hannahjasperse Vrije Universiteit Brussel

Voir profil

Vendu

Nouveau sur Stuvia

Membre depuis

12 heures

Nombre de followers

Documents

Dernière vente

0,0

0 revues

Récemment consulté par vous

Pourquoi les étudiants choisissent Stuvia

Créé par d'autres étudiants, vérifié par les avis

Une qualité sur laquelle compter : rédigé par des étudiants qui ont réussi et évalué par d'autres qui ont utilisé ce document.

Le document ne convient pas ? Choisis un autre document

Aucun souci ! Tu peux sélectionner directement un autre document qui correspond mieux à ce que tu cherches.

Paye comme tu veux, apprends aussitôt

Aucun abonnement, aucun engagement. Paye selon tes habitudes par carte de crédit et télécharge ton document PDF instantanément.

“Acheté, téléchargé et réussi. C'est aussi simple que ça.”

Alisha Student

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur hannahjasperse. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €15,99. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis) 46458 résumés ont été vendus ces 30 derniers jours Fondée en 2010, la référence pour acheter des résumés depuis déjà 16 ans

Samenvatting Software R Statistiek IV - 3BA Psychologie

École, étude et sujet

Infos sur le Document

Sujets

Aperçu du contenu

Plus de cours sur Vrije Universiteit Brussel (VUB) > Psychologie

Faites connaissance avec le vendeur

Récemment consulté par vous

Pourquoi les étudiants choisissent Stuvia

Créé par d'autres étudiants, vérifié par les avis

Le document ne convient pas ? Choisis un autre document

Paye comme tu veux, apprends aussitôt

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Garantie de remboursement : comment ça marche ?

Auprès de qui est-ce que j'achète ce résumé ?

Est-ce que j'aurai un abonnement?

Peut-on faire confiance à Stuvia ?