WERKEN MET R-STUDIO
ENKELE BEGRIPPEN EN BASISREGELS IN R
Dir zijn begrippen die gebruik worden in taalgebruik wanneer je met R aan het werken bent.
term betekenis
Calling the function als we een functie gebruiken om iets te doen
Argument values die we in de functie invullen
Floating point arithmetic Een fundamenteel probleem, waarbij een compter een nummer altijd wil
afronden tot een ficed number of significante digits (Voorbeeld: 0.1 =
.00011001100110011…)
Een oplossing hiervoor is all.equal()
Recycle rule het recycleren van waarde in een kortere vector dan de andere vector waar
een rekensom mee wordt gedaan.
R geeft altijd een waarschuwingsbericht
Dropping verwijderen van bepaalde dimensies of het weghalen van
elementen/kolommen/rijen uit een object, zoals een matrix, array,
dataframe, of list.
Flow control R bepaalde commands laten herhalen of overslaan
Pas op! R is gevoelig voor grammatica, spacing en hoofdletters.
AGRUMENTS
Waneer je je aan de juiste volgorde houd kun je in bepaalde functies de argument-namen weglaten. Wanneer
je ze dus wel gebruikt kun je de volgorde aanpassen. Als je maar een argument-naam geeft gevolgd door ene
volgend argument, neemt R het eerstvolgende argument zonder naam.
Argumenten kunnen een default hebben, waardoor het niet altijd nodig is ene argument te gebruiken.
NAMEN GEVEN AAN VARIABELE IN R
- je kan wel of geen hoofdletter gebruiken of cijfers gebruiken, een . of _
- je kan spaces gebruiken
- ze zijn case sensitive bv. Sales en sales is niet hetzelfde
- het moet starten met een letter of een period
- het kan geen reserved keyword zijn
INFORMELE REGELS
- gebruik geen variabele die met een period beginnen
- gebruik informatieve variabele namen
- gebruike korte variabele namen
- gebruik een van de conventional naming styles of multi-word variabele names: 3 manieren
• gebruik een periods “.” Om woorden te onderscheiden
• gebruik een underscores “_” Om woorden te onderscheiden
• gebruik een hoofdletter Om woorden te onderscheiden
statistiek 3: werken met R-studio 1
,SPECIALE VALUES
gebruik betekenis
inf Infinity, oneidnig grote value inde e positieve richting
-inf - infinity, oneindig grote value in de negatieve richting
Not a number, er is geen wiskundig gedefinieerd getal hiervoor, komt
NaN overeen met gevallen waarin je een juiste numerieke vraag stelde die
eigenlijk geen zinvol antwoord heeft.
Na Not available, de value die hier opgeslagen zou moeten zijn is missing
NULL No value, de variabele heeft geen value
CONDITIONAL STATMENTS
Conditional statment worden gebruikt bij loops.
Een conditional statment kan switchen tussen verschillende mogelijke commands afhankelijk van een
condition die is gespecifiërt. Dit zorgt dat het programma zelf beslissingen kan maken afhankelijk van de
context.
Als een condition TRUE is zal R de commando verder zetten, als het FALSE is zal R dit niet doen.
HULPFUNCTIE
R heeft een ingebouwde hulpfunctie.
teken gebruik
help() help(functie)
? ?functie
Daarnaast kan je ook beginnen met de functie te typen, R toont automatisch overeenkomende functies en een
korte beschrijving. Hier kan je F1 gebruiken om het helpscherm te opnenen.
Andere bronnen:
- De code runnen
- Rseek website
- chatGPT
DATA INLEZEN IN R
Om een excel, spss… document op te laden in R gebruik je read.csv(). Je kopiëert de link van de opslagplaast
van het document in finder of maps en plakt het tussen de aanhalingstekens.
Voor mac: finder openen, ga naar het bestand dat je wil openen, onderaan staat de route. Je klinkt (met 2
vingers) op het document dat je wil gebruken. Klik op de optie ‘kopieer ‘…’ als padnaam. Deze plak je tussen de
aanhalingstekens.
Basisopstelling: NaamData <- read.csv(“locatie”)
- locatie: padnaam waar het document is opgeslagen op de pc
- sep: het teken waarmee je de data wil opsplitsen
pas op! het kan zijn dat je de aanhalingstekens moeten vervangen in R, als het niet werkt
BASIS TEKENS
statistiek 3: werken met R-studio 2
,Dit zijn basistekens die op verschillende momenten en in functies gebruikt kunnen worden.
Wat doet het? teken basisopstelling
Comment, R negeert alles wat achter de # komt # #tekst
Bepaald bereik voorstellen : van : tot
Als je een dataframe gebruikt $ DataFrame$Kolom
R behandelt alles tussen “” als tekst “” “tekst”
vierkante haken (zie verder) [] Variabele[waarde]
Ronde haakjes () Functie()
Piping |> GetalOfVariabele |> functie(argumenten)
Gebruikt om een lus vroegtijdig te beëindigen break break
VIERKANTE HAAKJES []
Vierkante haakjes [] zijn een essentieel hulpmiddel om elementen uit objecten te selecteren, filteren of
wijzigen.
gebruik betekenis
x[i] i-de element uit een vector
x[i, j] Element in rij i, kolom j
x[i, ] Rij i (alle kolommen)
x[, j] Kolom j (alle rijen)
list[[i]] Element inhoud van lijst
list[i] Sublijst met element i
RONDE HAAKJES ()
ronde haakjes () hebben meerdere belangrijke functies, afhankelijk van de context.
1. Functie aanroepen: Hier geven de ronde haakjes aan dat de functie wordt uitgevoerd, en tussen de
haakjes geef je de argumenten door.
2. Groeperen van expressies/volgorde van berekeningen: jenkan ze gebruiken om de volgorde van
berekeningen te bepalen (zoals in wiskunde)
3. Opeenvolgende uitvoeren van opdrachten met (): Als je meerdere opdrachten in één regel wilt
uitvoeren, en meteen het resultaat van de laatste opdracht wilt teruggeven
VERWARRING VERMIJDEN MET HAAKJES
Hier ene overzicht wanneer de verschillende soorten haakjes gebruikt worden.
gebruik betekenis
() Functieaanroep, groepering
[] Indexeren van objecten
[[]] Element uit een lijst pakken
{} Blokken code, bv. in if, for
PIPING
= het achter elkaar koppelen van bewerkingen, zodat code leesbaarder en logischer wordt opgebouwd — alsof je
data “door een pijplijn” stuurt.
Basisregels van piping
1. Links staat de input (bv. een vector of dataframe)
2. Rechts staat de functie, zonder de eerste argumentnaam
statistiek 3: werken met R-studio 3
, 3. Extra argumenten komen zoals gewoonlijk na de pipe
BASIS BEREKENINGEN
R is geschikt om basis berekeningen te maken
Wat doet het? teken basisopstelling
Optellen + Getal1 + getal2
Aftrekken - Getal1 – getal2
Vermenigvuldigen * Getal1 * getal2
Delen / Getal1 / getal2
Macht ^ Getal^macht
Macht ** Getal**macht
R werkt volgens het ‘BEDMAS’-principe: Brackets (), Exponents ^, division / en multiplication *, addition +,
substraction –. En werkt van links naar rechts.
VARIABELE
Een variabele is een naam die je toekent aan een waarde of een object, zoals een getal, vector, dataframe,
functie, enzovoort. Je gebruikt een variabele om data op te slaan zodat je die later kunt hergebruiken
Wat doet het? teken basisopstelling
Variabele maken <- VariableNaam <- informatie
-> informatie -> VariableNaam
= VariableNaam = informatie
Variabele opvragen VariabeleNaam
een vector is het meest fundamentele datatype. Een vector is een reeks van elementen van hetzelfde type
(bijv. allemaal getallen, allemaal tekst, enz.). het is een variabele die meerdere waarde bevat.
Wat doet het? teken basisopstelling
Combine functie c() c(VariabeleOfVectorOfNummer1,
VariabeleOfVectorOfNummer2, … ,
VariabeleOfVectorOfNummerN)
vector maken <- c() VectorNaam <- c(informatie)
c() -> C(informatie) -> VectorNaam
= c() VectorNaam = c(informatie)
Variabele opvragen VectorNaam
1 Informatie element opvragen uit een [] NaamVector[OpTeVragenElement]
vector
Meerdere Informatie elementen [] NaamVector[OpTeVragenElement1,
opvragen uit een vector OpTeVragenElement2, …, OpTeVragenElementN]
Element in een vector aanpassen [] <- VariableNaam[element] <- aanpassing
Shortcut bij gebruiken van een vector : NaamVector[c(van:tot)]
Van element x tot element y -> x:y
Character string = tekst data, waarbij “woord” wordt gebruikt om aan te tonen dat de data tekst is bv.
variabeleNaam <- “woord”
Character vector = een variabele met meerdere tekst data bv. variabeleNaam <- C(“Woord1”, “Woord2”, …,
“WoordN”)
statistiek 3: werken met R-studio 4