100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten
logo-home
Samenvatting/ document voor tijdens examen Statistiek 2 handelswetenschappen €8,93
In winkelwagen

Samenvatting

Samenvatting/ document voor tijdens examen Statistiek 2 handelswetenschappen

 0 keer verkocht

Met deze samenvatting heb je alle technieken (gedetailleerd uitgewerkt) die je nodig hebt voor het examen statistiek 2. Alle info uit de lessen en lesopnames staat in dit document.

Voorbeeld 3 van de 15  pagina's

  • 26 februari 2025
  • 15
  • 2024/2025
  • Samenvatting
Alle documenten voor dit vak (3)
avatar-seller
jansanders340
Examen statistiek
1 Handige dingen in R:
Diagnostische test = een test waarbij je de nulhypothese wil aanvaarden.

Een kolom printen zodat de getallen onder elkaar staan (makkelijk om data in online software te
plakken): cat(paste(dataset, collapse = "\n"))

Bij het inlezen van een csv bestand: argument stringsAsFactors = T toevoegen

Deel van een tabel plaatsen in een nieuwe tabel:

Naam nieuwe tabel = naam oude tabel $ kolomnaam[naam oude tabel $ kolomnaam van voorwaarde ==
“voorwaarde”]

Multicollineariteit: er is samenhang tussen de verklarende factoren van een regressiemodel

 Als de vif() functie hoog is dan is dit het geval

2 Hypothesis testing
2.1 One sample t-Test
• Gebruik: gemiddelde van een enkelvoudige steekproef testen.
• Formule: t.test()
• 3 scenario’s voor argument alternative:
o Tweezijdige toets: “two-sided” (testen of gemiddelde gelijk is aan x)
▪ Lage p-waarde: niet gelijk aan elkaar
▪ Hoge p-waarde: gelijk aan elkaar
o Rechtszijdige toets: “greater” (testen of gemiddelde groter is dan x)
▪ Lage p-waarde: gemiddelde is groter dan x
▪ Hoge p-waarde: gemiddelde is kleiner dan x
o Linkszijdige toets: “less” (testen of gemiddelde kleiner is dan x)
▪ Lage p-waarde: gemiddelde is kleiner dan x
▪ Hoge p-waarde: gemiddelde is groter dan x
• Andere gebruiksmanier: als nulhypothese binnen betrouwbaarheidsinterval ligt = nulhypothese
aanvaarden
• Assumpties:
o Data is normaal verdeeld
o Geen extreme waarden
• Je mag deze test enkel gebruiken wanneer de steekproef random is, en wanneer de centrale
limietstelling van toepassing is.

,2.2 Paired two sample t-Test
• Gebruik: nagaan of gemiddeldes van gepaarde data aan elkaar gelijk zijn of verschillen van
elkaar.
o Gepaarde data = je vergelijkt gegevens van dezelfde groep of eenheid, maar op een
verschillend moment
vb. hartslag van mensen voor het lopen en na het lopen
vb. temperatuur van een huis in de zomer en in de winter
o Ongepaarde data = je vergelijkt gegevens van verschillende groepen of eenheden
vb. hartslag van mannen en hartslag van vrouwen
vb. resultaat van mensen die placebo nemen, en van mensen die geen placebo nemen
• Formule: t.test()
• Argument paired = T aanzetten (zelf doen, staat automatisch op F)
• Interpretatie:
o Lage p-waarde: gemiddeldes verschillen van elkaar
▪ Positief verschil: x is groter dan y
▪ Negatief verschil: y is groter dan x
o Hoge p-waarde: gemiddeldes zijn gelijk aan elkaar
• Alternatieven op deze test:
o Verschil nemen en one sample t-Test doen
o Wilcoxon test met argument paired = T

2.3 Wilcoxon Signed-Rank test (gepaarde gegevens)
• Gebruik: testen of pseudomedianen van gepaarde gegevens aan elkaar gelijk zijn.
o Gebruiken bij extreme waarden.
o Gebruiken wanneer aan assumpties t-test niet voldaan is
• Formule: Wilcox.test()
• Argument paired = T aanzetten (zelf doen, staat automatisch op F)
• Interpretatie:
o Lage p-waarde: pseudomedianen verschillen van elkaar
o Hoge p-waarde: pseudomedianen zijn gelijk aan elkaar

2.4 Unpaired two sample t-Test
• Gebruik: nagaan of gemiddeldes van ongepaarde data aan elkaar gelijk zijn of verschillen van
elkaar (getallen van elkaar aftrekken en dan one sample t-Test doen gaat hier niet)
• Formule: t.test()
• Argument var.equal = T aanzetten (zelf doen, staat automatisch op F)
• Interpretatie:
o Lage p-waarde: gemiddeldes verschillen van elkaar
▪ Positief verschil: x is groter dan y
▪ Negatief verschil: y is groter dan x
o Hoge p-waarde: gemiddeldes zijn gelijk aan elkaar
• Assumptie (moet gecontroleerd worden om deze test te mogen gebruiken):
o Varianties zijn gelijk aan elkaar (testen met F test of levene’s test, formule: var.test())
▪ Lage p-waarde: varianties verschillen van elkaar
• Overschakelen naar de Welch test in dit geval
▪ Hoge p-waarde: varianties zijn gelijk aan elkaar (verhouding varianties = 1)

, 2.5 Mann-Whitney U test (Wilcoxon test)
• Gebruik: nagaan of gemiddeldes van ongepaarde data aan elkaar gelijk zijn of verschillen van
elkaar. (alternatief op unpaired two sample t-Test, meestal is deze beter)
• Formule: wilcox.test()
• Assumptie eerst controleren voor gebruik:
o Kolmogrov test: ks.test()
▪ P-waarde moet groot zijn om deze test te mogen gebruiken
• Interpretatie:
o Lage p-waarde: gemiddeldes verschillen van elkaar
o Hoge p-waarde: gemiddeldes zijn gelijk aan elkaar
• Vb. variabele x = diabetes (ja of nee), y = glucosegehalte
➔ lage p-waarde zou betekenen dat mensen met diabetes een ander glucosegehalte hebben
dan mensen zonder diabetes

2.6 Unpaired two sample welch test
• Gebruik: testen of gemiddeldes van ongepaarde data aan elkaar gelijk zijn of niet.
o Verschil is dat er bij deze test geen assumptie gemaakt wordt over de varianties, je moet
dus ook geen argumenten in de formule aanpassen (deze test is eigenlijk beter)
• Formule: t.test()
o Lage p-waarde: gemiddeldes verschillen van elkaar  hoge p-waarde: gelijk

2.7 D’Agostino Skewness Test
• Gebruik: testen of gegevens symmetrisch verdeeld zijn
• Formule: agostino.test() ➔ eerst library(moments) downloaden
• Interpretatie:
o Lage p-waarde: gegevens zijn niet symmetrisch verdeeld
o Hoge p-waarde: gegevens zijn symmetrisch verdeeld
▪ Dit in combinatie met hoge p-waarde bij kurtosis test betekent dat data normaal
verdeeld is

2.8 Anscombe-Glynn Kurtosis Test
• Gebruik: testen of gegevens even dikke staarten hebben als normale verdeling
• Formule: anscombe.test() ➔ eerst library(moments) downloaden
• Interpretatie:
o Lage p-waarde: gegevens hebben dikkere of dunnere staarten dan normale verdeling
o Hoge p-waarde: gegevens hebben even dikke staarten als normale verdeling
▪ Dit in combinatie met hoge p-waarde bij skewness test betekent dat data
normaal verdeeld is

2.9 Jarque-Bera Normality test
• Gebruik: testen of gegevens normaal verdeeld zijn
• Formule: jarque.test() ➔ eerst library(moments) downloaden
• Interpretatie:
o Lage p-waarde: gegevens zijn niet normaal verdeeld
o Hoge p-waarde: gegevens zijn normaal verdeeld

Dit zijn jouw voordelen als je samenvattingen koopt bij Stuvia:

Bewezen kwaliteit door reviews

Bewezen kwaliteit door reviews

Studenten hebben al meer dan 850.000 samenvattingen beoordeeld. Zo weet jij zeker dat je de beste keuze maakt!

In een paar klikken geregeld

In een paar klikken geregeld

Geen gedoe — betaal gewoon eenmalig met iDeal, Bancontact of creditcard en je bent klaar. Geen abonnement nodig.

Focus op de essentie

Focus op de essentie

Studenten maken samenvattingen voor studenten. Dat betekent: actuele inhoud waar jij écht wat aan hebt. Geen overbodige details!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper jansanders340. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €8,93. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 75463 samenvattingen verkocht

Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Start met verkopen
€8,93
  • (0)
In winkelwagen
Toegevoegd