100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting inleiding in de Statistiek, boek + formuleblad

Rating
-
Sold
-
Pages
39
Uploaded on
07-02-2025
Written in
2024/2025

Dit document bevat een samenvatting over het boek en een gemaakt formuleblad wat je bij je tentame erbij kan houden. Per formule staat ook een voorbeeld erbij!

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Connected book

Written for

Institution
Study
Course

Document information

Summarized whole book?
No
Which chapters are summarized?
1 t/m 18
Uploaded on
February 7, 2025
Number of pages
39
Written in
2024/2025
Type
Summary

Subjects

Content preview

Statistiek samenvatting
Hoofdstuk 1:
Elke dataset bevat informatie over een groep individuen (een steekproef uit de populatie). Deze
informatie is georganiseerd in variabelen
Individuen: experimentele eenheden. Het niveau waarop je de data gaat verzamelen (bv. patiënten) ->
de steekproef uit de populatie
Variabelen: karakteristiek van het individu (bv. leeftijd)


Variabelen:
Categorische variabele (vaak kwalitatief, het is geen getal maar een categorie): kunnen een beperkt
aantal waardes aannemen (bv. geslacht, bloedtype). Hier kan je een % van berekenen.
o Nominaal: gegevens die gebruikt worden om categorieën te benoemen. Geen
natuurlijke volgorde bv. kleur van auto. Je kan hier geen wiskundige bewerking
meedoen zoals optellen, gemiddelde (zit geen ordening is).
o Ordinaal: wel rangorde. bv. opleidingsniveau. Geen gelijke verschillen tussen groepen
hierdoor kan je geen gemiddelde berekenen.
o Ratio: verhouding van twee getallen aan te duiden
Kan worden weergegeven in
 Staafdiagrammen (staven los): vergelijken relatieve belang van verschillende categorieën.
 Cirkeldiagrammen: goede visuele weergave. De relatie van elke categorie tegen het geheel
wil uitdrukken van één variabele.


Kwantitatieve variabelen: uitdrukken in een getal -> je kan een gemiddelde berekenen, wordt meestal
vast gelegd in een eenheid (bv. leeftijd, lengte, kg).
o Continue: elke waarde tussen twee getallen is mogelijk, waarden tussen een interval
(bv. lengte, gewicht)
o Discreet: kunnen een waarde aannemen (bv. aantal appels, je hebt het wel/niet).
Kan worden weergegeven in
 Steelbladdiagram: blijft dicht bij data.
 Dot plot: blijft dicht bij data, voordeel: toont elke waarde van de dataset.
 Histogram (staven aan elkaar): vat variabele van één variabele samen in een plaatje, je maakt
klassen (cumulatief of relatief). Horizontale as de variabelen, verticaal de aantallen of %.
Vorm:
Top in het midden: symmetrisch
Top aan de rechter kant, staart loopt naar links = links scheef (negatief scheef)
Top aan de linker kant, staart loopt naar recht = rechts scheef (positief scheef)
Twee toppen = binominale verdeling
Outlier = uitbijter/uitschieter -> probeert te corrigeren; indien niet mogelijk dan kijken wat voor
informatie het je geeft.

,Hoofdstuk 2:
Numerieke maten zijn spreidings- en centrummaten. Parameter:
beschrijft hele populatie. Statistiek: beschrijft steekproef.


Centrummaten: Kwantitatief: - Mediaan (M) zet waarnemingen op
volgorde van klein naar groot = is middelste waarneming (bij oneven
dataset). Even dataset: N + 1 : 2. Mediaan = niet gevoelig voor uitbijters. In SPSS 50th percentille
- Gemiddelde, mean (x̄) voor steekproef, μ voor populatie) tel alle individuele waardes bij elkaar op
en dit deel je door het aantal individuen = gevoelig voor uitbijters
Symmetrische verdeling: je kan beide gebruiken. Scheve verdeling: Gebruik mediaan ->
Rechtsscheef: gemiddelde < mediaan
Linksscheef: gemiddelde > mediaan
Categorisch: - Proportie/ percentage


Spreidingsmaten:
- Range kleinste waarneming – grootste waarneming
- Kwartielen: Q1 = 25 %, Q2 = mediaan = 50% Q3= 75 %
Box-plot: maakt gebruik van mediaan en kwartielen
 Uitbijter (geef je weer met een sterretje) meer dan 1,5 x IQR boven het derde kwartiel of onder
het eerste kwartiel ligt (boxplot is ongeveer 1,35 standaarddeviatie breed)
- Vijfcijferige samenvatting van een verdeling (kan uitbijters laten zien)
Minimum, Q1, Mediaan, Q3, maximum
- Standaarddeviatie (s bij steekproef, σ bij populatie): geeft gemiddelde spreiding t.o.v. gemiddelde
in dezelfde maat als de oorspronkelijke data set = wortel van de variantie. Gevoelig voor uitbijters.
 mag alleen worden gebruikt als het gemiddelde wordt gebruikt
 altijd nul of > dan nul
- Variantie (variance) (s2 of σ2) = maat van spreiding van een data set = de gemiddelde
kwadrateerde afstand van iedere waarneming tot het gemiddelde (= in gekwadrateerde termen)


Variantie van de steekproef berekenen
De steekproef heeft gemiddeld genomen minder variatie dan de volledige populatie. Dit komt omdat
de steekproefwaarden dichter bij hun eigen steekproefgemiddelde (x̄ ) liggen. De som van de
gekwadrateerde afwijkingen deel je door het aantal waarnemingen in de steekproef (n) -1
vrijheidsgraden. Als je door n zou delen, zou je de variantie van de populatie onderschatten.


- Symmetrisch, gebruik: gemiddelde en de standaarddeviatie (zijn gevoelig voor uitbijters)
- Scheve verdeling en veel uitschieters, gebruik: box-plot.


De ‘5% trimmed mean’ -> laagste 5% en hoogste 5% van de waarnemingen buiten beschouwing.
Extreme waarden hebben minder invloed. Bij een scheve verdeling betekent dit dat de ‘5% trimmed
mean’ dichter bij het gemiddelde komt.

,Hoofdstuk 3:
In veel studies wordt de relatie tussen variabelen getoetst. Belangrijk: deze relatie kan sterk beïnvloed
worden door andere oorzaken/variabelen.


Bivariaten gegevens verwijst naar data die twee verschillende variabelen omvat (meestal hebben ze
verband met elkaar). Doel van het analyseren van bivariaten gegevens is de relatie tussen deze
variabelen begrijpen en onderzoeken.


 Word weergegeven via een spreidingsdiagram (scatterplot). Het geeft de relatie/correlatie
tussen twee kwantitatieve variabelen weer.
- x-as de voorspellende, verklarende, onafhankelijke variabele -> kan de veranderingen in een
responsvariabele verklaren / beïnvloeden
- y-as de respons, uitkomst, afhankelijke variabele -> meet uitkomst van een
onderzoek/uitkomstmaat
Soms heeft een derde variabele, categorische, invloed heeft op de andere twee kwantitatieve
variabele -> dit geef je aan met een andere kleur aan om zo het effect weer te geven.


Je kan het patroon van een scatterplot beschrijven op basis van richting, vorm en sterkte van het
verband:
1. Kijken naar de vorm: lineair (rechte lijn), curve, clusters, geen patroon.
2. Richting van het verband: positief verband, neemt de ene toe en de andere ook of neemt de
ene af en de andere ook af/ negatief verband: neemt de ene toe en de ander af (of
andersom)/ geen verband.
3. Sterkte van het verband: sterk (punten strak om de lijn), gemiddeld of zwak
4. Bekijk of er uitbijters zijn


Het lineaire verband meet je met: Correlatie (r), meet de richting en sterkte van de lineaire relatie
tussen twee kwantitatieve variabelen. Ligt tussen de -1 & 1.
 Ook wel Pearsons correlation coëfficiënt genoemd -> SPSS standardized coëfficients Beta


- De correlatiecoëfficiënt behandeld x en y symmetrisch, het maakt niet uit welke variabel x of y is
- De correlatiecoëfficiënt veranderd niet als de meeteenheid veranderd (bv. kg naar mg), (correlatie
zelf heeft geen grootheid)
- Positieve r is een positief verband, negatieve r is een negatief verband.
- Hoe dichter in de buurt van 0: zwakker verband. Hoe meer richting de -1 of 1 hoe sterker. Negatief
verband is -1, positief 1. Zwak is onder de 0,5 sterk boven de 0,8/0,7.
- De correlatiecoëfficiënt kan niet goed tegen uitbijters.
- Gaat altijd over kwantitatieve variabelen.
- Correlatie berekenen uit gemiddelde data is sterker dan uit ruwe individuele datapunten.
- Het is geen complete samenvatting van twee-data variabelen.

, Vanuit assessment 4: percentage waarin de variatie samenhangt tussen gepaarde T-toets = het
kwadraat van de correlatie (correlation in SPSS)


Hoofdstuk 4
Wanneer er sprake is van een lineair verband, kan het handig zijn het algemene patroon samen te
vatten door een lijn te tekenen op de scatterplot: de regressielijn.


Regressie beschrijft het verband tussen een verklarende variabele (x-as) en een responsvariabele (y-
as). Het wordt gebruikt om de waarde van y te schatten bij een gegeven x.
 y = a + bx
- a = het snijpunt, de waarde van y wanneer x = 0, de intercept. Het punt waar de lijn de y-as snijdt.
SPSS de waarde van understarized B die bij constant hoort
- b = de helling (de hoeveelheid waarmee y verandert wanneer x met één toeneemt). = de regressie
coëfficiënt, in SPSS onderunstandarized B (bv. age).


Lineaire regressie: het vinden van het best
passende rechte lijn bij een gegeven dataset. Dit
doe je met de kleinste kwadraten methode
(least-squeres regression line). Reken uit per
waarneming hoe ver het van de zwarte lijn afligt,
dit kwadrateer je en tel je bij elkaar op. De
afstand van elk punt tot de regressielijn = residu.


De kleinste-kwadraten-regressielijn. Reken met tenminste drie significante cijfers.
Regressielijn ^y (betekend de voorspellende waarde van y )=a+ bx stel je op door
sy
- berekenen richtingscoëfficiënt, slope (b) formule=b=r .Slope > 0 = dalende lijn. Slope 0 =
sx
rechte lijn, slope > 0 = stijgende lijn. Correlatie en slope zijn of beiden positief of beiden negatief.
- Drukt y uit als functie van x.
- De lijn gaat altijd door het punt x-gemiddelde, y-gemiddelde.


De correlatie (r) geeft de sterkte en de richting van de lineaire relatie weer, de helling (b) meet de
daadwerkelijke verandering in y per eenheid verandering in x. Het verband tussen correlatie en de
helling van de kleinste-kwadratenlijn (b) -> bij een positieve associatie is het beide positief (r ligt
tussen de 0 en +1, b is stijgend), bij een negatieve associatie is het beide negatief (r ligt tussen de 0
en -1, b is dalend).


De determinatiecoëfficiënt r2 geeftaan welk % van de variatie in de afhankelijke variabele (y) verklaard
kan worden door het regressiemodel (gebaseerd op : onafhankelijke variabele x). SPSS: R squared
 r2 = 0, het model verklaard helemaal geen variatie in y.
$10.86
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Get to know the seller
Seller avatar
fleurheltzel

Get to know the seller

Seller avatar
fleurheltzel Universiteit Utrecht
Follow You need to be logged in order to follow users or courses
Sold
3
Member since
10 months
Number of followers
0
Documents
2
Last sold
1 month ago

0.0

0 reviews

5
0
4
0
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions