Written by students who passed Immediately available after payment Read online or as PDF Wrong document? Swap it for free 4.6 TrustPilot
logo-home
Summary

Samenvatting - Statistiek 1

Rating
-
Sold
1
Pages
11
Uploaded on
01-04-2025
Written in
2023/2024

In deze samenvatting zijn alle onderwerpen opgenomen voor de basiskennis van statistiek. Hierop zijn de volgende onderwerpen van toepassing: Meetniveaus, centrummaten en spreiding; Datavisualisatie en kansrekening; Normaal-verdeling en inferentie; Inferentie voor proporties; Inferentie voor kruistabellen; Inferentie voor numerieke data (gemiddelden vergelijken) en; Inferentie voor numerieke data (statistische power & ANOVA).

Show more Read less
Institution
Course

Content preview

Meetniveaus, centrummaten, spreiding

Meetniveaus
Variabele = iets dat gemeten kan worden en verschilt tussen entiteiten of momenten. Hierbij
onderscheid te maken tussen onafhankelijke en onafhankelijke variabele. O heeft impact op A.
Meerdere niveaus van de variabele (wat voor soort variabele):
- Nominaal (categoriaal); verschillende categorieën, geen volgorde (zoals religie, land of
con icttype)
- Ordinaal (categoriaal); volgorde (zoals frequentie bezoek)
- Interval-ratio (numeriek); de afstand tussen opties heeft betekenis (zoals inkomen, leeftijd, links-
rechtspositie of aantal internationale con icten)

Variabelen in de kolommen, casussen in de rijen. Elke cel is dan de waarde van een variabele.

Scheefheid (Skewness) = variabele is niet symmetrisch verdeeld. Staart rechts noemen we rechts
scheef en staart rechts noemen we links scheef.

Centrummaten
Manier van het samenvatten van frequentieverdeling. De centrummaten corresponderen met het
meetniveau dat je hebt. Bij nominaal kun je de modus uitrekenen, bij ordinaal de modus en de
mediaan, bij interval-ratio de modus, de mediaan en het gemiddelde.
- Modus = de meest frequente waarde
- Mediaan = de middelste waarde, ook wel de ‘doorsnee’ waarde genoemd. Bij oneven aantal
getallen makkelijk aan te wijzen. Bij even gemiddelde van de twee middelste waarden nemen.
- Gemiddelde = formule! Hoeft niet uit het hoofd te leren.
Dit kan allemaal uitgerekend worden in R.

Spreidingsmaten
Nominaal heeft geen spreidingsmaat want we kunnen geen ordening aanbrengen, ordinaal heeft
de interkwartiel afstand (inter-quartile range; waarde tussen het eerste en tweede kwartiel) en
interval-ratio heeft variantie of standaardafwijking (variance/standard deviation; maat van de
spreiding van waarden rond het gemiddelde).
Totale afwijking is altijd gelijk aan 0. Niet zo’n nuttige maat voor spreiding. Daarom kwadrateren
we de verschillen: sum of squared errors (sum of squares). Hoe groter de n, hoe groter de sum of
squares. Niet goed te vergelijken. Daarom delen we de sum of squared errors door n-1. De
variantie is de sum of squares gedeeld door n-1.
Hoe groter de standaardafwijking, hoe groter de spreiding rond het gemiddelde. Deze
standaardafwijking is wel afhankelijk van de schaal waarop gemeten is. Je kunt dus niet zomaar
standaardafwijking vergelijken tussen verschillende variabelen.

Datavisualisatie & Kansrekening

Bij datavisualisatie kan er gebruik worden gemaakt van gra eken en/of tabellen.

Veelgebruikte gra eken (code van toepassen in R te vinden in de sheets)
- Puntenwolk (scatterplot) -> duidelijker/beter te maken, te splitsen in types (landen), van label
(landennamen) te voorzien.
- Dot plot
- Histogram
- Boxplot
- Staafdiagram -> te gebruiken voor tellingen, maar ook voor samenvattende statistiek (zoals
groepsgemiddelden). Te onderscheiden in gestapelde staafdiagram (stacked bar plot), staven
naast elkaar of groepsgemiddelden (gemiddelden i.p.v. aantallen op de y-as).

Tabellen
- Frequentietabel
- Kruistabel -> richtlijnen aanwezig, zoals ‘onafhankelijke variabele in kolommen en afhankelijke
variabele in rijen’, etc.




fl fi fl fi

, Kans (op een uitkomst) = het gedeelte van de keren dat deze uitkomst voorkomt als we het
toevallige (stochastische) proces een oneindig aantal keer zouden observeren.
We spreken van uitkomsten (outcomes) en gebeurtenissen (events). Een set van uitkomsten is een
gebeurtenis.
Disjuncte gebeurtenissen (disjoint event) = kansen zijn op te tellen (zoals kans van 1 of 2 gooien
met dobbelsteen), wat volgt uit de somregel (addition rule).
Niet-disjuncte gebeurtenissen = kansen zijn niet op te tellen (zoals kans op vrouw als minister),
wat volgt uit de algemene somregel.

Algemene somregel: P(A of B) = P(A) + P(B) - P(A en B)

Kansverdeling omvat alle disjuncte uitkomsten en bijbehorende kansen. Drie bijbehorende regels:
1. De uitkomsten moeten disjunct zijn
2. Elke kans moet tussen de 0 en de 1 liggen
3. De kansen moeten optellen tot 1

Twee processen zijn onafhankelijk als de uitkomst van de ene geen informatie geeft over de
uitkomst van de andere. Bijvoorbeeld: twee dobbelstenen gooien. Voor de onafhankelijke
processen geldt de productregel: P(A en B) = P(A) * P(B)

Simultane kans (joint possibility) = de kans op uitkomsten voor twee of meer variabelen.
Conditionele kans = kijkt naar de kans op een bepaalde uitkomst A gegeven de conditie B.

Als A en B twee uitkomsten/gebeurtenissen representeren geldt de algemene productregel: P(A
en B) = P(A|B) * P(B) -> #de streep moet je zien als een breuk!

Belangrijk te onthouden over werken met kansen:
1. Wat is nou een kans/kansverdeling?
2. Disjuncte kansen/gebeurtenissen (die niet tegelijkertijd plaats kunnen vinden)
3. Proces (onafhankelijk)

Boomdiagram (Tree diagram) geeft inzicht in conditionele kansen.

Twee disjuncte gebeurtenissen kunnen niet tegelijkertijd plaatsvinden, twee onafhankelijke
processen wel.

Normaal-verdeling & Inleiding Inferentie

Een kansverdeling visualiseren, Van kansen naar verdelingen: discrete verdeling/uniforme
verdeling (kans op elke uitkomst is even groot). We kunnen aantal gooide ogen een stochastische
variabele noemen.
Verwachte waarde
Wanneer er voldoende grote aantallen zijn, kun je dit soort discrete verdelingen benaderen met
een continue verdeling, zoals de normaalverdeling. Hiervan weten we goed hoe die eruit ziet, wat
een voordeel is.
Een normaalverdeling heeft twee parameters: een gemiddelde (mu) en een standaardafwijking
(sigma). Het gemiddelde, de mediaan en de modus zijn aan elkaar gelijk -> als perfect
symmetrisch. De standaardafwijking zegt iets over de spreiding/de schaal waarop je hem plot.
De standaard normaalverdeling heeft een mean van 0 en een sd van 1.
Met standaardiseren passen we de schaal aan. Dit doen we door de Z-score uit te rekenen.
Z = (x-mu) / sigma. En Z-score van 1 houdt 1 standaardafwijking boven het gemiddelde in.
Oppervlakte onder de curve berekenen: via tabel of statistische software. We moeten beide
kunnen!

Bij standaard normaalverdeling valt 95% binnen 1,96 keer de standaardafwijking. Dat is een
gegeven waarvan we gebruik maken om het betrouwbaarheidsinterval te berekenen. Dus: 95%
van de waarden ligt tussen -1,96 en +1,96 standaardafwijkingen bij een (standaard)
normaalverdeling.

Written for

Institution
Study
Course

Document information

Uploaded on
April 1, 2025
Number of pages
11
Written in
2023/2024
Type
SUMMARY

Subjects

$6.53
Get access to the full document:

Wrong document? Swap it for free Within 14 days of purchase and before downloading, you can choose a different document. You can simply spend the amount again.
Written by students who passed
Immediately available after payment
Read online or as PDF

Get to know the seller
Seller avatar
svenvanstal

Also available in package deal

Get to know the seller

Seller avatar
svenvanstal Universiteit Leiden
Follow You need to be logged in order to follow users or courses
Sold
6
Member since
11 months
Number of followers
0
Documents
6
Last sold
2 days ago

0.0

0 reviews

5
0
4
0
3
0
2
0
1
0

Trending documents

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions