Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Samenvatting

Samenvatting - Statistiek 1

Beoordeling
-
Verkocht
1
Pagina's
11
Geüpload op
01-04-2025
Geschreven in
2023/2024

In deze samenvatting zijn alle onderwerpen opgenomen voor de basiskennis van statistiek. Hierop zijn de volgende onderwerpen van toepassing: Meetniveaus, centrummaten en spreiding; Datavisualisatie en kansrekening; Normaal-verdeling en inferentie; Inferentie voor proporties; Inferentie voor kruistabellen; Inferentie voor numerieke data (gemiddelden vergelijken) en; Inferentie voor numerieke data (statistische power & ANOVA).

Meer zien Lees minder
Instelling
Vak

Voorbeeld van de inhoud

Meetniveaus, centrummaten, spreiding

Meetniveaus
Variabele = iets dat gemeten kan worden en verschilt tussen entiteiten of momenten. Hierbij
onderscheid te maken tussen onafhankelijke en onafhankelijke variabele. O heeft impact op A.
Meerdere niveaus van de variabele (wat voor soort variabele):
- Nominaal (categoriaal); verschillende categorieën, geen volgorde (zoals religie, land of
con icttype)
- Ordinaal (categoriaal); volgorde (zoals frequentie bezoek)
- Interval-ratio (numeriek); de afstand tussen opties heeft betekenis (zoals inkomen, leeftijd, links-
rechtspositie of aantal internationale con icten)

Variabelen in de kolommen, casussen in de rijen. Elke cel is dan de waarde van een variabele.

Scheefheid (Skewness) = variabele is niet symmetrisch verdeeld. Staart rechts noemen we rechts
scheef en staart rechts noemen we links scheef.

Centrummaten
Manier van het samenvatten van frequentieverdeling. De centrummaten corresponderen met het
meetniveau dat je hebt. Bij nominaal kun je de modus uitrekenen, bij ordinaal de modus en de
mediaan, bij interval-ratio de modus, de mediaan en het gemiddelde.
- Modus = de meest frequente waarde
- Mediaan = de middelste waarde, ook wel de ‘doorsnee’ waarde genoemd. Bij oneven aantal
getallen makkelijk aan te wijzen. Bij even gemiddelde van de twee middelste waarden nemen.
- Gemiddelde = formule! Hoeft niet uit het hoofd te leren.
Dit kan allemaal uitgerekend worden in R.

Spreidingsmaten
Nominaal heeft geen spreidingsmaat want we kunnen geen ordening aanbrengen, ordinaal heeft
de interkwartiel afstand (inter-quartile range; waarde tussen het eerste en tweede kwartiel) en
interval-ratio heeft variantie of standaardafwijking (variance/standard deviation; maat van de
spreiding van waarden rond het gemiddelde).
Totale afwijking is altijd gelijk aan 0. Niet zo’n nuttige maat voor spreiding. Daarom kwadrateren
we de verschillen: sum of squared errors (sum of squares). Hoe groter de n, hoe groter de sum of
squares. Niet goed te vergelijken. Daarom delen we de sum of squared errors door n-1. De
variantie is de sum of squares gedeeld door n-1.
Hoe groter de standaardafwijking, hoe groter de spreiding rond het gemiddelde. Deze
standaardafwijking is wel afhankelijk van de schaal waarop gemeten is. Je kunt dus niet zomaar
standaardafwijking vergelijken tussen verschillende variabelen.

Datavisualisatie & Kansrekening

Bij datavisualisatie kan er gebruik worden gemaakt van gra eken en/of tabellen.

Veelgebruikte gra eken (code van toepassen in R te vinden in de sheets)
- Puntenwolk (scatterplot) -> duidelijker/beter te maken, te splitsen in types (landen), van label
(landennamen) te voorzien.
- Dot plot
- Histogram
- Boxplot
- Staafdiagram -> te gebruiken voor tellingen, maar ook voor samenvattende statistiek (zoals
groepsgemiddelden). Te onderscheiden in gestapelde staafdiagram (stacked bar plot), staven
naast elkaar of groepsgemiddelden (gemiddelden i.p.v. aantallen op de y-as).

Tabellen
- Frequentietabel
- Kruistabel -> richtlijnen aanwezig, zoals ‘onafhankelijke variabele in kolommen en afhankelijke
variabele in rijen’, etc.




fl fi fl fi

, Kans (op een uitkomst) = het gedeelte van de keren dat deze uitkomst voorkomt als we het
toevallige (stochastische) proces een oneindig aantal keer zouden observeren.
We spreken van uitkomsten (outcomes) en gebeurtenissen (events). Een set van uitkomsten is een
gebeurtenis.
Disjuncte gebeurtenissen (disjoint event) = kansen zijn op te tellen (zoals kans van 1 of 2 gooien
met dobbelsteen), wat volgt uit de somregel (addition rule).
Niet-disjuncte gebeurtenissen = kansen zijn niet op te tellen (zoals kans op vrouw als minister),
wat volgt uit de algemene somregel.

Algemene somregel: P(A of B) = P(A) + P(B) - P(A en B)

Kansverdeling omvat alle disjuncte uitkomsten en bijbehorende kansen. Drie bijbehorende regels:
1. De uitkomsten moeten disjunct zijn
2. Elke kans moet tussen de 0 en de 1 liggen
3. De kansen moeten optellen tot 1

Twee processen zijn onafhankelijk als de uitkomst van de ene geen informatie geeft over de
uitkomst van de andere. Bijvoorbeeld: twee dobbelstenen gooien. Voor de onafhankelijke
processen geldt de productregel: P(A en B) = P(A) * P(B)

Simultane kans (joint possibility) = de kans op uitkomsten voor twee of meer variabelen.
Conditionele kans = kijkt naar de kans op een bepaalde uitkomst A gegeven de conditie B.

Als A en B twee uitkomsten/gebeurtenissen representeren geldt de algemene productregel: P(A
en B) = P(A|B) * P(B) -> #de streep moet je zien als een breuk!

Belangrijk te onthouden over werken met kansen:
1. Wat is nou een kans/kansverdeling?
2. Disjuncte kansen/gebeurtenissen (die niet tegelijkertijd plaats kunnen vinden)
3. Proces (onafhankelijk)

Boomdiagram (Tree diagram) geeft inzicht in conditionele kansen.

Twee disjuncte gebeurtenissen kunnen niet tegelijkertijd plaatsvinden, twee onafhankelijke
processen wel.

Normaal-verdeling & Inleiding Inferentie

Een kansverdeling visualiseren, Van kansen naar verdelingen: discrete verdeling/uniforme
verdeling (kans op elke uitkomst is even groot). We kunnen aantal gooide ogen een stochastische
variabele noemen.
Verwachte waarde
Wanneer er voldoende grote aantallen zijn, kun je dit soort discrete verdelingen benaderen met
een continue verdeling, zoals de normaalverdeling. Hiervan weten we goed hoe die eruit ziet, wat
een voordeel is.
Een normaalverdeling heeft twee parameters: een gemiddelde (mu) en een standaardafwijking
(sigma). Het gemiddelde, de mediaan en de modus zijn aan elkaar gelijk -> als perfect
symmetrisch. De standaardafwijking zegt iets over de spreiding/de schaal waarop je hem plot.
De standaard normaalverdeling heeft een mean van 0 en een sd van 1.
Met standaardiseren passen we de schaal aan. Dit doen we door de Z-score uit te rekenen.
Z = (x-mu) / sigma. En Z-score van 1 houdt 1 standaardafwijking boven het gemiddelde in.
Oppervlakte onder de curve berekenen: via tabel of statistische software. We moeten beide
kunnen!

Bij standaard normaalverdeling valt 95% binnen 1,96 keer de standaardafwijking. Dat is een
gegeven waarvan we gebruik maken om het betrouwbaarheidsinterval te berekenen. Dus: 95%
van de waarden ligt tussen -1,96 en +1,96 standaardafwijkingen bij een (standaard)
normaalverdeling.

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
1 april 2025
Aantal pagina's
11
Geschreven in
2023/2024
Type
SAMENVATTING

Onderwerpen

€5,49
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kan je een ander document kiezen. Je kan het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Maak kennis met de verkoper
Seller avatar
svenvanstal

Ook beschikbaar in voordeelbundel

Maak kennis met de verkoper

Seller avatar
svenvanstal Universiteit Leiden
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
6
Lid sinds
11 maanden
Aantal volgers
0
Documenten
6
Laatst verkocht
3 dagen geleden

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Populaire documenten

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen