Summary

Samenvatting hoorcolleges Beschrijvende en inferentiële statistiek

Rating

Sold

Pages

Uploaded on

26-10-2022

Written in

2021/2022

Samenvatting van alle hoorcolleges van het vak Beschrijvende en inferentiële statistiek

Institution

Course

Whoops! We can’t load your doc right now. Try again or contact support.

Report Copyright Violation

Connected book

Alan Agresti, Christine Franklin Statistics

Edition:Unknown
ISBN:9781292164878
Edition:Unknown

Written for

Institution: Vrije Universiteit Amsterdam (VU)
Study: Pre-master Beleid, Communicatie En Organisatie
Course: Beschrijvende En Inferentiële Statistiek (S_PMBIS)

All documents for this subject (7)

Document information

Summarized whole book?: Yes
Uploaded on: October 26, 2022
Number of pages: 34
Written in: 2021/2022
Type: Summary

Subjects

t verdeling
nul hypothese
alternatieve hypothese
chi square
kwantitatief onderzoek
spss
categorische variabelen
kwantitatieve variabelen
modus
mediaan
gemiddelde
bereik
interkwartielafstand en boxplo

Content preview

Beschrijvende en inferentiële statistiek hoorcollege

Statistiek ➔ Gaat over de methoden om gegevens te verzamelen, bewerken, interpreteren en
presenteren. Die gegevens noemen we data. Ultieme doel: door middel van data kennis vergaren
over de wereld om ons heen.

Beschrijvende = Hoe zien de data eruit ➔ Samenvatting van de verkregen data
Inferentiële = Wat zeggen de data van de steekproef over de gehele populatie ➔ Uitspraken en
voorspellingen doen over hele populatie op basis van de vergregen data (steekproef)

To infer = conluderen uit/opmaken uit
Terminologie: het boek heeft het over ‘sample statistic’ en ‘population parameter’

Variabelen = Wat je wil onderzoeken, zoals kleur, stad
Cases = Hetgeen wat je gaat onderzoeken, 1 persoon of 1 team
Constante = wanneer er geen variatie is, het blijft hetzelfde

Meetniveau’s:
Categorische variabelen:
- Nominaal: Verschillende categorieën, geen rangorde (kleur, nationaliteit)
- Ordinaal: Verschillende categorieën, rangorde, je weet niets over de verschillende
categorieën dus met hoeveel het van elkaar verschilt (slecht, neutraal, goed of eerste,
tweede)
Kwantitatieve variabelen:
- Interval: Verschillende categorieën, rangorde, je weet iets over de intervallen tussen de
verschillende categorieën (geslacht, temperatuur)
- Ratio: Verschillende categorieën, rangorde, je weet iets over de verschillende categorieën, 0-
punt met betekenis (lengte)

Kwantitatieve variabelen kunnen ook nog discreet of continu zijn.
- Discreet: set van aparte nummers (doelpunten, 1 of 2 niet 1,21)
- Continue: eindeloos aan getal (lengte, bijvoorbeeld 1,75)

Een nominale variabele met 2 categorieën (ja/nee – goed/fout) ➔ Dichotoom

Module 1
Data beschrijven
Bij een studie kijk je naar de data, die valt op te delen in de variabelen en cases
- Cases ➔ Persoon of iets dat je bestudeert
- Variabele ➔ Kenmerken waar je geïnteresseerd bent

De data kan je het beste plaatsen in een datamatrix. Van iedere studie is de datamatrix het
kernelement.

Datamatrix ➔ Het is een overzicht van al je cases en variabelen. De cases staan in de rijen en de
variabelen in de kolommen.

Observaties ➔ De gegevens in de datamatrix
In een datamatrix geef je met ‘…’ aan dat de rijen doorgaan, de allerlaatste van de rij schrijf je wel op.

,De datamatrix is nodig voor alle statistische analyses. Samenvattingen van de datamatrix gebruiken
we om de data aan andere te laten zien. De samenvattingen kunnen worden gegeven in tabellen en
grafieken.

Frequentietabel ➔ Laat zien hoe vaak een variabel voorkomt. Hoe de waarden van een variabele dus
verdeeld zijn over de cases.

Relatieve frequentie ➔ Wordt uitgedrukt in percentages

Cumulatieve percentage ➔ De percentages van categorieën worden bij elkaar opgeteld.

Hercoderen ➔ Het veranderen van meetniveau. Bijvoorbeeld van kwantitatief naar ordinaal (gewicht
nu neerzetten in intervallen met bijvoorbeeld 60-70 kg, 70-80kg)

Kan niet van ordinaal naar kwantitatief.

De informatie van een frequentietabel kan je laten zien in een grafiek. Dat kan op 2 manieren voor
nominale gegevens:
- Taartdiagram (nominale gegevens)
- Staafdiagram

Je kan meteen zien hoeveel het is, maar het exacte nummer is niet makkelijk uit een taartdiagram te
halen. Dat is makkelijker bij een staafdiagram. Een staafdiagram is handiger als de categorieën in een
variabel toenemen.

Voor kwantitatieve gegevens:
- Dotplot ➔ Weinig observaties
- Histogram ➔ Veel observaties. Vergelijkbaar met een staafdiagram waarin de (relatieve)
frequentie wordt aangegeven van de mogelijk waarden van een variabel. Wel een belangrijk
verschil. De balken zijn wel verbonden aan elkaar. Dit komt doordat de waarden van een
interval ratio variabel een onderliggende continue schaal representeert.

Maten van centraliteit
Categorische gegevens:
- Modus (mode) ➔ Waarde die het vaakst voorkomt
Kwantitatieve gegevens:
- Mediaan (median) ➔ Middelste waarde van de dataset, gegevens moeten wel gesorteerd
worden
- Gemiddelde (mean) ➔ De som van alle waarden, gedeeld door het totale aantal waarden

Kies voor de mediaan als je outliers (disproportionele getal) of een scheve verdeling hebt, ga anders
voor het gemiddelde.

,Mate van variantie
Bereik, interkwartielafstand en boxplot
2 mate van variabiliteit van de data:
- Bereik
- Interkwartielafstand

Bereik ➔ Verschil tussen de laagste en hoogste waarde

Bereik geeft alleen geen goede indruk van de variabiliteit omdat het alleen extreemste waarden van
de variabiliteit pakt.

De interkwartielafstand laat de extreme waarden buiten beschouwing. Het wordt opgedeeld in 4
gelijke gedeelte. De delen worden kwartielen genoemd. Q1 eerste 25%, Q2 is de mediaan, Q3 weer
25%

Interkwartielafstand ➔ Is ook wel de afstand tussen Q1 en Q3. Ofwel IKA = K3-K1

Handig omdat het geen rekening houdt met potentiële outliers. Wel handig om naar de outliers te
zoeken. De outlier is te vinden door: Q1 – (IQR*1,5) of Q3 + (IQR*1,5)

Boxplot ➔ Geeft een indicatie over hoe de waardes in de verdeling verdeeld zijn. Laat je in 1
oogopslag Q1,2 en 3 zien, de maximale en minimale waarden die geen outliers zijn en de outliers
zelf.

De box staat voor 50% het staat voor Q1 en Q3. De middelste lijn in de boxplot is de mediaan (Q2).

Variantie en standaarddeviatie
Geeft aan hoeveel de data gemiddeld afwijkt van het gemiddelde.

Kijk eerst naar hoeveel elke observatie van het gemiddelde afwijkt

We gebruiken de deviaties om te komen tot de standaarddeviatie ➔ de ‘gemiddelde afstand’ van
het gemiddelde:

Nut en belang:
- Beschrijven van de spreiding van de data
- Daarnaast is het met de standaarddeviatie makkelijker om data te vergelijken
- Meer spreiding > minder zekerheid

, Z-scores
Z-score ➔ Hoeveel standaarddeviaties een bepaalde observatie van het gemiddelde ligt.

Om de vraag te beantwoorden of een observatie vaak voorkomt of niet wordt de z-score gebruikt.

Wanneer een histogram normaal verdeeld is, valt:
- 68% van je z-waardes tussen -1 en 1.
- 95% van je z-waardes tussen -2 en 2
- 99% van je z-waardes tussen -3 en 3
Vuistregel: 75% moet tussen -2 en 2 liggen en 89% tussen -3 en 3.

Waarom is het handig
- Drukt uit hoe uitzonderlijk een observatie is (boven 2 ben je bijzonder)
- Data kan je standaardiseren, hierdoor kan je vergelijken

Informatie over hoe extreem een observaties is. Je kan verschillende verdelingen bekijken.

Standaardiseren van de gegevens ➔ Gemeten waarden vervangen door scores uitgedrukt in een
aantal standaarddeviaties van het gemiddelde.

Met de z-score kan je in 1 oogopslag of het vaak voorkomt of uitzonderlijk is.

Module 2
Kruistabel

Voor categorische variabelen gebruik je een kruistabel.

Je hebt afhankelijke en onafhankelijke variabelen. Voor de afhankelijke variabelen reken je het
percentage uit.

Je moet percentages berekenen. Dat doe je door het getal in de kruistabel / het totale aantal *100%

Je kunt alleen een patroon zien als je met percentages of proporties werkt (nooit originele waardes).

Kruistabellen en spreidingsdiagrammen
Relatie tussen 2 variabele met tabellen en grafieken. Hiermee kan je handig zien of er een
gecorreleerd zijn.

Constante pas je toe wanneer je wil dat het er geen invloed op heeft. Bijvoorbeeld iedereen is even
lang

$7.80

Get access to the full document:

100% satisfaction guarantee

Immediately available after payment

Both online and in PDF

No strings attached

Get to know the seller

Carlijnro

3.9

(12)

Get to know the seller

Carlijnro Vrije Universiteit Amsterdam

View profile

Sold

Member since

3 year

Number of followers

Documents

Last sold

2 months ago

3.9

12 reviews

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller Carlijnro. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $7.80. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews) 44962 documents were sold in the last 30 days Founded in 2010, the go-to place to buy study notes for 16 years now

Samenvatting hoorcolleges Beschrijvende en inferentiële statistiek

Connected book

Written for

Document information

Subjects

Content preview

Get to know the seller

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Didn't get what you expected? Choose another document

Pay as you like, start learning right away

Frequently asked questions

What do I get when I buy this document?

Satisfaction guarantee: how does it work?

Who am I buying these notes from?

Will I be stuck with a subscription?

Can Stuvia be trusted?