100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.6 TrustPilot
logo-home
Summary

Samenvatting Statistiek I

Rating
-
Sold
-
Pages
14
Uploaded on
05-09-2023
Written in
2021/2022

Beknopte samenvatting Statistiek I. Gemaakt op basis van de hoorcolleges en het boek. Behaald resultaat 18/20. Bevat alle behandelde leerstof

Institution
Course









Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
September 5, 2023
Number of pages
14
Written in
2021/2022
Type
Summary

Subjects

Content preview

1. GEGEVENS EN BESLISSINGEN

1.1 Wat zijn data?
• Om data te begrijpen moeten we de context begrijpen à uitmaken of de data alfabetisch,
numeriek of alfanumeriek is.
• Gegevens zijn meetwaarden samen met hun context.
• Context van gegevens bepalen? 5W’s: à geeft betekenis
Wie wat (essentieel) à als we deze niet weten dan hebben we GEEN data
Wanneer, waar, waarom & hoe (meta-data: voor wat elke casus staat en de betekenis van alle
variabelen), meta data zijn belangrijk als je data niet zelf hebt verzameld
• Gegevenstabel: elke rij is een casus (wie) en elke kolom een variabele (wat). De variabele geeft
informatie over de casus
• Rijen worden records genoemd in een database

Namen van casussen
Enquête Respondenten
Experiment Subjecten/participant (dieren/zaken:
experimentele eenheid)
Casus Individu waarover we gegevens hebben

Gelijke term voor gegevenstabel is rekenblad/spreadsheet à goed voor kleine data sets maar niet voor
grote à relationele gegevensbank nodig (meerdere gegevenstabellen aan elkaar gelinkt, elke
gegevenstabel is een relatie bv. Klant en demografische gegevens, product met prijs en inventaris)

1.2 Soorten variabelen
• Kwalitatief/categorisch: de waarden zijn namen van categorieën bv. Naam & postnummer
(meestal 2 antwoorden: ja of nee “investeer je?”)
o Nominaal: geen orde, gewoon naam, enkel om categorieën te benoemen
o Ordinaal: er zit orde in (s-m-l)
o Indentificatievariabele: valt onder nominaal (studentnummer, gsm-nummer, social
security nummer), is cruciaal om gegevenstabellen in een relationele gegevensbank met
elkaar te linken
• Kwantitatief: waarden met numerieke hoeveelheid met eenheden bv. Prijs (vertellen schaal van
meeteenheid, dus we weten hoe ver 2 waarden van elkaar liggen)
• Opletten: leeftijd kan categorisch en kwantitatief zijn (leeftijdscategorie)

Dwarsdoorsnede: meerdere variabelen meten op hetzelfde tijdstip, op één punt in de tijd bv klanten
aandeel
Tijdreeks: een kwantitatieve variabele meten over verschillende tijdsintervallen op even grote afstand van
elkaar (maand, kwartaal, jaar) bv. winst

1.3 DATABRONNEN: WAAR, HOE EN WANNEER
• Hoe de data wordt verzameld is belangrijk
o data van een enquête op het internet is meestal waardeloos à niet representatief voor
grote groep
o experiment à variabelen manipuleren om te zien wat er gebeurt
o data die al verzameld is door iemand anders à opletten of dit representatief is
à bronnen vermelden




1

, 2. KWALITATIEVE GEGEVENS BESCHRIJVEN EN WEERGEVEN

Frequentietabel somt de categorieën op van een kwalitatieve variabele samen met het aantal
waarnemingen in elke categorie

2.2 Kwalitatieve/categorische variabele samenvatten
3 regels van data analysists: maak een “foto” van de data à alles wordt weergegeven in tabel (er kunnen
dingen worden waargenomen die je niet zonder frequentietabel zou zien) en is makkelijker om te plannen
en analyseren en rapporteren een goede tabel doet veel van het werk al. Om data te rapporteren moet je
een goede tabel hebben

Relatieve frequentie: fracties uitgedrukt t.o.v. totale aantal ( x100% voor percentage)
Oppervlakte principe respecteren! De oppervlakte van de staafjes moet proportioneel zijn aan de cijfers die
we willen weergeven à grafieken kunnen misleidend zijn wnr dit niet gerespecteerd is

• Staafdiagram: maken vergelijking duidelijker, staafjes moeten even breed zijn. Elke categorie is een
staafje. Er moet plaats zijn tussen de staafjes bij kwalitatieve gegevens om aan te tonen dat ze vrij
zijn en gerangschikt kunnen worden in elke volgorde. (naam van de variabele is vaak gebruikt als
tittel voor horizontale as)
• Relatieve frequentie staafdiagram: idem, aandacht gaat naar relatieve proportie
• Taartdiagram: toont aan hoe geheel verdeeld is in categorieën door sectoren van cirkel weer te
geven, goed om RF te vergelijken, anders verwarrend (categorieën mogen elkaar niet overlappen)

2.3 Twee kwalitatieve variabelen: kruistabel
Kruistabel geeft de frequenties weer voor elke combinatie van 2 of meer variabelen
Ö Marginale verdeling = verdeling van elke variabele afzonderlijk, in de marges van de tabel (geeft
totaal van elke rij/kolom), marginale verdeling is hetzelfde als frequentieverdeling
Ö Elke cel van kruistabel geeft waarden van 2 kwalitatieve variabelen weer
Ö Totaalpercentage rijppercentage, kolompercentage à voorwaardelijke verdeling

Voorwaardelijke verdeling: verdeling van variabele waarbij we “wie” beperken tot een kleinere groep (een
variabele) Wanneer de verdeling van één variabele hetzelfde is voor alle categorieën van een andere
variabele, noemen we deze twee variabelen onafhankelijk (er is geen associatie)
à Volledig onafhankelijk komt zelden voor

2.4 Gesegmenteerd staafdiagram en mozaïekdiagram
• Gesegmenteerd staafdiagram: geeft voorwaardelijke verdeling weer van kwalitatieve variabele
binnen elke categorie van andere variabele, elke staaf als het geheel gezien en wordt verdeeld in
segmenten
• Mozaïekdiagram: grafische weergave van kruistabel, idem als hierboven maar respecteert opp.
principe meer. Diagram is verdeeld in rechthoeken oppervlakte is proportioneel verdeeld met
aantal casussen.

2.5 Simpson’s paradox
= verschijnsel wnr gemiddelden/percentages worden berekend over verschillende groepen en de
groepsgemiddelden in tegenspraak zijn met globale gemiddelden. Men moet voorzichtig zijn en enkel
vergelijken tussen vergelijkbare metingen/variabelen (lees p61)




2
$10.62
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Get to know the seller
Seller avatar
AV222
2.0
(1)

Get to know the seller

Seller avatar
AV222
Follow You need to be logged in order to follow users or courses
Sold
8
Member since
2 year
Number of followers
8
Documents
2
Last sold
1 year ago
AV Samenvattingen

2.0

1 reviews

5
0
4
0
3
0
2
1
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions