100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting 1.3 Statistiek 1: Een Introductie (FSWPE1-032)

Rating
-
Sold
-
Pages
25
Uploaded on
08-07-2021
Written in
2019/2020

Het is een samenvatting van blok 1.3 Statistiek 1: Een introductie. De verschillende onderdelen worden uitgelegd en er staan ook enkele voorbeelden in. Verder zijn handige figuren uit de colleges overgenomen

Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
July 8, 2021
Number of pages
25
Written in
2019/2020
Type
Summary

Subjects

Content preview

Samenvatting blok 1.3
Doelen van wetenschap
Er zijn verschillende bronnen van kennis. Een daarvan is wetenschap. Doelen wetenschap:
- beschrijven;
- verklaren;
- voorspellen;
- controleren.

Eigenschappen van empirische wetenschap
- Belangrijke aannames: er is een objectieve waarheid en die is kenbaar.
- Systematische toetsing van hypothesen aan de werkelijkheid.

Statistiek en data
Drie stappen in het proces:
- design van de studie;
- analyseren van de verkregen data;
- ontdek wat de data je vertellen.

Populatie en steekproef
Populatie: alle mensen met dezelfde eigenschappen (waar je geïnteresseerd in bent) bijv.
kinderen van alleenstaande moeders .
Steekproef: een groepje mensen uit de populatie waar je iets over wilt zeggen

Steekproeven
- onderzoeksvraag;
- keuze design;
- trekken steekproef.

Soorten sampling methods:
- simple random samples (SRS): van alle mensen in de populatie willekeurig (random)
een groep mensen kiezen (invloeden van buitenaf vallen tegenover elkaar weg)
(bijvoorbeeld door een vragenlijst naar mensen te sturen)(gebruik tabel met random
getallen)
- stratified random sampling: populatie onderverdelen in strata (dingen waar je in
geïnteresseerd bent, deels dezelfde eigenschappen) vervolgens uit alle strata een
simple random sample halen (steekproef.)
- multistage random sampling: steeds random steekproeven -> je komt langzaam
terecht bij element dat je wilt weten
- Voluntary response sample: een sample voor vrijwilligers, altijd bevooroordeeld (niet
naar mensen gestuurd)
In menselijke populaties kan altijd bias ontstaan door bijvoorbeeld het niet reageren op een
vragenlijst of een interviewer kan je beïnvloeden.

Data
- Operationaliseren: begrippen in een theorie omzetten in constructen die gemeten
kunnen worden.
- Datasets bestaan uit:

, - Case of unit: subjecten of objecten in een dataset;
- Variabelen: karakteristiek van een case, kan verschillende waarde aannemen
voor verschillende cases of units.
- Label: een speciale variabele die wordt gebruikt om een case in een dataset
te identificeren
- Data worden gebruikt om onderzoeksvragen te beantwoorden.
- Wat en welk soort bewijzen verkrijgen we uit data
- Hoe kunnen we deze nummers gebruiken om een betekenisvolle samenvattingen te
verkrijgen.

Soorten Data
- Kwantitatief:
- Continue: Voorbeeld: leeftijd (1-10 jaar), aantal kinderen in een gezin (0-4),
percentage premasters die de toelatingstoets haalt (99%), IQ-score (85-115),
eindscore Cito (501-550)
- Categorisch: Voorbeeld: leeftijdsgroep (kleuter, puber, volwassene), plaats in
een gezin (jongste, middelste, oudste), LVS Citoscore (A t/m D)
- Meetniveaus (van minst naar meest precies):
- Nominaal (categorisch): geen volgorde, geen meeteenheid en geen nulpunt
(bijv. sekse)
- Ordinaal (categorisch): wel een volgorde, geen meeteenheid en geen nulpunt
(bijv. SES as laag, middel, hoog)
- Interval (continu): interpretatie verschillen tussen scores: wel een volgorde,
wel een meeteenheid en geen vast nulpunt (gelijke afstanden tussen de
intervallen: bijv. temperatuur)
- Ratio (continu): wel een volgorde, wel een meeteenheid en een vast nulpunt
(bijv. leeftijd)
- De key characteristics van een dataset zijn de antwoorden op wie?, wat? en
waarom?

Data bekijken
- Bekijk variabelen afzonderlijk. Kijk dan eventueel naar samenhang tussen variabelen
- Begin met een grafische weergave. Geef daarna numerieke samenvattingen van de
data.
- De verdeling van een variabele geeft aan welke waarden voorkomen en hoe vaak
deze voorkomen.
- De verdeling (distribution) van een variabele zegt iets over wat voor waarde het
aannemt en hoe vaak het deze waarde aanneemt. Bij onderzoeken van verdeling kijk
naar:
- vorm (symmetrisch/scheef)
- centrum
- spreiding
- afwijkingen
- Verdelingen kunnen je grafisch weergeven. Deze keuze voor de weergave hangt af
van het soort variabele.
- Nominaal/ordinaal (categorisch):
- pie chart (cirkeldiagram);
- bar graph (staafdiagram).

, - Interval/ratio (kwantitatief/continu):
- Histogram:
- meest gebruikt
- Geeft snel veel informatie over de data
- stemplot (steel en blad)
- Verdeling van scores, spreiding:
- Scheef naar links / rechts of juist symmetrisch;
- Outliers.

- Stemplot




(steelblad):
- verdelen in 0-4 en 5-9 als er te veel getallen zijn.
- Bij een verdeling van een nominale/ordinale variabele worden de
categorie-en aangegeven plus tellingen of properties per categorie.
- Taart diagram -> nadeel: je moet alle categorie-en kennen (100%)
- Staafdiagrammen -> flexibeler.

Verdeling beschrijven
- resistente maatstaf: relatief onaangetast door veranderingen in de numerieke waarde
van een kleine proportie van het totale aantal observaties, het maakt niet uit hoe
groot deze veranderingen zijn. Wel: mediaan en kwartielen. Niet: gemiddelde en sd.

- Gemiddelde:
- Wordt veel beïnvloed door outliers/afwijkingen (μ(populatie)/ (steekproef))
- Mediaan: middelste score (data ordenen), waarde van zoveelste getal:
(aantal getallen+1)/2 , (twee middelste getallen: (n1+n2)/2 ).
- Wordt niet zo veel beïnvloed door outliers/afwijkingen
- Modus: meest voorkomende getal.
- Wordt niet beïnvloed door outliers/afwijkingen
- Variantie: mate waarin de waarden onderling verschillen:



- Standard deviatie: gemiddelde afwijking of spreiding rondom het gemiddelde
S = √𝑆 2 (wortel van variantie)
- Alleen gebruikt als gemiddelde als centrummaat gekozen is
- beïnvloedbaar door outliers
- sd= 0 als alle waardes gelijk zijn, sd groter als spreiding groter
- S/SD -> steekproef, σ -> populatie

- Boxplot
- Q1 (1e kwartiel) = 25e percentiel (%)
- Mediaan (Q2) = 50e percentiel (%)
- Q3, (3e kwartiel) = 75e percentiel (%)
- IQR (interkwartiel range) = verschil Q3 en Q1
R121,68
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached


Document also available in package deal

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
elsvanbroekhoven Erasmus Universiteit Rotterdam
Follow You need to be logged in order to follow users or courses
Sold
38
Member since
4 year
Number of followers
29
Documents
18
Last sold
2 months ago

2,0

2 reviews

5
0
4
0
3
1
2
0
1
1

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can immediately select a different document that better matches what you need.

Pay how you prefer, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card or EFT and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions