100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting - Statistisch Redeneren: Theorie en Toepassing (was: SMCO)

Rating
-
Sold
-
Pages
34
Uploaded on
04-07-2025
Written in
2023/2024

Uitgebreide samenvatting van de hoofdstukken van het boek en de hoorcolleges. Met duidelijke stappen voor SPSS. Ik heb zelf het vak met een 9,2 afgesloten.

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
July 4, 2025
Number of pages
34
Written in
2023/2024
Type
Summary

Subjects

Content preview

SMCO SV Boek en Hoorcolleges
Anna de Ruig (13405284)

SMCO Week 1
Maandag 4 september
Reasoning in statistics
- Kennis
 Identificeren
 Beschrijven
- Skills
 Vertalen
 Interpreteren
 Lezen
 Computen

Redeneren met statistiek is het kunnen begrijpen, de logische stappen die gemaakt moeten
worden voor het nemen van beslissingen.
Waarom en hoe.

Statistisch denken
- Toepassen – welke methodes moet je gebruiken in situaties
- Kritisch reflecteren – op het werk van jou en van anderen bijvoorbeeld
- Evalueren – van het werk, is iets bullshit of goed grondig uitgevoerd.
- Generaliseren – naar de populatie. Zonder variatie is het een dooie bedoeling, want
er is geen evolutie.

Empirische cyclus
- Observatie: idee voor hypothese: schoonmoeder hekel
- Inductie: hypothese - iedereen haat zijn schoonmoeder
- Deductie: verwachting & operationaliseren  vragen aan vrienden met 3 opties of ze
hun schoonmoeder neutraal, leuk of horrible. Zou 1 persoon neutraal of leuk zeggen,
dan kan haar hypothese meteen worden verworpen.
- Toetsing: is binair, op basis van schade bedacht
- Evalueren: oh toch niet iedereen haat zijn schoonmoeder

SPSS
- Select cases: voor data opschonen: < = 10 & > = 0 (bijvoorbeeld)
- Graph  chart builder  bar chart, variable op ordinal of nominal, x-as variabele en
y-as count
- Binominaal: verdeling van een binominaal proces, alleen kop of munt, het betekent
dat elke optie die kan maar 1x voorkomen, dus het ligt tussen de 0 of 10.
- Verschil met normaalverdeling: bij normaalverdeling zijn alle tussenliggende waarden
mogelijk, bijvoorbeeld 2,2 of 2,6 etc.

Steekproefverdeling


1

, - Om te achterhalen wat de steekproefverdeling is, kun je mini steekproeven uitvoeren,
zoals dit munt experiment.
- De cases zijn onze steekproeven (observaties)

Expected value is hetzelfde als mean in de populatie. Expected value komt voort uit alle
steekproeven (sampling distribution)
1. Maak steekproeven
2. Reken het gemiddelde uit
3. Je hebt de echte populatiewaarde

- Altijd random samples
- Unbiased estimator
- Continuous versus discrete: probability density versus probability
- Impractical!

Sample statistic (steekproefwaarde): a value describing a characteristic of the sample.

Steekproevenverdeling
Geeft een overzicht van de waarde van mijn gekozen steekproefkenmerk, hoe waarschijnlijk
het is

Welk kenmerk van de steekproef heeft onze interesse?
- We maken een steekproefkenmerk: steekproefgrootheid  sample statistic/random
variabele: bijvoorbeeld aantal (proportie) gele snoepjes; kansvariabele
 Er is variatie in elke steekproef
 Varieert tussen steekproef: daarom is het een random variabele
- Binominaal verdeling gaat over de waarschijnlijkheid, hoe lager die staafjes, hoe lager
die kansen.
 Dit zijn discrete variabelen
 Bij een normaalverdeling heb je continu variables: bijvoorbeeld gemiddeld
gewicht, gaat over een serie uitkomsten met minstens of maximaal
(ondergrens en bovengrens).
 Het verschil is dat bij discrete variabelen kun je geen decimale hebben bij
continuous variabelen wel. Bij discrete variabelen zijn er harde grenzen, je
kunt geen 3,25 snoepjes hebben.

Steekproefruimte (sampling space): hoeveel snoepjes er kunnen zijn, tussen 0 -10
bijvoorbeeld
- Minstens 3 gele snoepjes is alle proporties vanaf 3 tot 10 bij elkaar optellen
- Probabilities zijn individuele uitkomsten, voor discrete variabelen met harde grenzen
- Probability density is een serie uitkomsten, naar ondergrenzen en bovengrenzen,
bijvoorbeeld gemiddeld gewicht van 0,36g.
- Kansdichtheid hoort bij continuous variabelen.

Parameter: populatiewaarde, dus de proportie gele snoepjes in de populatie is 0,2.
- De verwachte waarde staat gelijk aan de populatiewaarde, uitkomst die het meest
voorkomt is de verwachte waarde

2

,SMCO Week 2
Maandag 11 September
Hoofdstuk 2
Als je het gemiddelde van de sampling distribution uitrekent, heb je de waarde uit de
populatie. Het is onpraktisch om 1000en samples te trekken. We kunnen niet zeker weten of
onze sampling distribution correct is wanneer deze is gebaseerd op 1 sample, onze sample
data moet aan bepaalde eisen voldoen die we moeten checken

Er zijn drie manieren om een sampling distribution te contrueren als we maar 1 sample
trekken:
Bootstrapping: we trekken duizenden steekproeven uit onze originele steekproef in plaats
van uit de populatie. Je trekt 1 sample, dan trekt de computer bootstrap samples. Een
bootstrap sample moet even groot zijn als de originele steekproef.
 Alleen correct als onze originele steekproef min of meer representatief zijn voor
de populatie, om deze kans te vergroten moet je een random steekproef trekken
die heel groot is
 Bootstrapping is soms de enige optie
 Gebruiken als de exact approach en de theoretical approximation niet kunnen
1. The exact approach: hiermee kan je de exacte waarschijnlijkheid uitrekenen van alle
mogelijke steekproefresultaten. Dit doe je door de probabilities met elkaar te
vermenigvuldigen.
 Werkt alleen voor categorische variabelen, en zelfs dan is het computer
intensief
 Geeft een lijst van alle hoeveelheden en mogelijke combinaties, en kan dus
alleen bij categorische of discrete variabelen → een proportie is gebaseerd op
frequenties en frequenties zijn discreet dus dan kan je de exact approach
gebruiken
 Er is veel zekerheid, door het zo uit te rekenen weet de de echte sampling
distribution
 Gebruiken als de variabelen categorisch zijn en er geen theoretische
benadering is, of als er niet aan de condities is voldaan en de variabelen
categorisch zijn
2. Theoretical approximation (meest populair maar ook meest ingewikkeld): een sample
distribution kan worden gezien als een wiskundige functie die we een theoretische
waarschijnlijkheidsdistributie noemen. Een normaalverdeling lijkt een goede
benadering te zijn van de true sampling distribution, maar klopt niet altijd.
 Altijd slechts een benadering, nooit de true sampling distribution
 Je kijkt naar het verschil in gemiddelden
 Deze benadering kan heel slecht zijn als er niet wordt voldaan aan de condities
die worden genoemd in de tabel, je kan de resultaten dan niet vertrouwen
 Gebruiken als het beschikbaar is en als er is voldaan aan de condities
 Theoretical approach is de standaard benadering in SPSS


Bootstrapping in SPSS
1. Dataset openen
2. Independent samples t test

3

, 3. Test variabele kiezen
4. Bootstrap
5. Perform bootstrapping
6. Number of samples = 5000 (recommended)
7. Confidence interval = bias corrected
8. Continue
9. Paste

Interpretatie van bootstrapping resultaten
- Bootstrap specifications: keuzes die we hebben gemaakt
- T-test group statistics: aantal snoepjes in elke groep, gemiddelde, SD,
betrouwbaarheidsinterval
- Independent samples output: Levene’s test voor gelijke groepen
- Bootstrap for Independent Samples Test: vertelt ons het gemiddelde verschil en
betrouwbaarheidsinterval voor de bootstrap

Exact Approach in SPSS
1. Nonparametric tests
2. Legacy dialogs
3. [kies test] vb. crosstabs
4. Variabelen kiezen
5. Exact
6. Select exact & set time limit
7. Statistics
8. Chi square
9. Measure of association kiezen
10. Cell display
11. Column
12. Paste

Interpretatie van Exact Approach in SPSS
- Case Processing Summary: aantal cases die zijn gebruikt
- Crosstabulation: proporties van de snoepjes
- Chi suare tests: fishers exact test → p-waarde voor 2-sided test → dus significant
- Association measures: hoe sterk is de relatie (effectgrootte)

Hoofdstuk 3
Als we de populatiewaarde kennen, kunnen we de sample distribution benaderen met een
theoretical possibility distribution zoals een normaalverdeling. In de realiteit weten we alleen
wat we in onze steekproef hebben.
Gebied onder de normaalverdeling is de kans dat we een steekproef trekken met een
gemiddeld gewicht van een snoepje binnen die range.

- De waarschijnlijkheid (probability) heet het betrouwbaarheidsinterval (confidence
level)
- Het bereik (width) van het interval noemen we precision. Dit waarderen we want we
willen een precieze verwachting

4
R162,51
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Get to know the seller
Seller avatar
ahderuig

Get to know the seller

Seller avatar
ahderuig Vrije School Noord Holland, locatie Geert Groote College
Follow You need to be logged in order to follow users or courses
Sold
0
Member since
7 year
Number of followers
0
Documents
3
Last sold
-

0,0

0 reviews

5
0
4
0
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can immediately select a different document that better matches what you need.

Pay how you prefer, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card or EFT and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions