100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
College aantekeningen

Colleges aantekeningen statistiek blok 4.4

Beoordeling
-
Verkocht
-
Pagina's
159
Geüpload op
28-09-2020
Geschreven in
2019/2020

Uitgebreide aantekeningen van de colleges, inclusief ondersteunende afbeeldingen, voorbeelden, berekeningen, etc. Dit is alles wat in het blok besproken is, en daardoor ook alles wat je nodig hebt om je tentamen ruimschoots te behalen.

Meer zien Lees minder











Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
28 september 2020
Aantal pagina's
159
Geschreven in
2019/2020
Type
College aantekeningen
Docent(en)
Onbekend
Bevat
Alle colleges

Voorbeeld van de inhoud

Colleges statistiek 4.4




1

,College 1 – Introductiecollege (8 januari 2020)
Er is geen formuleblad, omdat je niet veel hoeft te rekeken. Je gaat juist vooral aan de slag met de
uitkomsten van de analyses en berekeningen, hoe je die moet interpreteren. Formules moet je
voornamelijk begrijpen.

Maandag/donderdag → tutorial groups en lectures
Woensdag → tutorial lecture en SPSS meeting

Je krijgt dit blok veel vrijheid, maar er wordt wel een proactieve houding verwacht. Het is je eigen
verantwoordelijkheid dat je voorbereid bent etc.

FIELD CHAPTER 2 – Everything you ever wanted to know about statistics
We gebruiken statistiek om te controleren, voorspellen en begrijpen van dingen. Er is geen
mogelijkheid om onderzoek te doen zonder statistiek tegenwoordig. Met statistiek kan je iets doen
wat je zonder statistiek niet kan doen: generaliseren. Je gaat iets algemeners zeggen dan alleen over
wat je hebt gemeten. Je bent namelijk niet geïntereseerd in een specifieke beschrijving van wat je in
deze specifieke omstandigheden hebt gevonden in deze specifieke groep, maar je wil het breder
stellen.
We gebruiken de tools om te beschrijven hoe we denken dat de realiteit er uitziet (regressie, lineair
patroon, normaalverdeling, etc.). Alles in dit blok berust op de normaalverdeling en de
regressieanalyse. Je beschrijft er kenmerken van bijvoorbeeld mensen mee. Je probeert er een
simpelere beschrijving mee te geven van een complex kenmerk en als je dat goed doet, kan je dingen
in de toekomst voorspellen.
Als je model heel erg complex is (superveel voorspellers toegevoegd, etc.), dan zal je uiteindelijk je
resultaat perfect kunnen voorspellen. Maar dat betekent niet dat je het fenomeen ook begrijpt. Er is
een verschil tussen accuraatheid en complexheid. Een supersimpel model kan heel accuraat zijn.

Een model is een bepaald perspectief op een fenomeen. Als je geïnteresseerd ben tin iets, focus je
alleen daarop. Afhankelijk van je vraag, neem je een ander perspectief aan.

Statistische modellen
Een model is een toy example die aspecten beschrijven van iets complexers.
• In de statistiek gebruiken we modellen om te representeren wat er in de echte wereld
gebeurt
• Modellen bestaan uit parameters en variabelen. Dit is een belangrijk onderscheid:
o Variabelen zijn gemeten constructen (bijv. moeheid) en variëren tussen mensen in de
steekproef. Het zijn eigenschappen die kunnen verschillen en die we kunnen
manipuleren.
o Parameters worden geschat vanuit de data en representeren constante relaties
tussen variabelen in het model. Ze beschrijven de vorm van het model. Bijvoorbeeld
de mean of standaarddeviatie. Parameters zijn de facetten die we zouden willen
beschrijven of uitleggen.
• We berekenen de parameters uit het model in de steekproef om de waarde in de populatie te
kunnen schatten.

VOORBEELD
Als je de lengte moet schatten van iemand in het klaslokaal, zonder die persoon te zien. Wat zou je
dan zeggen?
➔ 1.70, want dat is ongeveer het gemiddelde. Als je helemaal niks over de persoon weet (nooit
gezien), dan doe je de ‘best guess’ en dat is de mean.


2

,Als je zou weten dat het een jongen was, dan zou je schatting iets hoger worden. Was het een vrouw,
dan werd de schatting iets lager.
Wat we hier aan het doen zijn, is het vormen van een model.

VOORBEELD
- Effecten van CGT in ernstig vermoeide ziektevrije kankerpatiënten
- RCT: interventie tegenover wachtlijst controle. Er is een pre- en post meting van de primaire
uitkomst: ernst van vermoeidheid (CIS)
- Resultaten: patiënten in de interventie conditie rapporteerden een significant grotere
vermindering in vermoeidheidsernst dan patiënten in de wachtlijst conditie.
- Klinisch relevante verandering (CIS) = 8

Doe alsof we geïnteresseerd zijn in het samenvatten van het therapie-effect in de behandelgroep.
Bereken de ‘verbetering in vermoeidheid’-scores. De gemiddelde verbetering is een model voor de
true effect van CBT in de behandelgroep.
Het model kan uitgeschreven worden als 𝑣𝑒𝑟𝑚𝑜𝑒𝑖𝑑ℎ𝑒𝑖𝑑𝑣𝑒𝑟𝑏𝑒𝑡𝑒𝑟𝑖𝑛𝑔 (𝑋)𝑖 = 𝑏 + 𝑒𝑟𝑟𝑜𝑟𝑖 . Dit model
stelt dat je ervanuit gaat iedereen dezelfde verbetering heeft (maakt niet uit hoe oud je bent, welk
geslacht, etc.). Wellicht heb je meer variabelen nodig in het model, maar dit is in principe een prima
model.
∑𝑛 𝑥
De parameter b wordt geschat met 𝑏 = 𝑀𝑒𝑎𝑛(𝑋̅) = 𝑖=1 𝑖. 𝑛

Het gemiddelde is een model van wat er in de echte wereld gebeurt: de typische score. Het is geen
perfecte representatie van de data. hoe kunnen we beoordelen hoe goed het gemiddelde de realiteit
representeert?
Je wil de model fit bepalen: hoe goed is dit model? Dat kan door te kijken naar de variabiliteit in de
dataset. Als dit nul zou zijn, zou dit simpele model perfect zijn. Maar dat is in de echte wereld niet zo,
omdat er veel factoren effect hebben. Je vindt error. Je kijkt naar het aantal afstandjes tot het model,
dat geeft een indicatie van hoe goed het model is.




Hoe kwantificeer je de fit in deze modellen (links en rechts)?
Je kan de variantie bepalen (=de gekwadrateerde, gemiddelde afwijking van de punten van het
gemiddelde (de voorspelling)). Is er geen variability dan is het heel goed, anders minder.

Hoe bepaal je die variabiliteit? → kijk naar de sum of squares of kijk naar de standaarddeviatie.
• Sum of squares = je hebt waardes, je hebt het gemiddelde en die waardes wijken af van het
gemiddelde. Als je alles afwijkingen kwadrateert en optelt, dan heb je de sum of squares. Je
moet het wel kwadrateren, anders kom je uit op nul als je ze optelt. Hoe hoger de SS, hoe
meer spreiding er is.
o Het is niet bruikbaar als een samenvattende maat, want het hangt af van de sample
size. Om het onafhankelijk te maken, kan je de mean squared error gebruiken. Daarbij
wordt de SS gedeeld door de degrees of freedom, waardoor het niet meer afhankelijk
is van de sample size. Je doet N-1, omdat je de populatie mean wil schatten met de

3

, sample mean. Je gebruikt de mean van de sample, dat is een meetellende waarde.
Het is een ‘unit of information’, daarom doe je 1 df weg.




Wanneer het model het gemiddelde is, dan is de MSE de variantie. Als het model complexer is, dan is
dat niet zo (komt later in het blok). De wortel van de variantie (s2) is de standaarddeviatie (s).




Wanneer je de raw scores niet weet, kan je ook niet weten of dit grote of kleine waardes zijn. Als je
het getal wil interpreteren, moet je nog iets meer doen. Je neemt in dit geval de wortel van de
variantie en dat kan je vergelijken met de ruwe datascores.
➔ Als je een 10-punttschaal zou hebben, dan wijken mensen gemiddeld 1.58 units af van het
gemiddelde op deze schaal.

Standaarddeviatie = de meest typische afwijking, het gaat om de verschillen tussen scores.




Het linker plaatje heeft een grote standaarddeviatie, het rechter plaatje een kleinere. Er is altijd een
centrale waarde.

Als alle waardes gelijk zijn (even vaak voorkomen in de sample), dan kan je niet de normale statistiek
toepassen waar we aan gewend zijn. Er is namelijk geen typische waarde. Het berekenen van de mean
is alleen nuttig als er een centrale waarde is die alle mensen representeert.


4

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
esmeecoppoolse Erasmus Universiteit Rotterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
162
Lid sinds
8 jaar
Aantal volgers
111
Documenten
94
Laatst verkocht
9 maanden geleden

3,6

31 beoordelingen

5
8
4
9
3
10
2
1
1
3

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen