100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Class notes

Onderzoeksmethoden 3: Deeltentamen 1

Rating
-
Sold
8
Pages
34
Uploaded on
26-03-2023
Written in
2022/2023

Dit is een samenvatting van alle colleges met betrekking tot het eerste deeltentamen van Onderzoeksmethoden 3. Allereerst wordt de basis van statistiek besproken en vervolgens wordt er ingegaan op verschillende strategieën. Voorbeelden zijn de T-toets (ongepaard of gepaard), Correlatie, Simpele regressie, Multipele regressie, Mediatie, Moderatie, de Assumpties, Non-parametrische toetsen en de Factoranalyse. Op basis van deze samenvatting heb ik het tentamen in één keer gehaald.

Show more Read less
Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
March 26, 2023
Number of pages
34
Written in
2022/2023
Type
Class notes
Professor(s)
Joanne muller
Contains
All classes

Subjects

Content preview

DEELTENTAMEN 1:
31/10: HET IDEE ACHTER STATISTIEK 1
Algemene kenmerken binnen statistiek:
Unit of analysis is datgene waarover je informatie verzamelt; wie wordt er gerepresenteerd?
Variabelen zijn de gemeten kenmerken van een unit of analysis; bv. vragen in de vragenlijst.
Values zijn de scores van een unit of analysis op een variabele; individuele scores
Value labels laten zien wat de waarden betekenen.
De onafhankelijke variabele is de vermoedelijke oorzaak, de predictor. X; dit kunnen er meer zijn.
De afhankelijke variabele is het vermoedelijke gevolg, de outcome. Y.

Het is afhankelijk van je onderzoeksvraag wat X en Y zijn.

Meetniveaus
Categoriaal houdt in dat er verschillende groepen zijn in je data; iedereen valt binnen een groep (bv.
politieke partij) Continu houdt in dat er een schaal/as is in de data; je kan als persoon overal zitten
(bv. leeftijd).

Categoriaal heeft drie soorten: binair, nominaal en ordinaal.
Binair houdt in dat er twee categorieën of groepen zijn. (corona gehad? : ja/nee)
Nominaal houdt in dat er meer dan twee categorieën zijn. (voorkeur voor politieke partij?)
Ordinaal houdt in dat er een inherente ordening in zit (hoe vaak sporten in de week?)

Continu heeft twee soorten (onderscheid niet echt van belang):
Interval houdt in dat verschillen op schaal betekenisvol zijn.
Ratio houdt in dat er een betekenisvol nulpunt is.
 als je kan rekenen met verschillen op de schaal = interval/ratio.

Meetniveaus binnen SPSS: nominal, ordinal en scale.
Scale wordt gebruikt bij 7 of meer categorieën, anders ordinaal.
Binair en nominaal: nominal
Ordinaal: ordinal
Interval en Ratio: Scale

Centrummaten
1. Mediaan: middelste score van alle scores die je hebt
2. Modus: waarde met grootste frequentie
3. Gemiddelde: alle scores opgeteld, gedeeld door het aantal scores dat je hebt

Spreidingsmaten
1. Range: verschil tussen laagste en hoogste waarde
2. Standaarddeviatie is de gemiddelde afwijking van het gemiddelde

De standaarddeviatie laat 3 dingen zien:
De spreiding in de data, een maat voor de error of afwijking in de data en hoe representatief het
gemiddelde is voor de data.

,4/11: HET IDEE ACHTER STATISTIEK 2
Hypothesen
Een hypothese moet op een precieze manier geformuleerd zijn; specifieke formulering per toets
(één relatie of verschil per keer). Het moet toetsbaar zijn met data; een verwachte relatie tussen
twee variabelen. Verder moet het potentieel falsifieerbaar zijn; het is goed of fout, niet iets wat er
tussenin kan zitten.
Op basis van je hypothese twee tegengestelde opties:
H0: er is geen effect (ontkenning van je idee).
H1: er is wel een effect (dat wast je verwacht op basis van je idee).
Deze twee horen altijd bij elkaar. Sluit aan bij idee van falsifieerbaarheid.

Verschilhypothesen: gaat over het verschil tussen twee of meer groepen  T-toets.
Samenhangende hypothesen: samenhang tussen twee variabelen  Regressie

Eenzijdig betekent dat je een vermoeden hebt over de richting van het verband. Tweezijdig betekent
dat je daar geen vermoeden hebt over de richting van het verband. Dit heeft ook invloed op de
manier waarop je het toetst.

Significantie
Een hypothese is een idee over de populatie dat je gaat toetsen door middel van een steekproef om
zo iets over de hele populatie te zeggen. Het gaat erom de kans te bepalen dat je een effect in de
steekproef vindt, terwijl dat dat effect er in de populatie niet is.

Hoe groot is de kans in de steekproef deze waarden te vinden, terwijl eigenlijk de H0 waar is in de
populatie?
 Als die kans groot is, verwerpen we de H1; het effect is niet significant.
 Als die kans klein is, nemen we de H1 aan; het effect is significant.

Wanneer een onderzoek significant is, houdt dit in dat de kans groot is dat je het effect in de hele
populatie vindt. In statistiek is er vaak een foutmarge van 5%. Je checkt de significantie onder andere
door middel van de p-waarde. Als die kleiner is dan 0.05, dan is er sprake van een significant effect.
Als de standaarddeviatie groter wordt is, wordt de kans van een significant effect kleiner, omdat het
gemiddelde minder representatief is. De p-waarde wordt dan groter.

Verdelingen
Een frequentieverdeling laat zien hoe vaak verschillende scores voor komen.
De normaalverdeling: meeste mensen vlak rond gemiddelde en bij de uithoeken minder mensen.
We weten hierover dat wanneer een variabele normaal verdeeld is, dat 68% van de scores 1
standaarddeviatie onder het gemiddelde zit en 1 boven het gemiddelde. 95% valt 2
standaarddeviaties onder het gemiddelde en 2 boven het gemiddelde. 99% valt 3 standaarddeviaties
onder gemiddelde en 3 boven het gemiddelde.
De gestandaardiseerde normaalverdeling: een normaalverdeling door middel van z-scores.
Een z-score is de waarde van een observatie uitgedrukt in eenheden standaarddeviatie. Of: het
aantal standaarddeviaties dat een bepaalde waarde van een observatie is verwijderd van het
gemiddelde. Je standaardiseert de score ten opzichte van de andere scores. De verdeling van z-
scores heeft een gemiddelde van 0 en een standaarddeviatie van 1. Bij de normaalverdeling kan je
groffe dingen zeggen, maar bij de standaard normaalverdeling kan je de kansen van de specifieke z-
scores beter inschatten.

z-score = observatie (bv. IQ) – gemiddelde / standaarddeviatie

,De z-tabel geeft voor elke z-score aan wat de kans is op een bepaalde waarde. Met deze tabel kan je
voor elke z-tabel berekenen wat de kans is dat je erboven of eronder zit: ‘hoe groot is de kans op een
waarde die lager is dan een bepaalde z-waarde?’ Geeft dus waarden ‘eronder’ aan.
De tabel lees je als volgt: verticaal helemaal links moet je letten op het eerste cijfer en horizontaal
naar rechts het tweede cijfer achter de komma.

Deze scores zijn belangrijk voor de significantie: Hoe groot is de kans om in je sample een bepaalde
waarde (een effect, een verschil tussen twee groepen) te vinden, terwijl in werkelijkheid, in de
populatie, dat effect eigenlijk 0 is? Met z-scores kun je die kansen achterhalen, omdat je de originele
waarden van je eigen variabele omzet in gestandaardiseerde waarden met een gemiddelde van 0 en
een standaarddeviatie van 1.

Voorbeeld:
Wat is de kans dat iemand een IQ van hoger dan 103 heeft?
Iemand met dit IQ krijgt een z-score van: 103 (observatie)-100 (gemiddelde) / 15 (sd) = 0.20.




Belangrijke waardes:
In standaard normaalverdeling:

- De middelste 95% van de waarden ligt tussen z-scores van -1.96 en 1.96
- De middelste 99% van de waarden ligt tussen z-scores van -2.58 en 2.58
- De middelste 99.9% van de waarden ligt tussen z-scores van -3.29 en 3.29

Deze drie waarden komen vaker terug (1.96, 2.58 en 3.29).

, Populatie en steekproef
Stel dat je een oneindig aantal steekproeven zou trekken uit een populatie. Je vindt in zo’n
steekproef dan steeds een net iets ander gemiddelde (en sd). Al die gemiddelden vormen een
nieuwe verdeling: de steekproevenverdeling. De imaginaire steekproevenverdeling heeft een eigen
gemiddelde en eigen standaarddeviatie, deze noemen we de standard error (=standaarddeviatie van
de steekproevenverdeling).

De centrale limietstelling levert theoretisch bewijs dat als een steekproef random gekozen is en
meer dan dertig casussen heeft, we de eigenschappen van de normale verdeling kunnen gebruiken
om aan de hand van de steekproef schattingen te maken over de populatie.

Die steekproevenverdeling is fictief, die doe je niet echt en die weten we dus eigenlijk niet. Volgens
de centrale limietstelling kun je met de standaarddeviatie van de steekproef gebruiken om de
standard error te berekenen. Een grote standaard error betekent kleinere kans op significant effect.
Als de standaarddeviatie van de steekproef groter wordt, wordt de standaard error ook groter (en de
kans op vinden van significant effect wordt kleiner). Als de steekproef groter wordt, wordt de
standaard error kleiner.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
charlottedunsbergen Universiteit van Amsterdam
Follow You need to be logged in order to follow users or courses
Sold
17
Member since
3 year
Number of followers
7
Documents
3
Last sold
1 year ago

5.0

1 reviews

5
1
4
0
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions