Inhoud
1. Hypotheses ....................................................................................................................................................................... 2
2. Analyse missing data......................................................................................................................................................... 4
2.4 SOORTEN MISSING DATA ................................................................................................................................................ 6
3. Correlaties ............................................................................................................................................................................ 10
4. Vorm en symmetrie .............................................................................................................................................................. 11
4.1 BOXPLOT........................................................................................................................................................................ 11
4.1 DESCRIPTIVES ................................................................................................................................................................ 11
4.3 EXPLORE ........................................................................................................................................................................ 12
4.4 FREQUENCIES ................................................................................................................................................................ 12
5. Dummy codering .................................................................................................................................................................. 13
6. Stochastische onafhankelijkheid .......................................................................................................................................... 14
7. Regressie .............................................................................................................................................................................. 15
7.1 ASSUMPTIES NAGAAN .................................................................................................................................................. 15
7.2 *INTERPRETATIE P_P PLOT ........................................................................................................................................... 18
7.2 OPLOSSEN VAN ONVOLDANE ASSUMPTIES ................................................................................................................. 18
1: ENKELVOUDIGE LINEAIRE REGRESSIE .............................................................................................................................. 19
2: MEERVOUDIGE REGRESSIE .............................................................................................................................................. 20
7.3 APA ............................................................................................................................................................................... 21
7.4 INTERPRETATIE VAN DE COËFFICIENTEN...................................................................................................................... 22
7.5 VARIABELEN CENTREREN ROND HET GEMIDDELDE .................................................................................................... 22
3: BINAIRE LOGISTISCHE REGRESSIE .................................................................................................................................... 24
7.6 VOORBEREIND WERK LOGISTISCHE R .......................................................................................................................... 24
4: MEERVOUDIGE LOGISTISCHE REGRESSIE ......................................................................................................................... 27
APA ...................................................................................................................................................................................... 27
5: MULTINOMIAAL LOGISTISCHE REGRESSIE ....................................................................................................................... 28
APA ...................................................................................................................................................................................... 28
8. Anova.................................................................................................................................................................................... 31
1:ONE-WAY ANOVA ............................................................................................................................................................. 33
AKA ongepaarde/ onafhankelijke t-test .............................................................................................................................. 33
2: TWO-WAY ANOVA/ FACTORIËLE ANOVA ......................................................................................................................... 37
3: ANCOVA ........................................................................................................................................................................... 41
4: REPEATED MEASURES ANOVA ......................................................................................................................................... 43
5: MIXED DESIGN ANOVA .................................................................................................................................................... 46
9. Factoranalyse ........................................................................................................................................................................ 48
9.1 PCA ................................................................................................................................................................................ 49
10. Clusteranalyse .................................................................................................................................................................... 54
1
,1. Hypotheses
ANALYSE HYPOTHESES
ENKELVOUDIGE REGRESSIE H0: βi = 0
Ha: βi ≠ 0
MEERVOUDIGE REGRESSIE H0: β1 = β2 = … = 0
Ha: minstens 1 βi is verschillend van 0
LOGISTISCHE REGRESSIE H0: β1 = β2 = β3 = β4 = 0
Ha: βi ≠ 0
Ten minste 1 van de predictors 1,2,3 of 4 is gerelateerd aan
de afhankelijke variabele y
ONE WAY ANOVA H0: µ1 = µ2
Ha: µ1 ≠ µ2
TWO WAY ANOVA H0: µ1 = µ2 = … = µi
Ha: er is minstens 1 gemiddelde dat significant verschilt van
de anderen
REPEATED MEASURES H0: µ1 = µ2 = … = µi
Ha: er is minstens 1 gemiddelde dat significant verschilt van
de anderen
MIXED DESIGN ANOVA H0: Er is geen verschil tussen groepen en geen verschil over
tijd of condities.
Ha: Er is een verschil tussen groepen, over tijd, of een
interactie-effect.
FACTORANALYSE H0: De geobserveerde variabelen zijn niet samen te vatten in
onderliggende factoren
Ha: De geobserveerde variabelen kunnen gestructureerd
worden in onderliggende factoren.
CLUSTERNALAYSE H0: De objecten vormen geen natuurlijke clusters in de data.
Ha: De objecten vormen wel natuurlijke clusters in de data.
2
,3
, 2. Analyse missing data
2.1 VISUELE INSPECTIE
➔ Zijn er vreemde zaken in de data?
o Missings → Puntjes/ ontbrekende data
o Logische waarde? → Codeerfouten? = Hercoderen p9 - WPO 1
o Vorm van de verdeling
➢ Symmetrisch = gemiddelde en standaardafwijking rapporteren
o Gewogen gemiddelde → Data > via weight cases
= voor wanneer sommige waarden belangrijker zijn dan andere,
bijvoorbeeld gemiddeld inkomen van de stad waar rekening
gehouden wordt met de omvang bevolking per gemeente.
➢ Assymetrisch;
• 5-getallensamenvatting;
1. Minimum (kleinste waarde)
2. Eerste kwartiel (Q1) (25% van de data is kleiner dan deze
waarde)
3. Mediaan (Q2) (middelste waarde, 50% is kleiner)
4. Derde kwartiel (Q3) (75% van de data is kleiner dan deze
waarde)
5. Maximum (grootste waarde)
• Boxplot
o Simple: bv uitschieters per continent → gebruik indien
mogelijk de “de label by” functie om duidelijk uitschieters op
te sporen.
o Clustered: bv per continent twee tijdstippen met elkaar
vergelijken
o Factor levens together: alle groepen op 1 plot →Je wil
groepen direct visueel vergelijken op één variabele, Je hebt
één afhankelijke variabele en één onafhankelijke
categorische variabele (factor), Je wil verschillen in centrale
tendens of spreiding tussen de niveaus zien.
o Factor separately → Je hebt meer dan één factor
(bijvoorbeeld conditie en groep) en wil zien hoe de boxplots
er binnen combinaties uitzien, Je wil interacties onderzoeken
of subgroepen apart bekijken
• Uitschieters bespreken
o Wil je voor elke case kijken, hoeveel data er mist;
1. Transform > count values
2. Alle numerieke variabelen in de variabele blok plaatsen
3. Define values > system or using missing aanvinken + add
4. Data view > nieuwe variabele op scale niveau zetten
5. Analyse → tables → custome tables → rij = variabelen
slepen en hetzelfde voor kollommen met missings →
summerie stat. = count
4