Toegepaste Multivariate Analyse
Contents
1 SAS Viya...............................................................................................................................................1
1.1 Introductie....................................................................................................................................1
1.1.1 Opties in SAS..........................................................................................................................1
1.1.2 Databestanden......................................................................................................................1
1.1.3 Syntax....................................................................................................................................1
1.2 Basisbewerkingn...........................................................................................................................2
1.2.1 Importeren met proc import.................................................................................................2
1.2.2 Importeren met een data stap...............................................................................................3
1.2.3 Gegevens exporteren.............................................................................................................3
1.2.4 SAS output exporteren..........................................................................................................3
1.2.5 Wegschrijven in PPT...............................................................................................................4
1.3 Databeheer...................................................................................................................................4
1.3.1 Nieuwe databestanden maken..............................................................................................4
1.3.2 Bestanden samenvoegen.......................................................................................................5
1.3.3 Bestand kantelen...................................................................................................................5
1.3.4 Bestand aggregeren...............................................................................................................5
1.3.5 Selectie van variabelen..........................................................................................................5
1.3.6 Cases......................................................................................................................................6
1.3.7 Databeheer met variabelen...................................................................................................6
1.3.8 Werken met voorwaarden.....................................................................................................9
1.3.9 Lussen en arrays....................................................................................................................9
1.4 Analyses doen in SAS....................................................................................................................9
1.4.1 Ruwe data bekijken...............................................................................................................9
1.4.2 Sorteren van gegevens..........................................................................................................9
1.4.3 Tabellen maken...................................................................................................................10
1.4.4 Grafieken maken..................................................................................................................10
2 Structurele vergelijkingsmodellen.....................................................................................................10
2.1 Het doel......................................................................................................................................10
2.2 Vereisten voor SEM....................................................................................................................11
2.2.1 Interval meetniveau.............................................................................................................11
2.2.2 Geen missende waarden.....................................................................................................11
2.2.3 Multivariate normaliteit.......................................................................................................11
i
, 2.3 Padanalyse..................................................................................................................................11
2.3.1 Assumpties...........................................................................................................................11
2.3.2 Padanalyses met regressie (PROC REG)...............................................................................11
2.3.3 Een padmodel in structurele vergelijkingen........................................................................13
2.3.4 Padanalyse met PROC CALIS................................................................................................13
2.4 Confirmatieve Factoranalyse......................................................................................................20
2.4.1 Soorten factoranalyse..........................................................................................................20
2.4.2 Basisregels van Hatcher.......................................................................................................21
2.4.3 Van pijlenschema naar CALIS-programma...........................................................................22
2.4.4 Output.................................................................................................................................23
2.5 Structurele regressiemodellen....................................................................................................29
2.5.1 Basisregels (Hatcher)...........................................................................................................29
2.5.2 Het schatten van het meetmodel........................................................................................29
2.5.3 Het schatten van het structureel model..............................................................................29
2.5.4 Controle en interpretatie van het structureel model...........................................................31
2.5.5 SEM modellen vergelijken...................................................................................................33
3 Multilevel analyse..............................................................................................................................33
3.1 Inleiding en theorie.....................................................................................................................33
3.1.1 Wat is een multilevel-analyse?............................................................................................33
3.1.2 Geclusterde data..................................................................................................................33
3.1.3 OLS en clustering: foute manieren om met geclusterde data om te gaan...........................35
3.1.4 Van OLS-regressie naar multilevel model............................................................................36
3.1.5 Uitbreiding model................................................................................................................37
3.2 Overzicht Multilevel-modellen...................................................................................................38
3.2.1 Null random intercept model..............................................................................................38
3.2.2 Het random intercept model...............................................................................................39
3.2.3 Het fully random of random slopes model..........................................................................39
3.2.4 Fully random model met level-2 predictoren......................................................................40
3.3 Multilevel analyse in SAS............................................................................................................40
3.3.1 Fase 1: Voorbereiding - databeheer....................................................................................40
3.3.2 Fase 2: Variantie component modellen...............................................................................42
3.3.3 Fase 3: Random slopes testen.............................................................................................48
3.3.4 Fase 4: Verfijnen en afwerken.............................................................................................53
4 Longitudinale analyse........................................................................................................................56
4.1 Cross-sectioneel vs longitudinaal................................................................................................56
4.1.1 Soorten Longitudinaal..........................................................................................................56
ii
,4.2 Designs- causaliteit – experimenten...........................................................................................57
4.3 Wat zijn paneldata......................................................................................................................59
4.4 Modellen om paneldata te analyseren.......................................................................................59
4.4.1 Pooled model.......................................................................................................................59
4.4.2 Random effects model.........................................................................................................61
4.4.3 Fixed vs random...................................................................................................................62
4.4.4 MLE vs panel modellen........................................................................................................62
4.5 Fixed effects models (boek)........................................................................................................62
4.5.1 Introduction.........................................................................................................................62
4.5.2 Fixed effects modellen voor lineaire regressie.....................................................................64
iii
, 1 SAS Viya
PROC => keyword voor procedure
SGPLOT => SAS graphics plot
1.1 Introductie
1.1.1Opties in SAS
Starten met het commando OPTIONS
Linesize: regellengte voor output
Pagesize: # regels per blad
Nocenter: uitlijning
Nodate: datum in output
Log:
o Nosource: syntax wordt niet meer weergegeven
o Nonotes: geen notes (=enkel mededelend)
o Errors: aantal keer dat identitieke error in 1 programmaregel wordt weergegeven
o Nofmterr: onderdrukt errors wanneer formats ontbreken
1.1.2Databestanden
Databestanden = fysieke bestanden op server
Tijdelijke bestanden:
o Best practice = werken met tijdelijke bestanden => vermijd permanente
wijzigingen aan opgeslagen files
o worden in de WORK library geplaatst (geen prefix nodig)
o verwijderd bij afsluiten sessie
Verwijs naar databestanden via libraries of via volledig pad
Bestanden die open staan in programma kunnen niet gewijzigd worden (plots e.d. kunnen,
sort kan niet)
Bv “ess” = work
Ess.ess = verwijzing naar library ess dat gedefinieerd werd in libname commando
LIBNAME => aanmaken van library
Library: Gedeelde SAS map met databestanden waarnaar je kan verwijzen
Home: ruimte waar je bestanden kan opslaan voor eigen gebruik
SAS Contents: gedeelde ruimte om te werken aan bestanden
3 soorten bestanden:
.sas = sas syntax programma’s
.sas7bdat = data in sas formaat
.sas7bcat = SAS-cataloogbestanden (voor formatting)
1.1.3Syntax
Elke regel afsluiten met ;
Programmastap afsluiten met RUN
“=” teken bij definiëren van teksten (formats of labels)
Wordt in twee stappen uitgevoerd:
1
Contents
1 SAS Viya...............................................................................................................................................1
1.1 Introductie....................................................................................................................................1
1.1.1 Opties in SAS..........................................................................................................................1
1.1.2 Databestanden......................................................................................................................1
1.1.3 Syntax....................................................................................................................................1
1.2 Basisbewerkingn...........................................................................................................................2
1.2.1 Importeren met proc import.................................................................................................2
1.2.2 Importeren met een data stap...............................................................................................3
1.2.3 Gegevens exporteren.............................................................................................................3
1.2.4 SAS output exporteren..........................................................................................................3
1.2.5 Wegschrijven in PPT...............................................................................................................4
1.3 Databeheer...................................................................................................................................4
1.3.1 Nieuwe databestanden maken..............................................................................................4
1.3.2 Bestanden samenvoegen.......................................................................................................5
1.3.3 Bestand kantelen...................................................................................................................5
1.3.4 Bestand aggregeren...............................................................................................................5
1.3.5 Selectie van variabelen..........................................................................................................5
1.3.6 Cases......................................................................................................................................6
1.3.7 Databeheer met variabelen...................................................................................................6
1.3.8 Werken met voorwaarden.....................................................................................................9
1.3.9 Lussen en arrays....................................................................................................................9
1.4 Analyses doen in SAS....................................................................................................................9
1.4.1 Ruwe data bekijken...............................................................................................................9
1.4.2 Sorteren van gegevens..........................................................................................................9
1.4.3 Tabellen maken...................................................................................................................10
1.4.4 Grafieken maken..................................................................................................................10
2 Structurele vergelijkingsmodellen.....................................................................................................10
2.1 Het doel......................................................................................................................................10
2.2 Vereisten voor SEM....................................................................................................................11
2.2.1 Interval meetniveau.............................................................................................................11
2.2.2 Geen missende waarden.....................................................................................................11
2.2.3 Multivariate normaliteit.......................................................................................................11
i
, 2.3 Padanalyse..................................................................................................................................11
2.3.1 Assumpties...........................................................................................................................11
2.3.2 Padanalyses met regressie (PROC REG)...............................................................................11
2.3.3 Een padmodel in structurele vergelijkingen........................................................................13
2.3.4 Padanalyse met PROC CALIS................................................................................................13
2.4 Confirmatieve Factoranalyse......................................................................................................20
2.4.1 Soorten factoranalyse..........................................................................................................20
2.4.2 Basisregels van Hatcher.......................................................................................................21
2.4.3 Van pijlenschema naar CALIS-programma...........................................................................22
2.4.4 Output.................................................................................................................................23
2.5 Structurele regressiemodellen....................................................................................................29
2.5.1 Basisregels (Hatcher)...........................................................................................................29
2.5.2 Het schatten van het meetmodel........................................................................................29
2.5.3 Het schatten van het structureel model..............................................................................29
2.5.4 Controle en interpretatie van het structureel model...........................................................31
2.5.5 SEM modellen vergelijken...................................................................................................33
3 Multilevel analyse..............................................................................................................................33
3.1 Inleiding en theorie.....................................................................................................................33
3.1.1 Wat is een multilevel-analyse?............................................................................................33
3.1.2 Geclusterde data..................................................................................................................33
3.1.3 OLS en clustering: foute manieren om met geclusterde data om te gaan...........................35
3.1.4 Van OLS-regressie naar multilevel model............................................................................36
3.1.5 Uitbreiding model................................................................................................................37
3.2 Overzicht Multilevel-modellen...................................................................................................38
3.2.1 Null random intercept model..............................................................................................38
3.2.2 Het random intercept model...............................................................................................39
3.2.3 Het fully random of random slopes model..........................................................................39
3.2.4 Fully random model met level-2 predictoren......................................................................40
3.3 Multilevel analyse in SAS............................................................................................................40
3.3.1 Fase 1: Voorbereiding - databeheer....................................................................................40
3.3.2 Fase 2: Variantie component modellen...............................................................................42
3.3.3 Fase 3: Random slopes testen.............................................................................................48
3.3.4 Fase 4: Verfijnen en afwerken.............................................................................................53
4 Longitudinale analyse........................................................................................................................56
4.1 Cross-sectioneel vs longitudinaal................................................................................................56
4.1.1 Soorten Longitudinaal..........................................................................................................56
ii
,4.2 Designs- causaliteit – experimenten...........................................................................................57
4.3 Wat zijn paneldata......................................................................................................................59
4.4 Modellen om paneldata te analyseren.......................................................................................59
4.4.1 Pooled model.......................................................................................................................59
4.4.2 Random effects model.........................................................................................................61
4.4.3 Fixed vs random...................................................................................................................62
4.4.4 MLE vs panel modellen........................................................................................................62
4.5 Fixed effects models (boek)........................................................................................................62
4.5.1 Introduction.........................................................................................................................62
4.5.2 Fixed effects modellen voor lineaire regressie.....................................................................64
iii
, 1 SAS Viya
PROC => keyword voor procedure
SGPLOT => SAS graphics plot
1.1 Introductie
1.1.1Opties in SAS
Starten met het commando OPTIONS
Linesize: regellengte voor output
Pagesize: # regels per blad
Nocenter: uitlijning
Nodate: datum in output
Log:
o Nosource: syntax wordt niet meer weergegeven
o Nonotes: geen notes (=enkel mededelend)
o Errors: aantal keer dat identitieke error in 1 programmaregel wordt weergegeven
o Nofmterr: onderdrukt errors wanneer formats ontbreken
1.1.2Databestanden
Databestanden = fysieke bestanden op server
Tijdelijke bestanden:
o Best practice = werken met tijdelijke bestanden => vermijd permanente
wijzigingen aan opgeslagen files
o worden in de WORK library geplaatst (geen prefix nodig)
o verwijderd bij afsluiten sessie
Verwijs naar databestanden via libraries of via volledig pad
Bestanden die open staan in programma kunnen niet gewijzigd worden (plots e.d. kunnen,
sort kan niet)
Bv “ess” = work
Ess.ess = verwijzing naar library ess dat gedefinieerd werd in libname commando
LIBNAME => aanmaken van library
Library: Gedeelde SAS map met databestanden waarnaar je kan verwijzen
Home: ruimte waar je bestanden kan opslaan voor eigen gebruik
SAS Contents: gedeelde ruimte om te werken aan bestanden
3 soorten bestanden:
.sas = sas syntax programma’s
.sas7bdat = data in sas formaat
.sas7bcat = SAS-cataloogbestanden (voor formatting)
1.1.3Syntax
Elke regel afsluiten met ;
Programmastap afsluiten met RUN
“=” teken bij definiëren van teksten (formats of labels)
Wordt in twee stappen uitgevoerd:
1