ANALYSIS
BLOCK VII: M&S III
,VBA EXCEL HvA AVIATION
INHOUDSOPGAVE
1.1 WS: INTRODUCTION TO BIG DATA & SPSS................................................................................................ 3
1.2 WS: DATA ANALYSIS IN SPSS.................................................................................................................... 4
2.1 WS: DATA VISUALIZATION........................................................................................................................ 5
2.2 WS: LINEAR REGRESSION.......................................................................................................................... 6
3.1 WS: MULTIPLE LINEAR REGRESSION....................................................................................................... 11
3.2 WS: ASSUMPTIONS AND BIASES............................................................................................................. 12
4.1 WS: BINARY LOGISTIC REGRESSION........................................................................................................ 13
4.2 WS: MULTINOMIAL LOGISTIC REGRESSION............................................................................................. 16
5.1 WS: ORDINAL LOGISTIC REGRESSION...................................................................................................... 19
6.1 WS: DECISION TREE................................................................................................................................ 21
EXTRA.......................................................................................................................................................... 23
AMSTERDAM UNIVERSITY OF APPLIES SCIENCES
, VBA EXCEL HvA AVIATION
1.1 WS: INTRODUCTION TO BIG DATA & SPSS
In dit blok wordt er met SPSS, oftwel ‘Statistical Package for the Social Sciences’,
gewerkt. Zoals de naam al zegt is het statistische software die wordt gebruikt bij sociale
wetenschappen. Daarnaast kan het ook worden ingezet bij marktonderzoek, marketing
organisatoren of voor de overheid. In de luchtvaart wordt de software voornamelijk
gebruikt voor marktonderzoek of de analyse van operaties, zoals de relatie tussen
grondvoertuigen of de impact van luchthavendesign op de operationele prestaties. Zo’n
beetje alles dat data genereert kan geanalyseerd worden.
SPSS wordt vaak verkozen boven Excel gezien de (1) basisfuncties van SPSS sneller en
gemakkelijker te gebruiken zijn. Daarnaast beschikt SPSS over een (2) wijder scala
grafieken en tabellen en is het (3) gemakkelijker om statistische resultaten te vinden.
SPSS beschikt over 3 Windows: Data Window, Syntax Window en Output Window. De
Data Editor wordt gebruikt om data in te voeren of te bewerken (.sav). Deze bestaat uit
de Data View, wat gebruikt wordt om data in te voeren en de Variable View, wat gebruikt
wordt om de variabele toe te lichten. De eerste stap bij het invoeren van data is om de
variabele te benoemen in de Variable View en vervolgens in de Data View in te voeren.
In de Output Window worden de resultaten weergegeven (.spv) en in de Window Syntax
editor kunnen codes worden ingevoerd (.sps).
De beste manier om te oefenen met SPSS is door het gebruik van een syntax, oftewel zelf
codes schrijven. Het voordeel hieraan is dat je exact weet welke stappen je gedaan hebt
en in welke volgorde, dat als er fouten zijn gemaakt in de codes deze makkelijk en snel
verholpen kunnen worden. Bij het tentamen wordt niet gevraagd om zelf een syntax-code
te schrijven, maar wel om deze te gebruiken. Met behulp van een syntax kan een
bepaalde handeling meerdere keren achter elkaar worden uitgevoerd, wat als voordeel
heeft dat het tijd bespaart.
Binnen SPSS kan handmatig de data worden ingevoerd in het window Data Editor, maar
er kan ook een bestaand document met data worden ingevoerd. Dit kan gedaan worden
(1) wanneer SPSS opstart met ‘open another file…’ of via ‘File -> Open -> Data’. Om het
op deze manieren te openen is het nodig dat het document eindigt met .sav, gezien het
programma anders het document niet herkent. Met de optie ‘paste’ de syntax in het
SPSS-document geplakt. Door deze vervolgens uit te voeren, wordt de data ingevoerd.
Let hierbij wel op dat de juiste gegevens worden doorgegeven die SPSS vraagt, zoals het
teken om decimalen aan te geven etc.
Om met SPSS data te kunnen gebruiken voor analyses is het nodig dat woorden (oftewel
strings) worden verandert in getallen, aangezien met woorden niet gerekend kan worden.
In een van de eerste opgaves krijgen de variabelen ‘lecturer’ en ‘student’ een 1 of 2
toegewezen. Onder ‘value’ wordt de waarde toegekend (1, 2) en onder ‘label’ de
variabele. In dit geval lecturer’ of ‘student’.
De variabele(n) die worden gebruikt in o.a. SPSS kunnen worden onderverdeeld door
middel van de Level of Measurement. Deze zijn hieronder weergegeven samen met de
meetniveau ’s, Scale of Measurement. Voor SPSS is de scale of measurement het
belangrijkst en wordt deze toegewezen aan elke variabele.
Nominaal - niet geordend, niet berekenbaar
Which one? What kind?
(nominal) - VB: geslacht, oogkleur etc.
Ordinaal - geordend, waardes weergeven een volgorde What order?
When?
AMSTERDAM UNIVERSITY OF APPLIES SCIENCES