100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Class notes

Uitgebreide samenvatting van Hoorcolleges Data-analyse 2021

Rating
-
Sold
-
Pages
45
Uploaded on
31-05-2021
Written in
2020/2021

Uitgebreide samenvatting van de Hoorcolleges van het vak Data-analyse 2021. Hierin staan voorbeelden van situaties met een uitleg erbij die in de hoorcolleges is gegeven. Er staat zo min mogelijk puntsgewijs uitgelegd hoe en wat, dus alles staat er zo uitgebreid mogelijk zodat het hopelijk begrijpelijk is om terug te lezen na de hele cursus gevolgd te hebben. Er staan zes colleges in uitgelicht met de volgende onderwerpen: (1). Inleiding (wat is de bedoeling van de cursus?): hierin wordt uitgelegd wat Conversion, Merge en Restructure betekenen; (2). Soorten analyses: onderzoeken van assumpties, waarin wordt uitgelegd wat lineariteit, normaliteit en homogeniteit inhouden en hoe je deze kunt onderzoeken; (3). Power en Effect size, de poweranalyse wordt uitgelegd, wat beïnvloed power?, hoe werk je met power?; (4). Contrasten, het gaat hier over de Familywise error rate (FWER) en de False discovery rate (FDR), verschillende protectie procedures worden toegelicht, en verschillende contrasten worden uitgelegd en vergeleken met elkaar; (5). Generalized Linear Models, binaire variabelen worden uitgelegd, het verschil tussen GLM en GLZ (generalized linear models) wordt duidelijk, linkfuncties en distributiefuncties worden uitgelicht, de keuze van verdelingen wordt duidelijk en er komen verschillende processen aan de orde (Bernoulli en Poisson proces), daarna worden nog voorbeelden van vier belangrijkste verdelingen weergegeven, met aan het einde hiervan nog een voorbeeldopgave om te kijken of je de vier belangrijkste verdelingen een beetje snapt; (6). Resumé college: dit is het laatste college waarin nog wat handige tips staan uitgelicht die in principe al wel zijn besproken, maar nu staat het meeste nog een keer bij elkaar.

Show more Read less
Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
May 31, 2021
Number of pages
45
Written in
2020/2021
Type
Class notes
Professor(s)
Jules ellis & inge rabeling
Contains
All classes

Subjects

Content preview

Samenvatting colleges Data Analyse 2021
Radboud Universiteit Nijmegen – Colleges van Jules Ellis

College 1 – Wat willen we met deze cursus?
Achtergrond
Leerplan onderzoeksvaardigheden: de analyse van sterke en zwakke punten.
Zwakke punten: er is weinig onthouden van statistiek2 meestal, omdat er in de tussentijd niet veel
meer mee is gedaan; het tweede ding is dat veel studenten weinig probleemoplossend vermogen
hadden en dus snel stopten met het zelf oplossen van casussen; studenten hadden ook maar weinig
verschillende vragen, dus een minder onderzoekende houding; de lange-termijn commitment.
Verbeteracties voor deze zwakke punten: o.a. de opbouw van deze cursus, meer op
onderwijsmethode gericht, i.p.v. op hoe het tentamen eruit komt te zien.

Cursusdoelen
• Automatiseren van SPSS-vaardigheden
• Ontwikkelen van onderzoekende houding bij
data-analyse
• Vergroten van leervermogen in data-analyse

Studenten zouden nu op het niveau ‘bewust vaardig’
moeten zitten. Daarop zouden studenten sowieso moeten
zitten zodra ze statistiek2 voldoende hebben afgerond.
Waar studenten naartoe moeten gaan is ‘onbewust
vaardig’. Dit kun je vergelijken met autorijden: je kunt een
gesprek voeren met iemand die naast je zit, een radio
desnoods tegelijkertijd aan hebben staan en ondertussen
voer je alle handelingen zoals sturen, schakelen, etc. uit.
Om op dit niveau te komen worden er weer veel opgaven
met bekende procedures gegeven die opgelost moeten
worden. Tegelijkertijd krijg je ook moeilijkere problemen
gegeven, alleen dan kun je op een hoger niveau komen.
Hierbij moet je de data op de goede plaats krijgen
(“boekhouden”), je krijgt nieuwere vormen van de analyse
en je krijgt uiteindelijk geheel nieuwe analyses.

In de onderzoekende houding is het de bedoeling dat je veel vragen moet gaan stellen om alles uit de
data te kunnen halen wat erin zit. Dus: geen genoegen nemen met 1 analyse; alles uit de data halen
wat erin zit; zelf vragen bij de uitkomsten stellen; deze vragen onderzoeken met nieuwe analyses; met
meerdere analyses belichten.


Het vergroten van leervermogen betekent ook dat je problemen kunt oplossen. Dit is een kwaliteit die
goed is om te ontwikkelen, ook voor de rest van je leven. Eerst heb je een obstakel, en daar moet je
mee zien te dealen. Zou je dan steeds dezelfde strategie moeten blijven gebruiken als het de eerste
paar keer niet lukt? → Nee, het is de bedoeling om meerdere strategieën te gebruiken totdat het wel
lukt.




1

,Datapreparatie
Normaal heb je een standaard dataset in SPSS gegeven, doe je
een analyse en krijg je een output. Bij data-analyse zal dit toch
wat anders gaan dan gewend bij Statistiek2. De volgende
mogelijkheden die zijn weergegeven staan allemaal in de balk
bovenin SPSS. Conversie staat wel bij het file-menu.
1. Conversion
2. Merging
3. Aggregate
4. Restructure

1. Conversion (Open, filetype)
Je kunt beginnen met data die je in Excel hebt ingevoerd en die
je wilt omzetten naar een SPSS-bestand. De andere
mogelijkheid is dat je een tekstbestand hebt die je wilt inlezen
in SPSS. Van Excel naar SPSS is niet zo moeilijk → file → open,
file type aangeven → bestand opzoeken (eventueel aangeven welk blad uit excel gelezen moet
worden) → data staat in SPSS. Met tekstbestanden ligt dit moeilijker. De bestanden moeten een .csv
naam hebben. Het is moeilijk te bepalen waar welke tekst ligt gecodeerd. Deze .csv bestanden heten
in SPSS termen ‘delimited’: tussen de verschillende stukjes data staat steeds een
symbool/karakter/letter, wat aangeeft dat je op een nieuw datapunt komt. Er kunnen verschillende
manieren gebruikt worden om de scores voor een subject aan te geven. Met een comma value zijn op
de eerste regel de getallen: 1, 238, 275 en 22 de waarden voor subject 1. Voor subject 2 zijn de
waarden: 1, 8 , 9 en 7. Aangezien Nederlanders een comma normaal gebruiken om een decimaal aan
te geven kan er ook gewerkt worden met puntcomma’s en een tab tussen de waarden. Naast
delimited, bestaat er ook een fixed manier. Hier staan spaties tussen de verschillende waarden om
duidelijk te maken dat het verschillende waarden zijn en ze niet bij elkaar horen. Er is ook een fixed
manier waarop alle getallen juist allemaal achter elkaar geplakt zijn.




2. Merge (het koppelen van bestanden)
Twee bestanden samenvoegen tot één bestand. Dit kan
op twee manieren: via Add cases, en Add variables. Bij Add
cases heb je eigenlijk twee bestanden die gaan over
verschillende subjecten (eentje over chinezen en de
andere over nederlanders, maar deze wil je samenvoegen
tot één bestand waarin alles staat over zowel chinezen als
nederlanders). Je moet dan wel bij allebei de bestanden
dezelfde variabelen hebben gemeten. De andere
mogelijkheid is met Add variables. Hierin wil je twee


2

, bestanden juist naast elkaar zetten. Dit gebruik je in een situatie waarin de gemeten dingen over
dezelfde personen gaan, maar er in beide bestanden allebei andere variabelen zijn gemeten van
diezelfde personen.

Add cases → de bestanden moeten identieke
variabele namen hebben.
Add variables → het bestand moet identieke
subjecten hebben, maar verschillende variabele
namen (id-variable is benodigd: een key-variable).
Zo’n key-variable moet uniek zijn, want anders zijn
de bestanden niet te koppelen!

Er zijn one to one merge Add variables & many to
one merge Add variables. Vooral bij many to one
kan er veel mis gaan.

Er zijn in SPSS numerieke en string
variabelen. De numerieke variabelen
worden gezien als waarden waarmee
gerekend kan worden, de string
variabelen zijn eigenlijk stukken tekst die
ook cijfers kunnen zijn, maar worden wel
gezien als pure tekst.




→ computer afsluiten als er zich een file
contention problem voordoet.

3. Aggregate (in het databestand variabelen toevoegen voor gemiddelde en
SD’s i.p.v. in de output)
Als je deze data niet als nieuwe variabelen wilt toevoegen in het
databestand, maar in een nieuw databestand, dan moet je via Aggregate
Data kiezen voor een ‘Create a new dataset’ en het een nieuwe naam geven.
Wat je dan krijgt is dat je alleen de variabelen die je wilde hebben in je
dataset dan in een nieuwe dataset krijgt, zonder de oorspronkelijke data uit
het oude bestand dat er al in stond.


4. Restructure (van breed naar lang maken of
andersom)
Dezelfde data kan lang worden weergegeven waarbij
iedere persoon meerdere rijen heeft voor zijn data: de
afhankelijke variabele staat in slechts één kolom. Maar
ook breed waarbij iedere persoon slechts één rij in
gebruik heeft waarin dezelfde data staan. Het heet
Cases into variables als je van lang naar breed gaat, en
het heet Variables into cases wanneer je van breed
naar lang gaat.


3

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
robinalink Radboud Universiteit Nijmegen
Follow You need to be logged in order to follow users or courses
Sold
52
Member since
6 year
Number of followers
45
Documents
31
Last sold
5 months ago

3.7

6 reviews

5
2
4
2
3
0
2
2
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions