- Slides toledo
- Studiewijzer:
o Hoorcolleges (opnames beschikbaar)
o P&P oefensessies = online zelfstudie, oefeningen zelf maken
Vragen forum: ‘discussies’ Deadline!
worden beantwoord op responsiecollege
Verdiepingsoefeningen = GEEN leerstof
o R-modules: “R-studio”
zelfstudiemodules online (vragen forum)
R-sessies over het semester 3 v/d 20 punten
= openboek
- Studiemateriaal:
online cursus+ slides+ oefensessies+ module 0+ R-modules
geen GRT!!!
R-software
formularia & kanstabellen gegeven!!
- Evaluatie:
schriftelijk: alles = hoorcolleges + oefensessies + R-output kunnen
lezen!
o Inzicht en berekening
o Inzicht en toepassing theorie
o Theorie
R-testen = cumulatief module 1 & 2 te kennen voor module 3
,H1: Van probleemstelling naar data-
analyse
1.1 Doel van statistiek
Statistiek overal “dataficatie” (strava, smartwatch, …)
via dataprojecten
“data= nieuwe olie” wie data bezit, bezit kennis
Inhoudelijke kennis (social science) + computerwetenschap + kwantitatieve
methode = social data science
1.2 Doel van data-analyse
Def. Data-analyse
= toepassen van statistische methoden in een bepaald domein
= Kunst & wetenschap v/h verzamelen, organiseren, presenteren, analyseren
& interpreteren van data met als doel inzicht verwerven op basis van deze
data
- Inzicht: onderzoeksvragen op basis van data
Bv. “Wat is profiel van Vlaams-Belang stemmers?”
- Wetenschap: objectief, onafh. v/d beoefenaar voor iedereen
hetzelfde!
- Kunst: creatief, interpretatief afh. v/d beoefenaar de interpretatie
is bij iedereen anders
- Data: verschillende soorten bv. surveys, experimenten, sociale media
data, administratieve data, geodata
vormen bv. numeriek, tekst, afbeeldingen, audio, …
Digital trace data = Data achtergelaten in je dagelijks leven (muziek,
surfen, …)
“zelfs met correcte statistiek kun je niets bewijzen” altijd een foutenmarge
,2 Van probleemstelling naar data-analyse
2.1 Probleemstelling
Opbouw: onderzoeksvraag (=welk inzicht verwerven?) probleemstelling
2.2 Data verzamelen
‘verzamelen’ bv. hoe koning in beeld? gegevens verzamelen uit nieuws
Onderzoekseenheden: objecten waarop onderzoek betrekking heeft
- Bv. volwassenen, steden, landen, …
Data: alle info die gemeten kan worden bij onderzoekseenheden
- Bv. bij nieuws: hoe koning in beeld gebracht? kenmerk = visibiliteit
Populatie: verzameling van alle onderzoekseenheden afbakenen in tijd
en ruimte!
- Bv. alle studenten van comm.wet. in aula 1 op 1/09/2024
Steekproef: deelverzameling van elementen uit populatie
- Elk element uit pop. heeft bepaalde kans om ertoe te behoren 0
- Kenmerk moet in gelijke mate voorkomen in SP en pop.
“representatief”
- Goede SP is essentieel voor niet vertekend beeld (bv. EAS)
2.3 Meten van gegevens
- Stap 1: probleemstelling
- Stap 2: verzamelen van data (= SP selectie)
- Stap 3: meten van gegevens (kenmerken meten bij
onderzoekseenheden uit SP)
In dataset:
, - De variabelen (wat gemeten wordt) in de verticale kolom
o Via meetprocedure: minuten, schalen, …
- De respondenten (observatie-eenheden) in de horizontale rij
Uitkomstenverzameling (Ø) = verzameling van alle mogelijke uitkomsten v/e
variabele
Meetprocedure: wijze waarop gegevens gemeten worden
- Kwantitatief: numeriek
- Kwalitatief: categorieën
Data opkuisen: bv. 60, 60%, 60 procent 60,60,60 = correct voor
computer
Classificatie van gegevens:
Aard:
- Kwalitatief:
o Nominaal: categorieën die niet met rangen werken (geslacht,
land, …)
Geen wisk. Bewerkingen
Meetschaal = eindig en exhaustief (=iedereen kan zich
terugvinden)
Onderling verwisselbaar van categorieën
o Ordinaal: categorieën met logische ordening (bv. klein, middel,
groot)
Geen vaste meeteenheden verschillen tussen
categorieën niet in bepaalde hoeveelheid
Geen wisk. Bewerkingen (tenzij ordening van variabelen)
Mogelijks nummering (1=goed, 2=matig, 3=slecht)
- Kwalitatief:
o Interval: vaste kwantificeerde meeteenheid (temp, IQ)
Nulpunt = arbitrair (geen betekenis, bv. 0 bij temp
afwezigheid ervan)