100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting Statistiek 1 (eerste semester)

Beoordeling
5,0
(1)
Verkocht
5
Pagina's
44
Geüpload op
25-05-2022
Geschreven in
2021/2022

Samenvatting van het eerste semester van statistiek 1, gegeven door professor Peter Thijssen. Ik maakte hem a.d.h.v. het handboek 'Statistisch gezien' (HS 1 t.e.m. 7) en de lessen (dus ook extra opmerkingen en verduidelijking). Als jaartotaal behaalde ik hiermee een 17/20. (De samenvatting van het 2e semester verkoop ik ook.) (Er zijn een paar kleine zaken die erbij geschreven dienen te worden omdat het niet mogelijk was om die er via Word in te zetten, maar daarvan bezorg ik dan zeker foto's via facebook/instagram/...)

Meer zien Lees minder
Instelling
Vak













Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
Hoofstuk 1 t.e.m. 7
Geüpload op
25 mei 2022
Aantal pagina's
44
Geschreven in
2021/2022
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Inhoud
1 Over statistiek .............................................................................................................................................................. 3
2 Data statistisch onder de loep genomen ..................................................................................................................... 4
2.1 Datamatrix ........................................................................................................................................................... 4
2.2 Onderzoekselementen ........................................................................................................................................ 4
2.2.1 Onderzoekselementen als (deel van een groter) geheel ............................................................................ 4
2.2.2 Onderzoekselementen en hun aggregatieniveau ....................................................................................... 5
2.3 Variabelen ........................................................................................................................................................... 6
2.3.1 Meting van variabelen ................................................................................................................................ 6
2.3.2 Meetniveau van variabelen ........................................................................................................................ 7
2.3.3 Verdeling van variabelen ............................................................................................................................ 8
2.3.4 Plaats in de analyse van variabelen ............................................................................................................ 8
2.4 Meetwaarden: coördinaten in een n-dimensionele ruimte ................................................................................ 9
2.5 Werken met een datamatrix ............................................................................................................................... 9
2.5.1 De frequentietabel ..................................................................................................................................... 9
2.5.2 Het sommatieteken .................................................................................................................................. 10
2.5.3 De grafische voorstelling van data ........................................................................................................... 11
3 Visuele inspectie van verdelingen o.b.v. ruwe data ................................................................................................... 13
3.1 Inleiding ............................................................................................................................................................. 13
3.2 Het Stam-blad diagram ..................................................................................................................................... 13
3.3 4 analyseniveaus ............................................................................................................................................... 13
3.3.1 Het centrum of de centrale tendentie van een verdeling ........................................................................ 14
3.3.2 De variatie of spreiding van een verdeling ............................................................................................... 14
3.3.3 De vorm van de verdeling ......................................................................................................................... 15
3.4 Het doosdiagram / box-whisker diagram / boxplot .......................................................................................... 15
3.4.1 Kwartielen versus scharnierwaarden ....................................................................................................... 15
3.4.2 Doosdiagram bij aanwezigheid van uitschieters/outliers ......................................................................... 16
4 Eerste analyseniveau: centrale tendentie / centrum ................................................................................................ 17
4.1 Kengetallen: een indelingsperspectief .............................................................................................................. 17
4.2 Het rekenkundig gemiddelde ............................................................................................................................ 17
4.2.1 Eigenschappen van het rekenkundig gemiddelde .................................................................................... 18
4.2.2 Gewogen versus ongewogen gemiddelde (zie inleiding 4.2) ................................................................... 19
4.2.3 Lineair getransformeerde waarnemingsuitkomsten ................................................................................ 19
4.3 Niet-lineaire transformaties en andere gemiddelden ....................................................................................... 19
4.3.1 Wanneer HARMONISCH GEMIDDELDE gebruiken? .................................................................................. 20
4.3.2 Wanneer KWADRATISCH GEMIDDELDE gebruiken? ................................................................................ 20
4.3.3 Wanneer MEETKUNDIG GEMIDDELDE gebruiken? .................................................................................. 21
4.4 Overzichtstabel: kengetallen van centrale tendentie ....................................................................................... 23
5 Tweede analyseniveau: spreiding en dispersie .......................................................................................................... 24
5.1 Inleiding ............................................................................................................................................................. 24
1

, 5.2 Spreidingsmaten op kwantitatief meetniveau .................................................................................................. 24
5.2.1 Variantie en standaardafwijking (een duo) .............................................................................................. 24
5.2.2 De variatiecoëfficiënt (VC) : een relatieve spreidingsmaat ...................................................................... 28
5.3 Spreidingsmaten voor ordinale gegevens ......................................................................................................... 28
5.3.1 De interkwartielafstand (IKA = Q3 - Q1) ................................................................................................... 28
5.3.2 De interkwartiele spreidingscoëfficiënt (IKS) ........................................................................................... 28
5.3.3 De ordinale dispersie-index (ODI)............................................................................................................. 29
5.4 Spreidingsmaten voor nominale gegevens ....................................................................................................... 30
5.4.1 De nominale dispersie-index (NDI) ........................................................................................................... 30
5.4.2 De entropie (H) ......................................................................................................................................... 31
5.5 Overzichtstabel: Kengetallen van spreiding ...................................................................................................... 32
6 Derde en vierde analyseniveau: de vorm van de verdeling ....................................................................................... 33
6.1 Inleiding ............................................................................................................................................................. 33
6.2 De scheefheid of de asymmetrie ....................................................................................................................... 33
6.2.1 De scheefheidscoëfficiënt van Pearson .................................................................................................... 33
6.2.2 De scheefheidscoëfficiënt van Yule .......................................................................................................... 34
6.2.3 De scheefheidscoëfficiënt 𝜸𝟏 ................................................................................................................... 34
6.2.4 Overzichtstabel: kengetallen van scheefheid ........................................................................................... 36
6.3 De gepiektheid of de kurtosis ............................................................................................................................ 37
6.3.1 De gepiektheidscoëfficiënt 𝜸𝟐 ................................................................................................................ 37
6.3.2 Overzichtstabel: kengetallen voor gepiektheid ........................................................................................ 38
7 Werken met geclassificeerde data ............................................................................................................................. 39
7.1 Geclassificeerde versus ruwe scores ................................................................................................................. 39
7.2 Construeren van een geclassificeerde frequentietabel .................................................................................... 39
7.2.1 Stap 1: het aantal klassen k ...................................................................................................................... 39
7.2.2 Stap 2: de klassebreedte v ........................................................................................................................ 39
7.2.3 Stap 3: de klassegrenzen .......................................................................................................................... 40
7.2.4 Stap 4: van een klassenindeling naar een geclassificeerde frequentietabel ............................................ 40
7.3 Het analyseren van een geclassificeerde frequentietabel ................................................................................ 41
................................................................................................................................................................................... 41
7.3.1
De afgeronde meetwaarden of klassecentra xic ........................................................................................... 41
7.3.2 Exacte klassegrenzen en aanvullende frequenties ................................................................................... 41
7.3.3 Grafische voorstellingen voor geclassificeerde data ................................................................................ 41
7.4 Kengetallen voor een geclassificeerde frequentietabel .................................................................................... 43
7.4.1 De modus .................................................................................................................................................. 43
7.4.2 De mediaan en andere kwartielen ........................................................................................................... 43
7.4.3 Het rekenkundig gemiddelde ................................................................................................................... 44




2

,1 Over statistiek
Statistiek
= wetenschap v/h verzamelen, organiseren, presenteren, analyseren en interpreteren van gegevens of data
volgens een numerieke logica

-> 2 soorten statistiek

- Beschrijvende (descriptieve) statistiek: het beschrijven van de gegevens van een steekproef of populatie
met behulp van tabellen, grafieken en kengetallen
- Inferentiële (verklarende/analytische) statistiek: Op basis van steekproefgegevens (kleine groep)
uitspraken doen over de populatie (grote groep)




3

,2 Data statistisch onder de loep genomen
2.1 Datamatrix
= een tabel (bestaande uit rijen en kolommen) die statistische analyses, systematisch geordende, numerieke
gegevens bevat

olo en




ijen




Onderzoekselementen / cases -> datgene waar we iets over willen zeggen

Variabelen -> kenmerken van de onderzoekselementen

Meetwaarden / observaties -> waarde van een onderzoekselement op een variabele (= niet per se
kwantitatief)

2.2 Onderzoekselementen
2.2.1 Onderzoekselementen als (deel van een groter) geheel
- Populatie N: alle mogelijke onderzoekselementen worden onderzocht
- Steekproef (sample) n: de onderzoekselementen vormen een deel van een groter geheel aan elementen

Bij onderzoek van populatie
1. tijd & geld nodig
2. risico op selectie bias: responsgraad is nooit 100% & de non-respons zit vaak geconcentreerd (bv.
kansarmen) -> je selecteert mensen
Vb. volkstelling/census: men probeert volledige populatie te ondervragen
-> je bereikt echter nooit iedereen (bv. daklozen, schippers, illegalen,…)
→ daarom steeds meer gebruik van steekproeven/samples

Onderzoek met steekproef / sampling
Literary Digest-schandaal: tijdschrift probeerde winnaar verkiezingen in VS te voorspellen o.b.v. miljoenen
ondervraagden, maar had het toch fout omdat vooral hogere klasse (die meestal republikeins stemden)
ondervraagd waren -> selectie bias
-> ze gebruikte ‘straw poll’ = zo veel mogelijk formulieren uitdelen
<-> George Gallop: maakte schatting o.b.v. +- toevallige steekproef van ‘slechts’ 50.000 ondervraagden &
had het wel juist
-> hij gebruikte ‘eenvoudige aselecte steekproef’ (EAS) (Engels: ‘random sample’)
→ randomness/aselectie = belangrijker dan steekproefgrootte!!!




4

, opula e
Undercoverage: bepaalde gebieden van de populatie (bv.
kansarmen) zijn niet genoeg vertegenwoordigd in het
steekproefkader (de opgestelde lijst om uit te selecteren)
Steekproe ader
Selectie bias: door het ondervragen van mensen via een
specifieke weg/medium, selecteer je die mensen
Steekproef Non-respons bias: niet iedereen antwoordt op ondervraging
ace to face (het zijn ook vaak een bep. soort mensen die niet meedoen)
elefoon
ragenlijst Response bias: sommige respondenten antwoorden niet eerlijk
eelne ers/respondenten
1




Soorten steekproeven/samples
‘The good’ (steeds aselect, ‘de onschuldige kinderhand’)

• Enkelvoudige aselecte steekproef (EAS): men moet beschikken over een lijst van de elementen uit
de populatie, hieruit wordt volledig aselect geselecteerd
• Clustersteekproef: men onderscheid eenheden op verschillende geneste niveaus (bv. individuen=
genest in gemeenten = genest in provincies), uit elk niveau wordt random een aantal eenheden
gekozen, beginnend bij hoogste niveau (bv. steekproef Europa: eerst 100/500 regio’s rando kiezen,
dan van die 100 regio’s rando 1000 ensen kiezen)
-> tweetrapssteekproef, drietrapssteekproef,…
• Gestratificeerde steekproef: men weet dat de populatie uit bepaalde subgroepen bestaat
(voorkennis), men trekt een toevalssteekproef uit iedere subgroep, met de juiste verhoudingen t.o.v.
de populatie (bv. systeem verkiezingen VS met kiesmannen)

‘The bad’

• Convenience steekproef: de steekproef bestaat uit onderzoekselementen die je toevallig ter
beschikking hebt

‘The ugly’

• Quota steekproef: men maakt gebruik van voorkennis bij selectie van de onderzoekselementen
(= niet betrouwbaar!) (bv. voor steekproef met als enige vereiste dat ‘ an tussen 50 & 60 jaar’, 1 bepaalde
vriendengroep ondervragen)
-> lijkt op gestratificeerde steekproef, maar discretie van de interviewer is belangrijk om de
onderzoekselementen te selecteren (selectiebias)

2.2.2 Onderzoekselementen en hun aggregatieniveau
Aggregatieniveau = ‘niveau van optelling’
-> de onderzoeksvraag bepaalt op welk niveau je data moet verzamelen
- micro: bv. burgers, studenten, gebouwen, krantenartikelen
- meso: bv. beroepsgroepen, verenigingen, organisaties, scholen
- macro: bv. gemeenten, landen

Ecologische meetfout (ecological fallacy):
= een denkfout waarbij kenmerken die een gehele statistische populatie heeft, worden toegekend aan delen
van die populatie (de spreiding in de populatie wordt verwaarloosd/onderschat)
-> o.b.v. gegevens op macro-/mesoniveau uitspraken doen over individuen op microniveau



5

, -> Simpson paradox: Simpson stelde vast dat bij een
Enkel pa nten et
erns ge klachten medische ingreep proportioneel minder slachtoffers
iekenhuis A iekenhuis overlijden in ziekenhuis A dan in B -> ! maar als men rekening
Alle pa nten verlijden 1 houdt met de ernst van de klachten blijkt ziekenhuis B in
verleven 6
iekenhuis A iekenhuis 100 100
beide gevallen beter te scoren ! -> hoe kan dat?
verlijden 1
→ B krijgt in verhouding (in ‘absolute cijfers’) veel meer
Enkel pa nten zonder
verleven erns ge klachten patiënten met ernstige klachten dan A
100 100
iekenhuis A iekenhuis -> Bij de eerste datamatrix wordt te hoog geaggregeerd
verlijden 1 -> het verband tussen overlevingskans en ziekenhuizen
verleven
100 100 = een schijnverband: als je het opsplitst in andere variabelen,
verandert het compleet

- Als je bepaalde resultaten analyseert
-> altijd belangrijk na te denken of er geen andere belangrijke variabelen meespelen!

2.3 Variabelen
= kenmerken van de onderzoekselementen die kunnen variëren

2.3.1 Meting van variabelen
Sociale wetenschappen: eten van ‘abstracte attitudes’ / ‘latente concepten’ -> ‘verborgen variabelen’
<-> exacte wetenschappen: manifeste concepten

Conceptualisering: wat wil je meten?
(niet ‘ik eet geslacht’ -> wat bedoel je et geslacht? Hor onen/chro oso en/…?)

Indicering: welke empirische representanten? -> welke indicator gebruik je om te meten?
(testosterongehalte kan je op verschillende manieren meten)

- Validiteit: meet je wat je wilt meten? Is de indicator valide?
(kunnen er bv. geen vrouwen zijn met een zeer hoog testosterongehalte?)

Operationalisering: hoe ga je het registreren? Hoe ga je de indicatoren gebruiken?
(op welk o ent, nauwkeurig of niet, …)
Bv: 5 antwoordcategorieën: formaat van Likert (volledig eens, eens, noch eens, noch oneens, volledig oneens)

- Betrouwbaarheid:
- interpersoon betrouwbaarheid: mensen die ongeveer dezelfde karakteristiek vertonen, moeten op
gelijkaardige manier reageren op de indicatoren
- intertemporele/test-retest betrouwbaarheid: als men dezelfde indicatoren gebruikt op
verschillende momenten zou men ceteris paribus (de andere omstandigheden zijn constant) een vrij
grote samenhang moeten zien tussen de antwoorden

Antwoorden op survey-items = vaak vertekend door onwetendheid, luiheid & sociale wenselijkheid
-> moeilijke verwoording vermijden & een ‘weet niet’- / ‘geen ening’-categorie voorzien




6
€6,99
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten


Ook beschikbaar in voordeelbundel

Beoordelingen van geverifieerde kopers

Alle reviews worden weergegeven
10 maanden geleden

5,0

1 beoordelingen

5
1
4
0
3
0
2
0
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
johannaverstraelen Universiteit Antwerpen
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
57
Lid sinds
4 jaar
Aantal volgers
29
Documenten
6
Laatst verkocht
1 maand geleden

4,7

7 beoordelingen

5
6
4
0
3
1
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen