1. INLEIDING STATISTIEK:..................................................................................................................3
1.1 WAT IS STATISTIEK:.......................................................................................................................3
1.2 WAAROM STATISTIEK:....................................................................................................................3
1.3 SOORTEN STATISTIEK:.....................................................................................................................3
1.3 BORING:.....................................................................................................................................4
1.4 MISLEIDENDE STATISTIEK:................................................................................................................4
1.5 OORSPRONG:...............................................................................................................................5
1.6 SAMENLEVING ZONDER CIJFERS:........................................................................................................5
1.7 CIJFERSYMBOLEN: HOE ONTSTAAN:....................................................................................................5
1.8 HUIDIG CIJFERSYSTEEM: HINDU-ARABISCHE SYSTEEM:...........................................................................6
1.9 BELANG NIEUWE CIJFERSYMBOLEN:....................................................................................................6
2. METEN EN MEETSCHALEN:............................................................................................................6
2.1 TERMINOLOGIE EN KERNBEGRIPPEN:..................................................................................................6
2.2 WAAROM METEN:.........................................................................................................................7
2.3 WAT IS METEN:............................................................................................................................7
2.4 EIGENSCHAPPEN VAN VARIABELEN:....................................................................................................9
3. FREQUENTIEVERDELINGEN EN GRAFISCHE VOORSTELLINGEN:.....................................................9
3.1 INLEIDING:...................................................................................................................................9
3.2 FREQUENTIEVERDELINGEN/-TABELLEN EN GRAFIEKEN: WAAROM:............................................................10
3.3 DEFINITIES EN NOTATIE:................................................................................................................10
3.4 WAAROM GRAFIEKEN:..................................................................................................................10
3.5 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: NOMINALE SCHALEN:.............................................11
3.6 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: ORDINALE SCHALEN:..............................................11
3.7 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: INTERVAL- EN RATIOSCHALEN:..................................12
3.8 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: SYNTHESE:...........................................................14
4. UNIVARIATE STATISTISCHE MATEN (DEEL 1):..............................................................................14
4.1 WAAROM STATISTISCHE MATEN:.....................................................................................................14
4.2.1 STATISTISCHE MATEN VAN LIGGING (VAN POSITIE):.................................................................................14
4.2.1.1 statistische maten van centrale tendens of centrummaten:...................................................15
4.2.1.2 Soorten:...................................................................................................................................15
4.2.2 STATISTISCHE MATEN VAN SPREIDING:.................................................................................................18
4.2.2.1 Variatiebreedte of range:.........................................................................................................19
4.2.2.2 Interkwartielafstand:...............................................................................................................19
4.2.2.3 Interdecielafstand:...................................................................................................................19
4.2.2.4 Boxplot:....................................................................................................................................19
4.2.2.5 Spreiding:.................................................................................................................................20
4.2.2.6 Centraal moment van rang 1:..................................................................................................20
4.2.2.7 Gemiddelde absolute afwijking:..............................................................................................20
4.2.2.8 Variatie: sum of squares:.........................................................................................................20
1
,4.2.2.9 Variantie:.................................................................................................................................21
4.2.2.10 Standaardafwijking:...............................................................................................................21
4.2.2.11 Variatiecoëfficiënt:.................................................................................................................21
4.2.3 STATISTISCHE MATEN VAN VORM:.......................................................................................................23
4.2.3.1 Maten voor symmetrie v/e verdeling:.....................................................................................23
4.2.3.2 Maten voor afplatting v/e verdeling:.......................................................................................25
5. TWEEDIMENSIONALE WAARGENOMEN REEKSEN: (TIP: STUDEER UIT WEC)...............................26
5.1 INLEIDING: SAMENHANG:..............................................................................................................26
5.2 SAMENHANG TUSSEN 2 CATEGORISCHE VARIABELEN:...........................................................................27
5.2.1 TWEEDIMENSIONALE KRUISTABEL AARD EN RICHTING V/E RELATIE:............................................................28
5.2.2 SIGNIFICANTIETOETSING BIJ KRUISTABELLEN: CHI-KWADRAAT:..................................................................28
5.2.3 STERKTE V/D SAMENHANG: ASSOCIATIEMATEN:.....................................................................................29
5.3 SAMENHANG TUSSEN TWEE KWANTITATIEVE VARIABELEN:....................................................................31
2
,1. Inleiding statistiek:
Statistiek in het dagelijkse leven:
Sport
Streaming platformen
Gezondheidszorg
Onderwijs
Meteorologie
Reizen en navigatie
1.1 Wat is statistiek:
Statistiek= kunst v/h leren omgaan met data/gegevens (gegevens vertalen in kennis en inzicht)
Gegevens synthetiseren, analyseren, interpreteren en presenteren à empirisch onderzoek
Statistiek als wetenschappelijke discipline
Kennismethode om wereld beter te kennen/begrijpen
Verschillende databronnen:
Administratieve data/ registerdata (=data die gekoppeld zijn aan je rijksregisternr)
Surveygegevens (= onderzoeek waarbij aantal mensen vragen wordt gesteld)
Big data (=alles wat geregistreerd wordt zonder dat we het goed beseffen en via
commerciële bureaus worden doorverkocht)
Empirisch onderzoek:
Statistiek als werktuig, instrument, methode
Kijken naar gegevens en verdelingen:
- Weergeven op manier om beter te begrijpen: grafisch, kerngetallen
- Onderzoeken/vergelijken van verdelingen
1.2 Waarom statistiek:
Om beweringen te staven (check):
Nood aan empirie (data/gegevens)
Data verzamelen volgens regels van kunst à onderzoeksmethoden
Data analyseren volgens regels van kunst à statistiek
Als we empirisch onderzoek willen doen om antwoord te bieden op een vraagstelling dan
dienen we data te verzamelen/analyseren
Fasen in Sociaal wetenschappelijk onderzoek:
Probleemstelling: vergt substantiële kennis van vakgebied
Onderzoeksontwerp/dataverzameling: welke onderzoeksmethoden in functie van
probleem- en vraagstelling
Data-analyse: beschrijvende statistiek, inductieve stat,..
Rapportering: interpreteren, refereren, opzoeken,..
1.3 Soorten statistiek:
Soorten:
1. Beschrijvende statistiek:
= Wereld in cijfers beschrijven:
3
, Basis: frequentievragen
Samenvatten in “kerngetallen”
Gebruik van grafische technieken
Ordenen/synthetiseren van (een grote hoeveelheid) gegevens
Herleiden tot:
Samenvattende maten (VB: percentages, mediaan, kwantielen, gemiddelde,
standaardafwijking, correlatiecoëfficiënt)
Grafieken
2. Inferentiële statistiek:
= Middel om met bep aantal gegevens uitspraken te doen over breder geheel (generaliseren
of extrapoleren), over een volledige populatie
Extrapolatie= uitspraken over de volledige bevolking o.b.v. een steekproef uit die
bevolking (VB: veiligheidsmonitor)
Veralgemeenbaarheid steekproefresulktaten
Voorspellingen obv steekproef à kansen op fouten
3. Statistische analyse:
= Gericht op verklaring van verschillen/samenhang (obv bivariate regressie, multivariate
regressie,.. (zie VB dia 38)
1.3 Boring:
NEEN
Hans Rosling= zweedse dokter, ‘statisticus’, professor,.. die bezig is met
gezondheidststatistieken adhv high tech toestanden (vurige pleiter voor stat) (ontwikkelaar
van gapminder)
Gapminder= organisatie die misvattingen over mondiale ontwikkelingen wil tegengaan obv data
1.4 Misleidende statistiek:
“There are 3 kinds of lies: Lies, damn lies and statistics
Kernidee:
Cijfers zijn misleidend
Vaak gebruikt/misbruikt om zwakke/foute argumenten te ondersteunen
Uitkomsten v/e onderzoek kunnen gemanipuleerd worden bij:
Verzamelen van gegevens
Presentatie van uitkomsten
Omschrijven van conclusies
Misleiding bij verzamelen gegevens:
Slechte selectie van onderzoekspersonen, niet representatief voor bevolking die je wil
onderzoeken (probleem bij online surveys verspreid via sm)
Te klein aantal onderzochte personen
Slechte vraagstelling
Slechte operationalisatie/vergelijking van twee ≠ operationalisaties
Misleiding bij presentatie van gegevens:
Deel van grafiek verwijderen
Schaal manipuleren
Grafische aanpassing (zoals bij pistools)
4