STATISTIEK SAMENVATTING TEST 10 NOVEMBER
HOORCOLLEGE 1 : INLEIDING
P= percentielen = P50= de helft is groter en de helft is kleiner= 50%
Belangrijk in statistiek= standaardafwijking of een variatie -> je wilt niet enkel
het gemiddelde weten maar je wilt de spreiding ervan weten
1.1. WAT IS STATISTIEK?
Oorsprong van statistiek= statistiek stond voor een beperkt begrip -> de studie
van staat -> de boekhouding van de staat
Naarmate onze samenleving complexer en complexer werd -> ruimer en ruimer
naar gegevensverzameling, analyse en ook interpretatie
Belangrijkste: date kunnen interpreteren
Statistiek= gegevens verzamelen, analyseren, interpreteren en presenteren
Variable= iets dat variëert -> aantal geboortes, haarkleuren,… -> ze zien er
allemaal totaal anders uit
1.2. WAAROM STATISTIEK?
Data verzamelen volgens de regels van de kunst -> onderzoeksmethoden
Data analyseren volgens de regels van de kunst -> statistiek
Figuur kennen !!!!
Doe je de eerste 3 stappen slordig -> dan kan je datanalyse nooit meer goed
gaan
Wij zitten in het de data analytische mode
Probleemanalyse is altijd stap 1 !!!
1
,1.3. SOORTEN STATISTIEK?
Beschrijvende statistiek
De wereld in cijfers beschrijven
o We denken spontaan vaak kwantitatief (veel, weinig, meer,...)
o Cijfers geven die hoeveelheden precies weer
Basis: frequentievragen
Samenvatten in “kengetallen”
Gebruik van grafische technieken
Gebruik maken van gegevens en deze gaan samenvatten in kerngetallen
Verschillende parameters zoals spreiding
Ordenen en synthetiseren van (een grote hoeveelheid) gegevens (bv. 12000
enquêtes,…)
Herleiden tot
• Samenvattende maten (bv. percentages, mediaan, kwantielen,
gemiddelde, standaardafwijking, correlatiecoëfficiënt,…)
• Grafieken
Voorbeeld: Belgische lonen in 2018
- Voltijds tewerkgestelde werknemer verdient gemiddeld 3627 euro
bruto per maand.
- De helft van werknemers (mediaan) verdient meer dan 3361 euro
- 10% ontvangt minder dan 2233 euro; 10% ontvangt meer dan 5381
euro
- Directeurs van grote ondernemingen hebben het hoogste loon;
obers en diensters het laagste
- Studeren heeft een positieve invloed op het loon: houders van een
master-diploma verdienen 50 % meer dan de gemiddelde
werknemer
2
,Inferentiële statistiek
Middel om met een beperkt aantal gegevens uitspraken te doen over een
breder geheel, over een volledige populatie
Extrapolatie: uitspraken over de volledige bevolking op basis van een
toevalssteekproef uit die bevolking (bv. Veiligheidsmonitor,
verkiezingsonderzoek, gezondheidsenquêtes, …)
Veralgemeenbaarheid van steekproefresultaten
Voorspellingen op basis van een steekproef
Inferentiële statistiek of inductieve statistiek zijn synoniemen
Steekproef uitvoeren
Je gaat op basis van steekproef gegevens een uitspraak doen over de populatie
Verklarende statistiek
Statistische analyse
Gericht op de verklaring van verschillen & samenhang
Regressietechnieken (bivariate regressie, multivariate regressie,
logistische regressie, survival analyse, …)
Voorbeeld samenhang- en verschilvragen
Wat is de relatie tussen opleidingsniveau en inkomen?
Wat is de relatie tussen opleidingsniveau, inkomen en
onveiligheidsgevoelens?
Wat is de relatie tussen opleiding en gezondheid?
Wat is de samenhang tussen leeftijd en consumptie van digitale media?
Een echte statistische analyse
Je gaat opzoek naar verklaringen van een bepaald fenomeen
3
, 1.4. MISLEIDING DOOR STATISTIEK?
Verzameling van gegevens -> hangt samen met dataverzameling en uw
onderzoeksontwerp
Selectie van uw onderzoekspersonen is SUPER BELANGRIJK -> maak je daar al
fouten? Dan is de rest van uw cyclus al veel moeilijker
Slechte operationalisatie -> iets van de moeilijkste dingen in de wetenschap -> je
hebt een concept (bv datagellettertheid) en je gaat nadenken over hoe je dit gaat
bevragen, wilt gaan omzetten -> altijd voor discussie vatbaar
Statistieken worden regelmatig gebruikt om mensen te misleiden
Uitkomsten van een onderzoek kunnen gemanipuleerd worden bij:
1. Verzamelen van gegevens
2. Presentatie van de uitkomsten
3. Omschrijven van de conclusies
1.5. OORSPRONG VAN STATISTIEK
Ontstaan midden 18de eeuw
Informatie over naties (staat) < staatsboekhoudkunde
Systematische verzameling van demografische en economische data door
overheden
Fiscale en militaire doeleinden
Term statistics <
o Latijn: statisticum collegium (‘council of state’)
o Italiaans: statista (’statesman’ ‘politician’)
o Duits: statistik (‘science of the state’)
Is gelijktijdig ontstaan met alle nieuwe natiestaten rond 1830/1840
Midden 19de eeuw
Steeds meer gegevens worden verzameld
Ook analyse en presentatie van data
Royal Statistical Society (1834)
Florence Nightingale pionier: statistische analyse van
gezondheidsproblemen en implicaties voor volksgezondheid
1.6. VOORBEELDEN
Wat een doelstelling is in dit vak -> zo een tabel kunnen analyseren en
samenvatten
Het is een kruistabel -> je ziet per leeftijdsgroep hoeveel mensen dat er de
vragenlijst ingevuld hebben
4
HOORCOLLEGE 1 : INLEIDING
P= percentielen = P50= de helft is groter en de helft is kleiner= 50%
Belangrijk in statistiek= standaardafwijking of een variatie -> je wilt niet enkel
het gemiddelde weten maar je wilt de spreiding ervan weten
1.1. WAT IS STATISTIEK?
Oorsprong van statistiek= statistiek stond voor een beperkt begrip -> de studie
van staat -> de boekhouding van de staat
Naarmate onze samenleving complexer en complexer werd -> ruimer en ruimer
naar gegevensverzameling, analyse en ook interpretatie
Belangrijkste: date kunnen interpreteren
Statistiek= gegevens verzamelen, analyseren, interpreteren en presenteren
Variable= iets dat variëert -> aantal geboortes, haarkleuren,… -> ze zien er
allemaal totaal anders uit
1.2. WAAROM STATISTIEK?
Data verzamelen volgens de regels van de kunst -> onderzoeksmethoden
Data analyseren volgens de regels van de kunst -> statistiek
Figuur kennen !!!!
Doe je de eerste 3 stappen slordig -> dan kan je datanalyse nooit meer goed
gaan
Wij zitten in het de data analytische mode
Probleemanalyse is altijd stap 1 !!!
1
,1.3. SOORTEN STATISTIEK?
Beschrijvende statistiek
De wereld in cijfers beschrijven
o We denken spontaan vaak kwantitatief (veel, weinig, meer,...)
o Cijfers geven die hoeveelheden precies weer
Basis: frequentievragen
Samenvatten in “kengetallen”
Gebruik van grafische technieken
Gebruik maken van gegevens en deze gaan samenvatten in kerngetallen
Verschillende parameters zoals spreiding
Ordenen en synthetiseren van (een grote hoeveelheid) gegevens (bv. 12000
enquêtes,…)
Herleiden tot
• Samenvattende maten (bv. percentages, mediaan, kwantielen,
gemiddelde, standaardafwijking, correlatiecoëfficiënt,…)
• Grafieken
Voorbeeld: Belgische lonen in 2018
- Voltijds tewerkgestelde werknemer verdient gemiddeld 3627 euro
bruto per maand.
- De helft van werknemers (mediaan) verdient meer dan 3361 euro
- 10% ontvangt minder dan 2233 euro; 10% ontvangt meer dan 5381
euro
- Directeurs van grote ondernemingen hebben het hoogste loon;
obers en diensters het laagste
- Studeren heeft een positieve invloed op het loon: houders van een
master-diploma verdienen 50 % meer dan de gemiddelde
werknemer
2
,Inferentiële statistiek
Middel om met een beperkt aantal gegevens uitspraken te doen over een
breder geheel, over een volledige populatie
Extrapolatie: uitspraken over de volledige bevolking op basis van een
toevalssteekproef uit die bevolking (bv. Veiligheidsmonitor,
verkiezingsonderzoek, gezondheidsenquêtes, …)
Veralgemeenbaarheid van steekproefresultaten
Voorspellingen op basis van een steekproef
Inferentiële statistiek of inductieve statistiek zijn synoniemen
Steekproef uitvoeren
Je gaat op basis van steekproef gegevens een uitspraak doen over de populatie
Verklarende statistiek
Statistische analyse
Gericht op de verklaring van verschillen & samenhang
Regressietechnieken (bivariate regressie, multivariate regressie,
logistische regressie, survival analyse, …)
Voorbeeld samenhang- en verschilvragen
Wat is de relatie tussen opleidingsniveau en inkomen?
Wat is de relatie tussen opleidingsniveau, inkomen en
onveiligheidsgevoelens?
Wat is de relatie tussen opleiding en gezondheid?
Wat is de samenhang tussen leeftijd en consumptie van digitale media?
Een echte statistische analyse
Je gaat opzoek naar verklaringen van een bepaald fenomeen
3
, 1.4. MISLEIDING DOOR STATISTIEK?
Verzameling van gegevens -> hangt samen met dataverzameling en uw
onderzoeksontwerp
Selectie van uw onderzoekspersonen is SUPER BELANGRIJK -> maak je daar al
fouten? Dan is de rest van uw cyclus al veel moeilijker
Slechte operationalisatie -> iets van de moeilijkste dingen in de wetenschap -> je
hebt een concept (bv datagellettertheid) en je gaat nadenken over hoe je dit gaat
bevragen, wilt gaan omzetten -> altijd voor discussie vatbaar
Statistieken worden regelmatig gebruikt om mensen te misleiden
Uitkomsten van een onderzoek kunnen gemanipuleerd worden bij:
1. Verzamelen van gegevens
2. Presentatie van de uitkomsten
3. Omschrijven van de conclusies
1.5. OORSPRONG VAN STATISTIEK
Ontstaan midden 18de eeuw
Informatie over naties (staat) < staatsboekhoudkunde
Systematische verzameling van demografische en economische data door
overheden
Fiscale en militaire doeleinden
Term statistics <
o Latijn: statisticum collegium (‘council of state’)
o Italiaans: statista (’statesman’ ‘politician’)
o Duits: statistik (‘science of the state’)
Is gelijktijdig ontstaan met alle nieuwe natiestaten rond 1830/1840
Midden 19de eeuw
Steeds meer gegevens worden verzameld
Ook analyse en presentatie van data
Royal Statistical Society (1834)
Florence Nightingale pionier: statistische analyse van
gezondheidsproblemen en implicaties voor volksgezondheid
1.6. VOORBEELDEN
Wat een doelstelling is in dit vak -> zo een tabel kunnen analyseren en
samenvatten
Het is een kruistabel -> je ziet per leeftijdsgroep hoeveel mensen dat er de
vragenlijst ingevuld hebben
4