Samenvatting Statistiek
Hoofdstuk 1: Algemene begrippen
1.1. Wat is statistiek?
Studie van gegevens (data).
Dit houdt in: verzamelen, samenvatten, analyseren en interpreteren.
1.2. Kernbegrippen
• Populatie (population):
o Alle individuen (elementen) die voor onderzoek in aanmerking komen
• Variabele (variable):
o Eigenschap die wordt onderzocht (voorgesteld door X,Y, …)
o Vb. lengte, gewicht, geslacht, woonplaats, kleur, kostprijs, …
• Steekproef (sample):
o Deel van de populatie
o Wanneer de hele populatie onderzoeken onmogelijk is
• Populatieparameter (a parameter):
o Parameter i.v.m. populatie (Griekse letter µ, σ)
o Is een constante
• Steekproefparameter (a statistic):
o Parameter i.v.m. steekproef (alfabet X , s)
o Is een variabele
!!Griekse letter gaat altijd over populatieparameter, alfabet over steekproefparameter!!
Steekproefparameters maken schattingen voor de populatieparameters
1.3. Statistische methoden
Statistische methoden
Opmerking:
Bij verklarende statistiek wordt de numerieke Beschrijvende Verklarende
statistiek statistiek
methode ook de schattingstheorie genoemd en de
grafische methode de toetsingstheorie.
Numerieke Grafische Numerieke Grafische
methoden methoden methoden methoden
Populatie en steekproef:
Statistische inferentie = overstap van je
beschrijvende waarden naar de verklarende waarden
1. Formuleer de onderzoekshypothesen
2. Omschrijf de populatie
3. Trek een aselecte steekproef uit populatie
4. Verzamel gegevens (variabelen)
5. Bereken de steekproefparameters
6. Maak simulaties van steekproefparameters
7. Trek conclusie over onderzoekshypothesen
Onderzoekshypothesen …
, • Hebben betrekking op ganse populatie
• Kunnen nooit met zekerheid verworpen of niet verworpen worden
• Hebben een conclusie die gebaseerd is op de (berekeningen van) steekproefresultaten
• Vereisen de juiste methode (meetniveau)
• Worden geformuleerd met een betrouwbaarheid van XX%
→ Gemeten resultaten liggen binnen een interval. Ligt de hypothese hier niet in? Verwerpen!
→ Wil je een kleiner interval? Verlaag de betrouwbaarheid. 100% betrouwbaarheid: [0;+∞[
Univariaat = studie van 1 variabele vb. gemiddelde huidige salaris is €34 500
Bivariaat = studie v/d samenhang tussen 2 variabelen vb. gem. huidige salaris man = vrouw
Multivariaat = studie van de samenhang tussen meerdere variabele (zie OP3)
Hoofdstuk 2: Gegevens verzamelen
2.1. Type variabelen
Variabele
• Kwalitatief (categorisch): niet meetbaar
o Vb. Geslacht, politieke voorkeur, Kwantitatief Kwalitatief
burgerlijke staat, schaal van Beaufort, (Numeriek) (categorisch)
evaluatie cursus, militaire rang.
• Kwantitatief: meetbaar
Discreet Continu
o Discreet: uitkomsten kunnen een (sprongsgewijs) (geleidelijk)
discreet (eindig of oneindig maar
aftelbaar) aantal waarden aannemen. Alle soorten “aantallen”.
vb. kinderen in gezin
o Continue: uitkomsten kunnen alle reële waarden aannemen tussen 2 intervalgrenzen
vb. gewicht, volume, afstand, tijd, temperatuur, …
2.2. Meetniveau
Variabele
• Nominaal:
o Uitkomsten niet in vaste volgorde Kwantitatief Kwalitatief
o Aan uitkomsten kunnen getallen worden
gekoppeld zonder numerieke betekenis
o DICHOTOOM: slechts 2 categorieën Discreet Continu Nominaal
o Vb. geslacht, burgerlijke staat, bloedgroep
• Ordinaal: Interval Interval Ordinaal
o Uitkomsten in een vaste volgorde
o Aan de uitkomsten kunnen getallen
worden gekoppeld waarbij volgorde van Ratio Ratio
belang is MAAR het verschil tussen 2
waarden heeft geen betekenis
o Vb. LIKERT schaal, hoogst verworven diploma, grootte aardbeving schaal Richter
• Interval:
o Rangorde is belangrijk
o Verschil tussen twee uitkomsten is belangrijk
▪ Verschil tussen zeer slecht en slecht is gelijk aan het verschil tussen goed en
zeer goed
o Ratio (verhouding) tussen 2 uitkomsten is zinloos: vandaag 2°C, morgen 6°C. Je kan
niet zeggen dat het morgen 3 keer warmer wordt dan vandaag