Statistiek=het verzamelen, interpreteren, analyseren en presenteren van data
Beschrijvende statistiek= het grafisch en numeriek weergeven van data
- Data ordenen, samenvatten en in overzichtelijke tabellen en grafieken
weergeven
Inferentiële statistiek=gebruikt data om tot inzichten te komen over de gehele
populatie
- Het maken van voorspellingen, prognoses en schattingen om betere beslissingen
te maken
Populatie= iedereen die er betrekking bij heeft
- Parameter= waarde die berekend wordt op basis van data over de populatie
o Populatiegemiddelde: µ
o Populatiegrootte: N
Steekproef= een willekeurig geselecteerd deel van de populatie
- Statistiek= waarde die berekend wordt op basis van data van de steekproef
o Steekproefgemiddelde: X
o Steekproefgrootte: n
Categorische variabele=waarden behoren tot een groep/categorie
- Verkoopt Bakkerij Anouk kruidkoekjes? [Ja/Nee]
Numerieke variabele=waarden zijn getallen waarmee je kan rekenen
- Discrete variabele= kan een eindig aantal waarden aannemen, en is meestal het
resultaat van een telproces
o Aantal verkochte appeltaarten op een dag (afzet)
- Continue variabele= kan elke waarde binnen een bereik aannemen, en is
meestal het resultaat van een meetproces
o Het gewicht van een kruidkoekje
Kwalitatieve variabele=waarden behoren tot een groep/categorie Categorische
variabelen
- Nominale variabele=waarden hebben geen rangorde
o Verkoopt Bakkerij Anouk kruidkoek? [1. Ja; 2. Nee]
- Ordinale variabele=waarden hebben een rangorde
o Klanttevredenheid van Bakkerij Anouk [1. Slecht; 2. Matig; 3. Goed; 4. Uitstekend]
Kwantitatieve variabele=waarden zijn getallen waarmee je kan rekenennumerieke
variabelen
- Interval data=geeft de rangorde en afstand van een willekeurig nulpunt aan
o Negatieve waarden zijn wel mogelijk
,o De temperatuur in Bakkerij Anouk
- Ratio data=geeft de rangorde en afstand van een absoluut nulpunt aan
o Negatieve waarden zijn niet mogelijk
o Het gewicht van een kruidkoekje
Categorische data: Wat vinden klanten van Bakkerij Anouk?
- [1. Slecht; 2. Matig; 3. Goed; 4.
Uitstekend]
Numerieke data: Het gewicht (in gram) per kruidkoekje (symmetrische verdeling)
, Asymmetrische verdelingen:
- Rechts-scheve verdeling= verdeling met een staart naar rechts
- Links-scheve verdeling=verdeling met een staart naar links
Mediaan=het middelste getal in een set gesorteerde observaties
Modus=de meest voorkomende waarde
Vijf-getallensamenvatting= Minimum < Q1 < mediaan < Q3 < maximum Boxplot
Empirische regel= geeft voor vele grote populaties (normaal verdeeld) een
schatting van het % observaties dat binnen 1, 2 of 3 standaardafwijkingen van het
gemiddelde ligt
- 68% µ + 1σ
- 95% µ + 2σ
- Bijna alles µ + 3σ
- Extreme waarde= observatie die verder dan
3σ van het gemiddelde ligt
!!De standaardafwijking is de wortel van de variantie
- S= √s2
- σ = √ σ2
Z-score= het aantal standaardafwijkingen dat een observatie ligt vanaf het
gemiddelde
- z = (xi − µ) / σ
- Gestandaardiseerde waarde
Covariantie=meet de richting van een lineair verband
- Positieve waarde: een direct of toenemend lineair verband
- Als Cov(x, y) < 0: Negatief verband
Correlatie=meet zowel de richting als sterkte van een lineair verband
De correlatie is een gestandaardiseerde waarde tussen −1 en +1
- r = 1 geeft een perfect positief lineair verband aan
- r = −1 geeft een perfect negatief lineair verband aan
- r = 0 geeft aan dat er geen lineair verband is