Begrippenlijst
Parameter
Een numerieke waarde die een kenmerk of eigenschap van een populatie beschrijft. Zoals
bijvoorbeeld: populatiegemiddelde, populatievariantie en populatieproportie.
Variabele
Een variabele is een kenmerk of eigenschap van eenheid in een dataset die kan variëren. Er zijn
verschillende soorten variabelen.
- Op basis van meetniveau en aard:
o Kwalitatieve (categorische) variabelen:
Beschrijven eigenschappen of categorieën zonder een numerieke waarde
Nominaal: Geen inherente volgorde (bijvoorbeeld geslacht, kleur)
Ordinaal: Met een volgorde, maar zonder vaste schaal (bijvoorbeeld
opleidingsniveau)
o Kwantitatieve (numerieke) variabelen:
Hebben een numerieke waarde en maken rekenkundige bewerkingen
mogelijk
Discreet: Beperkt tot specifieke waarden, vaak gehele getallen (bijvoorbeeld
aantal kinderen)
Continu: Kan elke waarde binnen een interval aannemen (bijvoorbeeld
lengte, gewicht)
- Een afhankelijke variabele is de variabele die je wilt voorspellen of verklaren.
- Een onafhankelijke variabele is de variabele die je gebruikt om veranderingen in de
afhankelijke variabele te verklaren.
, Pdf
= Probability Density Function: beschrijft waarschijnlijkheidsverdeling ve continue random variabele
Een PDF is een functie f(x) die aangeeft hoe de waarschijnlijkheid over de waarden van een continue
variabele is verdeeld. Het geeft de relatieve kansdichtheid op een bepaalde waarde, maar de kans op
een exacte waarde bij een continue variabele is altijd 0. De PDF wordt gebruikt om de kans te
berekenen dat de variabele binnen een bepaald interval valt.
Belangrijke eigenschappen ve PDF:
- Niet-negativiteit: voor alle waarden v x geldt f(x) ≥ 0
- Normalisatie: totale kans over alle mogelijke waarden is 1:
∞
∫ f ( x ) dx=1
−∞
- Waarschijnlijkheid binnen een interval: kans dat continue variabele X waarde aanneemt
binnen interval [a,b] wordt gegeven door:
b
P ( a ≤ X ≤ b )=∫ f ( x ) dx
a
Voorbeeld: voor standaard normale verdeling (met gemiddelde µ = 0 & standaardafwijking σ = 1), is
de PDF:
2
−x
1
f ( x )= e 2
√2 π
Visuele interpretatie: PDF vaak weergegeven als grafiek
- X-as: waarden vd random variabele
- Y-as: dichtheid f(x), opp onder curve tussen 2 punten a & b geeft kans P ( a ≤ X ≤ b )
Standaard deviatie
De standaarddeviatie is een maat voor de spreiding van een dataset en helpt te begrijpen hoe de
waarden zich rondom het gemiddelde verdelen. Deze wordt berekend als de (positieve)
vierkantswortel van de steekproefvariantie.
- Voor populatie:
√
N
1
σ= ∑
N i=1
( x i−µ )
2
o σ : standaarddeviatie vd populatie
o x i: individuele waarde
o µ: gemiddelde vd populatie
o N : # waarnemingen in populatie
- Voor steekproef:
√
n
1
s= ∑
n−1 i=1
( x i−x )
2
o s: standaarddeviatie vd steekproef
o x i: individuele waarde
o x : steekproefgemiddelde
o n : # waarnemingen in steekproef
Parameter
Een numerieke waarde die een kenmerk of eigenschap van een populatie beschrijft. Zoals
bijvoorbeeld: populatiegemiddelde, populatievariantie en populatieproportie.
Variabele
Een variabele is een kenmerk of eigenschap van eenheid in een dataset die kan variëren. Er zijn
verschillende soorten variabelen.
- Op basis van meetniveau en aard:
o Kwalitatieve (categorische) variabelen:
Beschrijven eigenschappen of categorieën zonder een numerieke waarde
Nominaal: Geen inherente volgorde (bijvoorbeeld geslacht, kleur)
Ordinaal: Met een volgorde, maar zonder vaste schaal (bijvoorbeeld
opleidingsniveau)
o Kwantitatieve (numerieke) variabelen:
Hebben een numerieke waarde en maken rekenkundige bewerkingen
mogelijk
Discreet: Beperkt tot specifieke waarden, vaak gehele getallen (bijvoorbeeld
aantal kinderen)
Continu: Kan elke waarde binnen een interval aannemen (bijvoorbeeld
lengte, gewicht)
- Een afhankelijke variabele is de variabele die je wilt voorspellen of verklaren.
- Een onafhankelijke variabele is de variabele die je gebruikt om veranderingen in de
afhankelijke variabele te verklaren.
= Probability Density Function: beschrijft waarschijnlijkheidsverdeling ve continue random variabele
Een PDF is een functie f(x) die aangeeft hoe de waarschijnlijkheid over de waarden van een continue
variabele is verdeeld. Het geeft de relatieve kansdichtheid op een bepaalde waarde, maar de kans op
een exacte waarde bij een continue variabele is altijd 0. De PDF wordt gebruikt om de kans te
berekenen dat de variabele binnen een bepaald interval valt.
Belangrijke eigenschappen ve PDF:
- Niet-negativiteit: voor alle waarden v x geldt f(x) ≥ 0
- Normalisatie: totale kans over alle mogelijke waarden is 1:
∞
∫ f ( x ) dx=1
−∞
- Waarschijnlijkheid binnen een interval: kans dat continue variabele X waarde aanneemt
binnen interval [a,b] wordt gegeven door:
b
P ( a ≤ X ≤ b )=∫ f ( x ) dx
a
Voorbeeld: voor standaard normale verdeling (met gemiddelde µ = 0 & standaardafwijking σ = 1), is
de PDF:
2
−x
1
f ( x )= e 2
√2 π
Visuele interpretatie: PDF vaak weergegeven als grafiek
- X-as: waarden vd random variabele
- Y-as: dichtheid f(x), opp onder curve tussen 2 punten a & b geeft kans P ( a ≤ X ≤ b )
Standaard deviatie
De standaarddeviatie is een maat voor de spreiding van een dataset en helpt te begrijpen hoe de
waarden zich rondom het gemiddelde verdelen. Deze wordt berekend als de (positieve)
vierkantswortel van de steekproefvariantie.
- Voor populatie:
√
N
1
σ= ∑
N i=1
( x i−µ )
2
o σ : standaarddeviatie vd populatie
o x i: individuele waarde
o µ: gemiddelde vd populatie
o N : # waarnemingen in populatie
- Voor steekproef:
√
n
1
s= ∑
n−1 i=1
( x i−x )
2
o s: standaarddeviatie vd steekproef
o x i: individuele waarde
o x : steekproefgemiddelde
o n : # waarnemingen in steekproef