Hoofdstuk 5; De populatie en verdelingsfunctie
Frequentieverdeling (steekproef) = verdelingsfunctie op populatieniveau
Verdelingsfunctie bij discrete variabelen
➢ Variabele = eindig
➢ Populatie = oneindig
➢ P(X=xi) interpreteren als relatieve frequentie van xi in de populatie
➢ Cumulatieve verdelingsfunctie = trapsgewijs
Verdelingsfunctie continue variabelen
➢ Variabele = oneindig
➢ P(X = x) = 0 => ALTIJD!
➢ Om kansen te berekenen (bij continu) moeten we beroep doen op dichtheidsfunctie
➢ Cumulatieve verdelingsfunctie = continu
De kansverdeling
➢ P(X = xi)
➢ Gelijkheid!
De cumulatieve verdelingsfunctie
➢ Fx(x) = P(X ≤ x)
➢ Ongelijkheid!
De dichtheidsfunctie
➢ Integralen = oppervlakte berekenen = visualiseren
➢ Altijd positief – kan nooit negatieve waarden aannemen!
➢ De volledige oppervlakte onder dichtheidsfunctie = 1
➢ P (X > x) = 1 – P (X ≤ x)
➢ P = populatie
Er geld dat:
P(xi ≤ X ≤ x2) = P(X ≤ x2) – P(X ≤ xi) = Fx(x2) – Fx(x1)
P(90 ≤ IQ ≤ 110) = P(0.85 ≤ 110) – P(0.15 ≤ 90) = 0.85 – 0.15 = 0.70
, Populatieparameters
Populatiegemiddelde
➢ = verwachtingswaarde
Discrete variabelen
➢ Symbolen: E(X), 𝛍 en 𝛍x
➢ E(X) = ∑𝑝𝑖=1 𝑃(𝑋 = 𝑥𝑖)𝑥𝑖
Continue variabelen
➢ integralen
Variantie
Discrete variabelen
➢ symbool: V(X), 𝜎 2 𝑥 en 𝜎 2
➢ V(X) = ∑𝑝𝑖=1 𝑃(𝑋 = 𝑥𝑖)(𝑥𝑖 − 𝐸(𝑋))2
Continue variabelen
➢ integralen
Standaarddeviatie
➢ symbool: 𝛔
➢ heel formule van V(X) onder vierkantswortel
Bivariate statistiek
Discrete variabelen
➢ X en Y zijn onafhankelijk als: P(X = xi en Y = yi) = P(X = xi)P(Y=yi)
➢ Covariantie: COV(X,Y) = ∑𝑝𝑖=1 ∑𝑞𝑗=1 𝑃(𝑋 = 𝑥𝑖 𝑒𝑛 𝑌 = 𝑦𝑖)(𝑥𝑖 − 𝐸(𝑋))(𝑦𝑗 − (𝐸(𝑌))
𝐶𝑂𝑉(𝑋,𝑌)
➢ Correlatiecoëfficiënt: 𝑝𝑥𝑦 =
𝜎𝑥𝜎𝑦
Frequentieverdeling (steekproef) = verdelingsfunctie op populatieniveau
Verdelingsfunctie bij discrete variabelen
➢ Variabele = eindig
➢ Populatie = oneindig
➢ P(X=xi) interpreteren als relatieve frequentie van xi in de populatie
➢ Cumulatieve verdelingsfunctie = trapsgewijs
Verdelingsfunctie continue variabelen
➢ Variabele = oneindig
➢ P(X = x) = 0 => ALTIJD!
➢ Om kansen te berekenen (bij continu) moeten we beroep doen op dichtheidsfunctie
➢ Cumulatieve verdelingsfunctie = continu
De kansverdeling
➢ P(X = xi)
➢ Gelijkheid!
De cumulatieve verdelingsfunctie
➢ Fx(x) = P(X ≤ x)
➢ Ongelijkheid!
De dichtheidsfunctie
➢ Integralen = oppervlakte berekenen = visualiseren
➢ Altijd positief – kan nooit negatieve waarden aannemen!
➢ De volledige oppervlakte onder dichtheidsfunctie = 1
➢ P (X > x) = 1 – P (X ≤ x)
➢ P = populatie
Er geld dat:
P(xi ≤ X ≤ x2) = P(X ≤ x2) – P(X ≤ xi) = Fx(x2) – Fx(x1)
P(90 ≤ IQ ≤ 110) = P(0.85 ≤ 110) – P(0.15 ≤ 90) = 0.85 – 0.15 = 0.70
, Populatieparameters
Populatiegemiddelde
➢ = verwachtingswaarde
Discrete variabelen
➢ Symbolen: E(X), 𝛍 en 𝛍x
➢ E(X) = ∑𝑝𝑖=1 𝑃(𝑋 = 𝑥𝑖)𝑥𝑖
Continue variabelen
➢ integralen
Variantie
Discrete variabelen
➢ symbool: V(X), 𝜎 2 𝑥 en 𝜎 2
➢ V(X) = ∑𝑝𝑖=1 𝑃(𝑋 = 𝑥𝑖)(𝑥𝑖 − 𝐸(𝑋))2
Continue variabelen
➢ integralen
Standaarddeviatie
➢ symbool: 𝛔
➢ heel formule van V(X) onder vierkantswortel
Bivariate statistiek
Discrete variabelen
➢ X en Y zijn onafhankelijk als: P(X = xi en Y = yi) = P(X = xi)P(Y=yi)
➢ Covariantie: COV(X,Y) = ∑𝑝𝑖=1 ∑𝑞𝑗=1 𝑃(𝑋 = 𝑥𝑖 𝑒𝑛 𝑌 = 𝑦𝑖)(𝑥𝑖 − 𝐸(𝑋))(𝑦𝑗 − (𝐸(𝑌))
𝐶𝑂𝑉(𝑋,𝑌)
➢ Correlatiecoëfficiënt: 𝑝𝑥𝑦 =
𝜎𝑥𝜎𝑦