Beschrijvende Statistiek
Berekeningen, Formules, Grafieken en Tabellen
Hoofdstuk 1;
Ruwe benadering van Margin of Error =
• n = aantal deelnemers in de steekproef
Hoofdstuk 2;
Dot Plot =
Stem-and-Leaf Plot =
Histogram =
The Mean (het gemiddelde) = balanspunt berekenen
• n = steekproefomvang
• x = waarde van de observatie
• ∑ = de som
• X-bar = de Mean
De Mediaan = middelste waarde van waarnemingen wanneer deze zijn gerangschikt
Berekenen →
• Waarnemingen rangschikken in volgorde van grootte
• Als het aantal waarnemingen (n) oneven is, is de mediaan de middelste waarneming
van de geordende steekproef
, • Als het aantal waarnemingen (n) even is, is de mediaan het gemiddelde van de twee
middelste waarnemingen van de geordende steekproef
Outlier = een ongewoon grote/kleine waarneming
• Bij een Standaard Deviation van 3 wordt een potentiële Outlier aangetoont
Range (bereik) = verschil tussen grootste en kleinste waarneming
• Wordt groter wanneer de waarde van gegevens meer variëren in de
verdeling/verspreiding
Deviation (afwijking) =
• Berekent het verschil tussen de observatie en de Mean van de steekproef
Formule →
• (X – X-bar)
Standaard Deviation (standaard afwijking) =
• Vertegenwoordigt ruwweg een typische soort gemiddelde afstand van waarneming
tot de Mean
• Hoe groter de standaard Deviatie, hoe groter de variabiliteit van de gegevens
Formule →
• S = Standaard Deviatie
• ∑(x – x-bar)2 = de som van kwadraten
• N = grootte van steekproef
• X = de waarde
• X-bar = de Mean
Empirische regel =
Empirische regel →
• 68% van alle waarden vallen binnen 1 standaard
deviatie van het gemiddelde
o Tussen de waarden van
‘x-bar – 1S’ en ‘x-bar + 1S’
• 95% van alle waarden vallen binnen 2 standaard
deviatie van het gemiddelde
o Tussen de waarden van
‘x-bar – 2S’ en ‘x-bar + 2S’
• Bijna alle waarden vallen binnen 3 standaard deviaties
van het gemiddelde
o Tussen de waarden van
‘x-bar – 3S’ en ‘x-bar + 3S’
,Percentiel = waarde van percent van observaties dat op/onder/boven de waarde vallen
Quartiles =
• Q1 → p = 25, 25th percentiel
• Q2 → Mediaan, p = 50, 50th percentiel
• Q3 → p = 75, 75th percentile
Interquartile Range (IQR) = afstand tussen Q3 en Q1
• Om de maat van de variabiliteit te definiëren
1.5 x IQR criteria = voor identificeren van potentiële Outliers
Outlier wanneer →
• 1.5 x IQR onder de Q1
• 1.5 x IQR boven de Q3 ligt
Box Plot = bevat de centrale 50% van de verdeling, Q1 tot Q3
• Whiskers → de grootste en kleinste waarnemingen
• Potentiële Outliers aangegeven met speciaal symbool (ster, punt)
Z-score = de score voor een waarneming geeft het aantal standaard deviation
dat de waarneming van het algemene gemiddelde (Mean) afligt
Hoofdstuk 3;
Contingency Table = weergave voor 2 categorische variabelen
Marginal Proportion = het aandeel van alle bemonsterde items in de tabel
Conditional Proportions = het onderscheid in frequentie in de tabel
, Meten van associaties =
Difference of Proportions →
• 73% om 23% → 73 – 23 = 50 Percentage Points
• Aanzienlijke associatie
• Geen associatie als resultaat gelijk is aan 0
Ratio of Proportions →
• 73% om 23% → 0..23 = 3.2 keer groter
• Aanzienlijke associatie
• Geen associatie gelijk of dichtbij 1
Odds Ratio → gebruik vooral in medische wereld
Scatterplot = grafische weergave voor 2 kwantitatieve variabelen waarbij de horizontale as
voor de Explanatory variabelen en de verticale as voor de Response variabelen wordt
gebruikt
Formule voor Correlatie
• r = de correlatie
• n = aantal observaties
• z = de z-score
o zx = de z-score voor de x-as
o zy = de z-score voor de y-as
Z→
Berekeningen, Formules, Grafieken en Tabellen
Hoofdstuk 1;
Ruwe benadering van Margin of Error =
• n = aantal deelnemers in de steekproef
Hoofdstuk 2;
Dot Plot =
Stem-and-Leaf Plot =
Histogram =
The Mean (het gemiddelde) = balanspunt berekenen
• n = steekproefomvang
• x = waarde van de observatie
• ∑ = de som
• X-bar = de Mean
De Mediaan = middelste waarde van waarnemingen wanneer deze zijn gerangschikt
Berekenen →
• Waarnemingen rangschikken in volgorde van grootte
• Als het aantal waarnemingen (n) oneven is, is de mediaan de middelste waarneming
van de geordende steekproef
, • Als het aantal waarnemingen (n) even is, is de mediaan het gemiddelde van de twee
middelste waarnemingen van de geordende steekproef
Outlier = een ongewoon grote/kleine waarneming
• Bij een Standaard Deviation van 3 wordt een potentiële Outlier aangetoont
Range (bereik) = verschil tussen grootste en kleinste waarneming
• Wordt groter wanneer de waarde van gegevens meer variëren in de
verdeling/verspreiding
Deviation (afwijking) =
• Berekent het verschil tussen de observatie en de Mean van de steekproef
Formule →
• (X – X-bar)
Standaard Deviation (standaard afwijking) =
• Vertegenwoordigt ruwweg een typische soort gemiddelde afstand van waarneming
tot de Mean
• Hoe groter de standaard Deviatie, hoe groter de variabiliteit van de gegevens
Formule →
• S = Standaard Deviatie
• ∑(x – x-bar)2 = de som van kwadraten
• N = grootte van steekproef
• X = de waarde
• X-bar = de Mean
Empirische regel =
Empirische regel →
• 68% van alle waarden vallen binnen 1 standaard
deviatie van het gemiddelde
o Tussen de waarden van
‘x-bar – 1S’ en ‘x-bar + 1S’
• 95% van alle waarden vallen binnen 2 standaard
deviatie van het gemiddelde
o Tussen de waarden van
‘x-bar – 2S’ en ‘x-bar + 2S’
• Bijna alle waarden vallen binnen 3 standaard deviaties
van het gemiddelde
o Tussen de waarden van
‘x-bar – 3S’ en ‘x-bar + 3S’
,Percentiel = waarde van percent van observaties dat op/onder/boven de waarde vallen
Quartiles =
• Q1 → p = 25, 25th percentiel
• Q2 → Mediaan, p = 50, 50th percentiel
• Q3 → p = 75, 75th percentile
Interquartile Range (IQR) = afstand tussen Q3 en Q1
• Om de maat van de variabiliteit te definiëren
1.5 x IQR criteria = voor identificeren van potentiële Outliers
Outlier wanneer →
• 1.5 x IQR onder de Q1
• 1.5 x IQR boven de Q3 ligt
Box Plot = bevat de centrale 50% van de verdeling, Q1 tot Q3
• Whiskers → de grootste en kleinste waarnemingen
• Potentiële Outliers aangegeven met speciaal symbool (ster, punt)
Z-score = de score voor een waarneming geeft het aantal standaard deviation
dat de waarneming van het algemene gemiddelde (Mean) afligt
Hoofdstuk 3;
Contingency Table = weergave voor 2 categorische variabelen
Marginal Proportion = het aandeel van alle bemonsterde items in de tabel
Conditional Proportions = het onderscheid in frequentie in de tabel
, Meten van associaties =
Difference of Proportions →
• 73% om 23% → 73 – 23 = 50 Percentage Points
• Aanzienlijke associatie
• Geen associatie als resultaat gelijk is aan 0
Ratio of Proportions →
• 73% om 23% → 0..23 = 3.2 keer groter
• Aanzienlijke associatie
• Geen associatie gelijk of dichtbij 1
Odds Ratio → gebruik vooral in medische wereld
Scatterplot = grafische weergave voor 2 kwantitatieve variabelen waarbij de horizontale as
voor de Explanatory variabelen en de verticale as voor de Response variabelen wordt
gebruikt
Formule voor Correlatie
• r = de correlatie
• n = aantal observaties
• z = de z-score
o zx = de z-score voor de x-as
o zy = de z-score voor de y-as
Z→