Statistiek
Samenvatting van alle hoofstukken voor deeltentamen 3
HS. 20 variabelen en hun verdelingen
- Beschrijvende statistiek het onderdeel van de statistiek dat zich bezighoudt met
methoden en technieken voor het creëren van overzicht en gegevens.
- Kerngetallen getallen die een bepaald aspect van een reeks gegevens karakteriseren.
Worden ook wel statistieken genoemd.
- Tabellen, visualiseren en kerngetallen meest gebruikte technieken
- Voorbeeld numerieke variabelen (variabelen waarvan de waarden getallen zijn) aantal
dendrieten aan een neuron of de concentratie van het stresshormoon cortisol in het speeksel
van een varken.
- Categorisch variabelen variabelen waarvan de waarden een categorie of groep
aanduiden. De waarden stellen geen meetbare hoeveelheden voor.
- De verschillende mogelijk waarden worden niveaus genoemd.
- Bijvoorbeeld: stadia kanker (0,I,II,III,IV)
1
,- Een verdeling wordt uniform genoemd als iedere uitkomst even vaak voorkomt
- Unimodaal een verdeling met een piek
- Bimodaal een verdeling met twee pieken
- Multimodaal verdeling met meerdere pieken
- Multimodale verdelingen ontstaan vaak als binnen een steekproef meerdere deelpopulaties
voorkomen met ieder een verschillend gemiddelde.
- Cumulatieve verdeling van een variabele laat zien welk deel van de waarnemingen kleiner
of gelijk is aan een bepaalde waarde.
- Cumulatieve proportie bv voor elke lichaamsgewicht op de x-as geeft de y-as aan welke
proportie van de waarnemingen kleiner of gelijk is aan die waarde.
- Cumulatieve frequentiepolygoon de grafiek van de cumulatieve verdeling.
2
, - Om de verdeling van een numerieke variabele kort te omschrijven geven we vaak twee
getallen. de eerste waarde geeft de ligging aan van de verdeling.
- Het tweede getal geeft de spreiding van de verdeling weer.
-centrummaten:
- modus waarde die het vaakst voorkomt
- meerdere pieken is meerdere modi
- mediaan middelste getal
- als het aantal waarnemingen n even is, dan bestaat zo’n middelste getal niet. In dat geval
nemen we het gemiddelde van de middelste twee getallen.
- gemiddelde som gedeeld door aantal waarden
- Index iedere individuele waarneming (n) een nummer geven
- Uitbijter een waarneming die ver buiten de rest van de reeks ligt
- Residu lengte lijn (afstand van een punt tot het gemiddelde)
3
, - Het gemiddelde is dus niet de waarde die de som van de residuen minimaliseert
- Het gemiddelde is wel de waarde die de kwadratensom minimaliseert: de som van de
kwadraten van de residuen
Spreidingsmaten:
- Bereik het interval dat begint bij het kleinste getal en eindigt met het grootste getal.
- Kwartielen 4 kwarten
- Interkwartielafstand Q3 – Q1
- Percentielen P25 enz.
- In algemene termen worden statistieken zoals kwartielen en percentielen samen aangeduid
als kwantielen.
- Variatie gedefinieerd als de gemiddelde gekwadrateerde afwijking van de waarnemingen
ten opzichte van hun gemiddelde.
4
Samenvatting van alle hoofstukken voor deeltentamen 3
HS. 20 variabelen en hun verdelingen
- Beschrijvende statistiek het onderdeel van de statistiek dat zich bezighoudt met
methoden en technieken voor het creëren van overzicht en gegevens.
- Kerngetallen getallen die een bepaald aspect van een reeks gegevens karakteriseren.
Worden ook wel statistieken genoemd.
- Tabellen, visualiseren en kerngetallen meest gebruikte technieken
- Voorbeeld numerieke variabelen (variabelen waarvan de waarden getallen zijn) aantal
dendrieten aan een neuron of de concentratie van het stresshormoon cortisol in het speeksel
van een varken.
- Categorisch variabelen variabelen waarvan de waarden een categorie of groep
aanduiden. De waarden stellen geen meetbare hoeveelheden voor.
- De verschillende mogelijk waarden worden niveaus genoemd.
- Bijvoorbeeld: stadia kanker (0,I,II,III,IV)
1
,- Een verdeling wordt uniform genoemd als iedere uitkomst even vaak voorkomt
- Unimodaal een verdeling met een piek
- Bimodaal een verdeling met twee pieken
- Multimodaal verdeling met meerdere pieken
- Multimodale verdelingen ontstaan vaak als binnen een steekproef meerdere deelpopulaties
voorkomen met ieder een verschillend gemiddelde.
- Cumulatieve verdeling van een variabele laat zien welk deel van de waarnemingen kleiner
of gelijk is aan een bepaalde waarde.
- Cumulatieve proportie bv voor elke lichaamsgewicht op de x-as geeft de y-as aan welke
proportie van de waarnemingen kleiner of gelijk is aan die waarde.
- Cumulatieve frequentiepolygoon de grafiek van de cumulatieve verdeling.
2
, - Om de verdeling van een numerieke variabele kort te omschrijven geven we vaak twee
getallen. de eerste waarde geeft de ligging aan van de verdeling.
- Het tweede getal geeft de spreiding van de verdeling weer.
-centrummaten:
- modus waarde die het vaakst voorkomt
- meerdere pieken is meerdere modi
- mediaan middelste getal
- als het aantal waarnemingen n even is, dan bestaat zo’n middelste getal niet. In dat geval
nemen we het gemiddelde van de middelste twee getallen.
- gemiddelde som gedeeld door aantal waarden
- Index iedere individuele waarneming (n) een nummer geven
- Uitbijter een waarneming die ver buiten de rest van de reeks ligt
- Residu lengte lijn (afstand van een punt tot het gemiddelde)
3
, - Het gemiddelde is dus niet de waarde die de som van de residuen minimaliseert
- Het gemiddelde is wel de waarde die de kwadratensom minimaliseert: de som van de
kwadraten van de residuen
Spreidingsmaten:
- Bereik het interval dat begint bij het kleinste getal en eindigt met het grootste getal.
- Kwartielen 4 kwarten
- Interkwartielafstand Q3 – Q1
- Percentielen P25 enz.
- In algemene termen worden statistieken zoals kwartielen en percentielen samen aangeduid
als kwantielen.
- Variatie gedefinieerd als de gemiddelde gekwadrateerde afwijking van de waarnemingen
ten opzichte van hun gemiddelde.
4