Elementaire Statistiek
Periode 4 – Vastgoedkunde Hogeschool Rotterdam
General notes: 30% gesloten vraag – 70% open vraag
Operationaliseren en meten
Een variabele is een geoperationaliseerd begrip waarvan precies is aangegeven hoe het wordt
gemeten. Variabelen variëren en kunnen dus verschillende waarden aannemen. Zo heeft de
variabele ‘woningtype' bijvoorbeeld de waarden ‘koopwoning' en ‘huurwoning’.
Er zijn discrete variabelen (waarden zijn gehele getallen) en continue variabelen (verschil tussen
twee waarden kan willekeurig klein zijn, meten met decimalen). Voorbeeld:
variabele a: aantal vrienden op facebook → discrete variabele
variabele b: gemiddelde tijd per dag op facebook → continue variabele
De meetniveaus:
1. Nominaal: Enkel onderscheid in categorieën. Voorbeeld: geslacht, woonplaats
2. Ordinaal: Onderscheid in categorieën, én er zit een ordening in de categorieën. Voorbeeld:
maat kleding (S, M, L, XL)
3. Interval: Er is géén absoluut nulpunt, het interval tussen 2 schaalpunten heeft een
numerieke betekenis. Voorbeeld: temperatuur in graden Celsius, bouwjaar
4. Ratio: De verhouding tussen 2 schaalpunten heeft een numerieke betekenis, er is wél een
absoluut nulpunt. Voorbeeld: lengte, gewicht, inkomen.
Scale variabele: interval en ratio worden samengevoegd
Frequentieverdelingen, zie tabel hiernaast
Absolute frequentie: het aantal waarnemingen per klasse
Relatieve frequentie: het aantal waarnemingen per klasse
gedeeld door het totaal aantal waarnemingen, eventueel
vermenigvuldigd met 100%.
Cumulatieve frequentie: bij ordinale variabelen, het
voorgaande % meetellen in eind percentage (optellen)
Overzichtelijkheid staat voor de lezer voorop, daarom kun je data indelen in klassen. Dit is
bijvoorbeeld handig voor bouwjaren. Zie tabel hieronder.
,Grafieken
Cirkeldiagram (taartdiagram, pie-chart) - Nominale variabelen
Staafdiagram (staven zijn los van elkaar) (bar chart) - Nominale- of ordinale variabelen
Histogram (staven zijn aan elkaar geplakt) - Scale variabelen
Boxplot - Scale variabelen
Centrummaten
Gemiddelde/mean: Som van alle scores gedeeld door het aantal scores
Modus/mode: Meest voorkomende waarneming*
Mediaan/median: Oneven aantal waarnemingen: middelste waarneming
Even aantal waarnemingen: gemiddelde van de middelste 2 waarnemingen
Percentielscore: cumulatief percentage
Kwartiel- en decielscore: de scores worden opgedeeld in groepjes van respectievelijk 25% en 10%
Sigma notatie ∑
∑ (spreek uit: “Sigma”) is de Griekse hoofdletter S
∑ → Sommatie = optellen (gewoon weten op de GR)
,Heel vaak bedoelen we met “het gemiddelde” het rekenkundig gemiddelde. Maar er zijn meerdere
gemiddelden:
- Gewogen gemiddelde
- Voortschrijdend gemiddelde
- Meetkundig gemiddelde
- Harmonisch gemiddelde
- Getrimd / gewinsoriseerd gemiddelde
- ...en vele anderen!
Speidingsmaten
Hoe verspreid liggen alle waarden?
- Laagste cijfer, hoogste cijfer?
- IQR, standaardafwijking, variantie
Spreidingsmaten geven een indicatie voor de grootte van de verschillen tussen de scores.
Het uitgangspunt bij spreidingsmaten is hierbij:
- Grote waarde ↔ veel spreiding (waarnemingen liggen ver uit elkaar)
- Kleine waarde ↔ weinig spreiding (waarnemingen liggen dicht bij elkaar)
, 1. Bereik (range)
Verschil tussen hoogste en laagste waarde
- Probleem: Zéér gevoelig voor uitschieters....
2. Interkwartielafstand (IQR)
Verschil tussen twee kwatielen
IQR=Q3-Q1
- waarin: Q3= derde kwartiel (=P75) Q1= eerste kwartiel (=P25)
Toepassing boxplotgrafiek
Boxplot
(variabele bouwjaar, naoorlogse woningen, Zuid-Holland, gespecificeerd per type woning)
3. Variantie
Gemiddelde gekwadrateerde afwijking ten opzichte van het gemiddelde”
Recept:
1. Bereken hoeveel iedere waarneming (xi) afwijkt ten opzichte van het gemiddelde 𝑥
(=afwijkingsscore = xi-𝑥)
2. Kwadrateer deze afwijkingesscores en tel ze op
3. Deel dit getal door het aantal waarnemingen (n)
Symbool: s2 (vanwege stapje 2 in bovenstaand recept)
Periode 4 – Vastgoedkunde Hogeschool Rotterdam
General notes: 30% gesloten vraag – 70% open vraag
Operationaliseren en meten
Een variabele is een geoperationaliseerd begrip waarvan precies is aangegeven hoe het wordt
gemeten. Variabelen variëren en kunnen dus verschillende waarden aannemen. Zo heeft de
variabele ‘woningtype' bijvoorbeeld de waarden ‘koopwoning' en ‘huurwoning’.
Er zijn discrete variabelen (waarden zijn gehele getallen) en continue variabelen (verschil tussen
twee waarden kan willekeurig klein zijn, meten met decimalen). Voorbeeld:
variabele a: aantal vrienden op facebook → discrete variabele
variabele b: gemiddelde tijd per dag op facebook → continue variabele
De meetniveaus:
1. Nominaal: Enkel onderscheid in categorieën. Voorbeeld: geslacht, woonplaats
2. Ordinaal: Onderscheid in categorieën, én er zit een ordening in de categorieën. Voorbeeld:
maat kleding (S, M, L, XL)
3. Interval: Er is géén absoluut nulpunt, het interval tussen 2 schaalpunten heeft een
numerieke betekenis. Voorbeeld: temperatuur in graden Celsius, bouwjaar
4. Ratio: De verhouding tussen 2 schaalpunten heeft een numerieke betekenis, er is wél een
absoluut nulpunt. Voorbeeld: lengte, gewicht, inkomen.
Scale variabele: interval en ratio worden samengevoegd
Frequentieverdelingen, zie tabel hiernaast
Absolute frequentie: het aantal waarnemingen per klasse
Relatieve frequentie: het aantal waarnemingen per klasse
gedeeld door het totaal aantal waarnemingen, eventueel
vermenigvuldigd met 100%.
Cumulatieve frequentie: bij ordinale variabelen, het
voorgaande % meetellen in eind percentage (optellen)
Overzichtelijkheid staat voor de lezer voorop, daarom kun je data indelen in klassen. Dit is
bijvoorbeeld handig voor bouwjaren. Zie tabel hieronder.
,Grafieken
Cirkeldiagram (taartdiagram, pie-chart) - Nominale variabelen
Staafdiagram (staven zijn los van elkaar) (bar chart) - Nominale- of ordinale variabelen
Histogram (staven zijn aan elkaar geplakt) - Scale variabelen
Boxplot - Scale variabelen
Centrummaten
Gemiddelde/mean: Som van alle scores gedeeld door het aantal scores
Modus/mode: Meest voorkomende waarneming*
Mediaan/median: Oneven aantal waarnemingen: middelste waarneming
Even aantal waarnemingen: gemiddelde van de middelste 2 waarnemingen
Percentielscore: cumulatief percentage
Kwartiel- en decielscore: de scores worden opgedeeld in groepjes van respectievelijk 25% en 10%
Sigma notatie ∑
∑ (spreek uit: “Sigma”) is de Griekse hoofdletter S
∑ → Sommatie = optellen (gewoon weten op de GR)
,Heel vaak bedoelen we met “het gemiddelde” het rekenkundig gemiddelde. Maar er zijn meerdere
gemiddelden:
- Gewogen gemiddelde
- Voortschrijdend gemiddelde
- Meetkundig gemiddelde
- Harmonisch gemiddelde
- Getrimd / gewinsoriseerd gemiddelde
- ...en vele anderen!
Speidingsmaten
Hoe verspreid liggen alle waarden?
- Laagste cijfer, hoogste cijfer?
- IQR, standaardafwijking, variantie
Spreidingsmaten geven een indicatie voor de grootte van de verschillen tussen de scores.
Het uitgangspunt bij spreidingsmaten is hierbij:
- Grote waarde ↔ veel spreiding (waarnemingen liggen ver uit elkaar)
- Kleine waarde ↔ weinig spreiding (waarnemingen liggen dicht bij elkaar)
, 1. Bereik (range)
Verschil tussen hoogste en laagste waarde
- Probleem: Zéér gevoelig voor uitschieters....
2. Interkwartielafstand (IQR)
Verschil tussen twee kwatielen
IQR=Q3-Q1
- waarin: Q3= derde kwartiel (=P75) Q1= eerste kwartiel (=P25)
Toepassing boxplotgrafiek
Boxplot
(variabele bouwjaar, naoorlogse woningen, Zuid-Holland, gespecificeerd per type woning)
3. Variantie
Gemiddelde gekwadrateerde afwijking ten opzichte van het gemiddelde”
Recept:
1. Bereken hoeveel iedere waarneming (xi) afwijkt ten opzichte van het gemiddelde 𝑥
(=afwijkingsscore = xi-𝑥)
2. Kwadrateer deze afwijkingesscores en tel ze op
3. Deel dit getal door het aantal waarnemingen (n)
Symbool: s2 (vanwege stapje 2 in bovenstaand recept)