Hoofdstuk 1: Inleiding statistische methoden voor geografie
1.1 ‘WETENSCHAPPELIJKE METHODE’
1.2 EXPLORATIEVE EN CONFIRMATIEVE BENADERINGEN
1. exploratieve methode: gegevens verkennen
2. confirmatieve methode: een hypothese testen op basis van de gegevens
1.3 KANSEN EN STATISTIEKEN
1.3.1 Kansen
= maat van onzekerheid tussen 0 (geen kans) en 1
1.3.2 Statistiek
= verzameling, classificatie, presentatie en analyse van gegevens die een deel van een populatie uitmaken
1.4 DESCRIPTIEVE EN INFERENTIËLE METHODEN
descriptieve/beschrijvende statistiek inferentiële statistiek
1. exploratieve methode 1. confirmatieve methode
2. beschrijving en samenvatting van karakteristieken van steekproef 2. iets over populatie afleiden uit de steekproef
1.5 SPECIFIEKE AANDACHT VOOR RUIMTELIJKE DATA
1.5.1 The Modifiable Areal Unit Problem
de resultaten van statistische analyses worden beïnvloed door de zonering van de geaggregeerde data
1.5.2 Grensovergangen
fenomenen net buiten het studiegebied kunnen deze in het studiegebied beïnvloeden
1.5.3 Ruimtelijke steekproeven
vaak ruimtelijk gestratificeerde steekproef nodig i.p.v. random steekproef
1.5.4 Ruimtelijke autocorrelatie
waarde van een variabele op een locatie is gerelateerd met waardes voor dezelfde variabele in buurt van die locatie
op zich relevante info voor een geograaf, maar ook een potentieel statistisch probleem:
in statistiek wordt vaak verondersteld dat observaties onafhankelijk moeten zijn,
dus foute interpretaties zijn mogelijk
,Hoofdstuk 2: Beschrijvende statistiek
2.1 DATATYPES
- nominaal: unieke, aparte observaties
- ordinaal: observaties met een rangorde groter/kleiner
- interval: observaties met een numerieke waarde met meetbare verschillen maar waarbij een nulpunt weinig zegt
- ratio: observaties met een numerieke waarde en zinvolle verhoudingen (absoluut nulpunt)
discreet continue
eindig aantal opties waarde met oneindig aantal opties is (meetbaar)
2.2 VISUELE BESCHRIJVENDE METHODES
histogram boxplot in SPSS (niet in
- box Excel)
- x-as: variabele – categorieën - snorharen: Q1 – 1,5(Q3-Q1) en Q3 +
- y-as: frequentie 1,5(Q3-Q1)
- uitschieters
2.3 CENTRALITEITSMATEN
gem., mediaan, modus (= meest voorkomende waarde), gegroepeerd gem. (data middelste waarde categorie)
2.4 SPREIDINGSMATEN
min. & max., spreidingsbreedte/range (= max. - min.), interkwartielafstand,
variantie s² (= 1 maat voor afwijking t.o.v. het gem.), standaardafwijking s
2.5 ANDERE NUMERIEKE BESCHRIJVENDE METHODES
2.5.1 Variatiecoëfficiënt
- vergelijking variabiliteit tussen verschillende verdelingen
- eenheidsloze maat
2.5.2 Scheefheid/skewness (eenheidsloze maat)
meer lage waarden
2.5.3 Kurtosis = platheid/puntigheid van het histogram
leptokurtosys (>3) platykurtosis (<3)
2.5.4 Standaardscore (z-score)
eenheidsloze maat die voor elke observatie weergeeft hoeveel standaardafwijkingen het verwijderd is van het gem.
, 2.6 BESCHRIJVENDE RUIMTELIJKE STATISTIEK
2.6.1 Afstandsmeting
- op mondiale schaal: grootcirkelafstand
- aanname: de aarde is plat
Euclidische (kortste afstand tussen 2 punten) en Manhattan afstand (hor. en vert. afstand tussen 2 punten)
2.6.2 Zwaartepunt of centroïd
- gem. x en y
- evt. met gewichten wi gewogen zwaartepunt
- n = aantal gebieden
2.6.3 Standaardafstand
- ruimtelijke variatie van locaties rond een centraal punt (ruimtelijke standaarddeviatie)
- maat voor absolute spreiding, die eig. wordt beïnvloed door de grootte van het studiegebied
- dic = afstand punt i tot zwaartepunt
n = aantal locaties rond het centrale punt
- afstanden zijn altijd pos.
2.6.4 Relatieve standaardafstand
- r = straal cirkel
- s = zijde vierkant
2.6.5 Hoekgegevens
circulair histogram of roosdiagram indien relevant voor data
hoekgem. S = gem. sinussen C = gem. cosinussen
circulaire variantie = 1 - R
2.7 DESCRIPTIEVE STATISTIEK IN SPSS
2.7.1 Data input
toevoegen ID’s: Transform > Compute variable
2.7.2 Eenvoudig beschrijvende statistiek
Analyze > Descriptive Statistics > Explore > Dependent List
Name: titel aanpassen
Type: type variabele (tekst, getal, …)
Measure: meetniveau Scale/geschaald, Ordinal/ordinal en Nominal/nominaal
2.7.3 Opties
Plots > Histogram
range selecteren: Data > Select Cases… > Based on time or case range > Range…
TIPS EXCEL
Kwadrateren: ^2
Functie gemiddelde: =AVERAGE(…) =GEMIDDELDE(…)
1.1 ‘WETENSCHAPPELIJKE METHODE’
1.2 EXPLORATIEVE EN CONFIRMATIEVE BENADERINGEN
1. exploratieve methode: gegevens verkennen
2. confirmatieve methode: een hypothese testen op basis van de gegevens
1.3 KANSEN EN STATISTIEKEN
1.3.1 Kansen
= maat van onzekerheid tussen 0 (geen kans) en 1
1.3.2 Statistiek
= verzameling, classificatie, presentatie en analyse van gegevens die een deel van een populatie uitmaken
1.4 DESCRIPTIEVE EN INFERENTIËLE METHODEN
descriptieve/beschrijvende statistiek inferentiële statistiek
1. exploratieve methode 1. confirmatieve methode
2. beschrijving en samenvatting van karakteristieken van steekproef 2. iets over populatie afleiden uit de steekproef
1.5 SPECIFIEKE AANDACHT VOOR RUIMTELIJKE DATA
1.5.1 The Modifiable Areal Unit Problem
de resultaten van statistische analyses worden beïnvloed door de zonering van de geaggregeerde data
1.5.2 Grensovergangen
fenomenen net buiten het studiegebied kunnen deze in het studiegebied beïnvloeden
1.5.3 Ruimtelijke steekproeven
vaak ruimtelijk gestratificeerde steekproef nodig i.p.v. random steekproef
1.5.4 Ruimtelijke autocorrelatie
waarde van een variabele op een locatie is gerelateerd met waardes voor dezelfde variabele in buurt van die locatie
op zich relevante info voor een geograaf, maar ook een potentieel statistisch probleem:
in statistiek wordt vaak verondersteld dat observaties onafhankelijk moeten zijn,
dus foute interpretaties zijn mogelijk
,Hoofdstuk 2: Beschrijvende statistiek
2.1 DATATYPES
- nominaal: unieke, aparte observaties
- ordinaal: observaties met een rangorde groter/kleiner
- interval: observaties met een numerieke waarde met meetbare verschillen maar waarbij een nulpunt weinig zegt
- ratio: observaties met een numerieke waarde en zinvolle verhoudingen (absoluut nulpunt)
discreet continue
eindig aantal opties waarde met oneindig aantal opties is (meetbaar)
2.2 VISUELE BESCHRIJVENDE METHODES
histogram boxplot in SPSS (niet in
- box Excel)
- x-as: variabele – categorieën - snorharen: Q1 – 1,5(Q3-Q1) en Q3 +
- y-as: frequentie 1,5(Q3-Q1)
- uitschieters
2.3 CENTRALITEITSMATEN
gem., mediaan, modus (= meest voorkomende waarde), gegroepeerd gem. (data middelste waarde categorie)
2.4 SPREIDINGSMATEN
min. & max., spreidingsbreedte/range (= max. - min.), interkwartielafstand,
variantie s² (= 1 maat voor afwijking t.o.v. het gem.), standaardafwijking s
2.5 ANDERE NUMERIEKE BESCHRIJVENDE METHODES
2.5.1 Variatiecoëfficiënt
- vergelijking variabiliteit tussen verschillende verdelingen
- eenheidsloze maat
2.5.2 Scheefheid/skewness (eenheidsloze maat)
meer lage waarden
2.5.3 Kurtosis = platheid/puntigheid van het histogram
leptokurtosys (>3) platykurtosis (<3)
2.5.4 Standaardscore (z-score)
eenheidsloze maat die voor elke observatie weergeeft hoeveel standaardafwijkingen het verwijderd is van het gem.
, 2.6 BESCHRIJVENDE RUIMTELIJKE STATISTIEK
2.6.1 Afstandsmeting
- op mondiale schaal: grootcirkelafstand
- aanname: de aarde is plat
Euclidische (kortste afstand tussen 2 punten) en Manhattan afstand (hor. en vert. afstand tussen 2 punten)
2.6.2 Zwaartepunt of centroïd
- gem. x en y
- evt. met gewichten wi gewogen zwaartepunt
- n = aantal gebieden
2.6.3 Standaardafstand
- ruimtelijke variatie van locaties rond een centraal punt (ruimtelijke standaarddeviatie)
- maat voor absolute spreiding, die eig. wordt beïnvloed door de grootte van het studiegebied
- dic = afstand punt i tot zwaartepunt
n = aantal locaties rond het centrale punt
- afstanden zijn altijd pos.
2.6.4 Relatieve standaardafstand
- r = straal cirkel
- s = zijde vierkant
2.6.5 Hoekgegevens
circulair histogram of roosdiagram indien relevant voor data
hoekgem. S = gem. sinussen C = gem. cosinussen
circulaire variantie = 1 - R
2.7 DESCRIPTIEVE STATISTIEK IN SPSS
2.7.1 Data input
toevoegen ID’s: Transform > Compute variable
2.7.2 Eenvoudig beschrijvende statistiek
Analyze > Descriptive Statistics > Explore > Dependent List
Name: titel aanpassen
Type: type variabele (tekst, getal, …)
Measure: meetniveau Scale/geschaald, Ordinal/ordinal en Nominal/nominaal
2.7.3 Opties
Plots > Histogram
range selecteren: Data > Select Cases… > Based on time or case range > Range…
TIPS EXCEL
Kwadrateren: ^2
Functie gemiddelde: =AVERAGE(…) =GEMIDDELDE(…)