2e
bachelor
Onderzoeksmethodolo
gie & statistiek 1
STATISTIEK 1 – NELE STRUYF
FEBE VERHEYDEN
1E BACHELOR REVALIDATIEWETENSCHAPPEN EN KINESITHERAPIE
ACADEMIEJAAR 2023-2024
,STATISTIEK 1
Hoofdstuk 2 – het abc van de stati sti ek
2.1 Inleiding
Wereldwijde coronapandemie
- Langdurige & grootschalige veranderingen → stijging werkloosheid, eenzaamheid, ziekte
- Wereldwijd door academici gevolgd & onderzocht (relevant en interessant)
Onderzoeksvragen beantwoorden
1. Gegevens/kenmerken verzamelen over onderzoekspopulatie → variabelen
2. Juiste descriptieve (= beschrijvende) of inferentiële (=verklarende) analysetechniek kiezen
3. Statistische analyse uitvoeren op verzamelde gegevens
3 bepalende factoren
- Aantal variabelen
o Hoeveel variabelen aanwezig in onderzoeksvraag
o Variabelen = alles gegevens die je gaat meten/ondervragen (soms 1, soms meerdere)
o Hoeveel gegevens in database moet ik bekijken/vergelijken met elkaar
- Meetniveau
o Categorische variabelen → verschillende waarden stellen bepaalde categorie voor
Nominale & ordinale variabelen
o Metrische variabelen → continue, numerieke waarden aan, bewerkingen uitvoeren
Interval & ratio variabelen
- Rol die variabelen vervullen in onderzoeksvraag
o Afhankelijke & onafhankelijke variabelen indelen
2.2 Meetniveau van variabelen
Variabelen = kenmerken populatie waarin je als onderzoek geïnteresseer bent & telkens kunnen
variëren wanneer ze gemeten worden bij verschillende onderzoekseenheden/tijdstippen/plaatsen
Onderzoekseenheden → dingen die je onderzoekt
- Respondenten
o Vb. variabele ‘gender’ en ‘gewicht’
- Producten/diensten zoals socialemedia-apps
o Vb. variabele ‘aantal actieve gebruikers'
1
,2.2.1 Categorische variabelen
- Nominale variabelen
o Individuen/objecten indelen in gelijkwaardige klassen of categorieën
o Categorieën benoemen met bepaalde waarde, geen echte getalwaarde
o Niet in logische volgorde zetten, geen rangorde of berekeningen
o Klassen zijn discreet → komen geen tussenliggende waarden voor
o Toekenning waarden willekeurig, enkel om categorieën uit elkaar te houden
o Vb. geslacht (0 = man, 1 = vrouw, 2 = anders)
- Ordinale variabelen
o Tussen verschillende categorieën zit bepaalde ordening of rangorde
o Laten niet toe uitspraak te doen over ‘hoeveel meer of beter’
o Geen vaste meeteenheid → geen rekenkundige berekeningen
o Klassen zijn discreet → komen geen tussenliggende waarden voor
Kwalitatieve variabelen = codes, je hebt daar geen
parameters van die je kan gebruiken (geen
gemiddelde, SD berekenen)
Parametrische statistiek kan alleen bij kwantitative
variabelen → je kan met parameters van een waarde
aan de slag (gemiddelde, SD berekenen)
2.2.2 Metrische variabelen
= waarden van variabelen vertegenwoordigen specifieke numerieke score, je weet precies hoe ver de
waarnemingen uit elkaar liggen en er zijn tussenliggende waarden mogelijk
- Intervalvariabelen
o Kennen geen absoluut nulpunt, verschil tussen waarden is betekenisvol
o Oneindig veel mogelijke tussenliggende waarden
o Verhoudingen tussen waarden is niet zilvol !!
o Alleen optellen & aftrekken, geen gemiddelde berekenen
- Ratiovariabelen
o Wel absoluut nulpunt → maakt verschil tussen het zijn en niet zijn
o Vb. een doos die 0g weegt, bestaat niet, iemand met 0 euro is blut
o Verschil tussen waarden is betekenisvol, oneindig veel tussenliggende waarden
o Verhoudingen tussen de waarden is zinvol !!
o Vermenigvuldigen & delen, gemiddelde, SD berekenen
2
,2.2.3 Hiërarchie van meetniveaus
- Hiërarchie tussen de meetniveau’s van belang voor statistische bewerkingen
- Hoe hoger gerangschikt, hoe meer bewerkingen of anayse bepaald meetniveau toelaat
- Ratio > interval > ordinaal > nominaal
- Elk meetniveau is altijd even nuttig/waardevol → ene informatierijker dan ander
Vb. pijnnniveau na behandeling
Ø Pijn metrisch meten > pijn nominaal meten (0 = nee, 1 = ja)
Ø Nominale variabele geslacht meten = extra informatie, pijnniveau vergelijken tussen
de 2 doelgroepen
- Metrische variabelen kan je achteraf altijd categorisch maken → omgekeerd niet !!
- Vraagstelling in survey belangrijk → hoger meetniveau = meer informatie
Vb. leetijd
Ø Eerst metrisch gemeten (19 jaar)
Ø Achteraf toewijzen aan bredere maar minder informatierijke categorie steeds
mogelijk (categorie 18-24 jaar)
Ø Initieel ordinaal gemeten (18-24 jaar)
Ø Onmogelijk om nadien te achterhalen wat iemands exacte leeftijd was, je blijft
vasthangen op het ordinale niveau
Likertschalen = ordinale variabelen die tot één schaal behoren omvormen tot metrische schaal
2.3 De rol van variabelen in de onderzoeksvraag
- Als onderzoeker vaak geïnterreseerd in relatie tussen verschillende variabelen
- Variabelen worden beïnvloed door andere variabelen of gaan zelf andere beïnvloeden
- Weten welke vd 3 rollen elke variabele vervult, voordat je bepaalde analysetechniek toepast
2.3.1 Afh ankelijke variabelen
- Variabele waar hele onderzoeksvraag rond draait
- Eindpunt van je analyse → uitkomstvariabele (letter ‘Y’)
- Afhankelijk van omgeving, kunnen veranderen door invloed van andere variabele
- De verandering in Y = meest interessant voor onderzoekers
Vb. ‘gebruiken jongeren meer drugs dan ouderen?’
Ø Afhankelijke variabele = druggebruik
Ø Leeftijd is niet beïnvloedbaar → onafhankelijk
Ø Druggebruik is als enige beïnvloedbare factor
3
, Vb. ‘verband longkanker en roken’
Ø Longkanker = afhankelijke variabele
Ø Roken = invloed op afhankelijke variabelen (door roken krijg je longkanker)
2.3.2 Onafh ankelijke variabelen
- Variabele die invloed uitoefent op afhankelijke variabele
- Beginpunt van je analyse → predictor of determinant
- Onafhankelijk van omgeving, worden niet beïnvloed maar veroorzaken juist effect of
verandering bij andere variabelen
- MAAR causaliteit (oorzaak – gevolg) moeilijk te bewijzen !!
Vb. ‘gebruiken jongeren meer drugs dan ouderen?’
Ø Onafhankelijke variabele = leeftijd
Ø Leeftijd is niet beïnvloedbaar obv het druggebruik
Onafhankelijke variabele kan positieve of
negatieve invloed erop uitoefenen
Positieve correlatie = hoe ouder je wordt,
hoe meer drugs je pakt
Negatieve correlatie = hoe ouder je wordt,
hoe minder drugs je pakt
2.3.3 Beïnvloedende variabelen
- Variabele die relatie tusen OV en AV mogelijks beïnvloedt
Controlevariabelen
- Meegenomen in analyses om relatie tussen de OV en AV beter te isoleren
- Variabelen toegevoegd in de analyse om te controleren of de effecten wel echt afkomstig zijn
van de onafhankelijke variabele → komt invloed van X op Y wel degelijk van X
- Onterecht conclusies trekken door beïnvloedende variabele
Vb. ‘Eerder onderzoek: mannen gebruiken meer drugs dan vrouwen’
Ø Geslacht als controlevariabele in je analyse
Ø Foute conclusies voorkomen: leeftijd beïnvloed druggebruik, maar effect komt van geslacht
4
bachelor
Onderzoeksmethodolo
gie & statistiek 1
STATISTIEK 1 – NELE STRUYF
FEBE VERHEYDEN
1E BACHELOR REVALIDATIEWETENSCHAPPEN EN KINESITHERAPIE
ACADEMIEJAAR 2023-2024
,STATISTIEK 1
Hoofdstuk 2 – het abc van de stati sti ek
2.1 Inleiding
Wereldwijde coronapandemie
- Langdurige & grootschalige veranderingen → stijging werkloosheid, eenzaamheid, ziekte
- Wereldwijd door academici gevolgd & onderzocht (relevant en interessant)
Onderzoeksvragen beantwoorden
1. Gegevens/kenmerken verzamelen over onderzoekspopulatie → variabelen
2. Juiste descriptieve (= beschrijvende) of inferentiële (=verklarende) analysetechniek kiezen
3. Statistische analyse uitvoeren op verzamelde gegevens
3 bepalende factoren
- Aantal variabelen
o Hoeveel variabelen aanwezig in onderzoeksvraag
o Variabelen = alles gegevens die je gaat meten/ondervragen (soms 1, soms meerdere)
o Hoeveel gegevens in database moet ik bekijken/vergelijken met elkaar
- Meetniveau
o Categorische variabelen → verschillende waarden stellen bepaalde categorie voor
Nominale & ordinale variabelen
o Metrische variabelen → continue, numerieke waarden aan, bewerkingen uitvoeren
Interval & ratio variabelen
- Rol die variabelen vervullen in onderzoeksvraag
o Afhankelijke & onafhankelijke variabelen indelen
2.2 Meetniveau van variabelen
Variabelen = kenmerken populatie waarin je als onderzoek geïnteresseer bent & telkens kunnen
variëren wanneer ze gemeten worden bij verschillende onderzoekseenheden/tijdstippen/plaatsen
Onderzoekseenheden → dingen die je onderzoekt
- Respondenten
o Vb. variabele ‘gender’ en ‘gewicht’
- Producten/diensten zoals socialemedia-apps
o Vb. variabele ‘aantal actieve gebruikers'
1
,2.2.1 Categorische variabelen
- Nominale variabelen
o Individuen/objecten indelen in gelijkwaardige klassen of categorieën
o Categorieën benoemen met bepaalde waarde, geen echte getalwaarde
o Niet in logische volgorde zetten, geen rangorde of berekeningen
o Klassen zijn discreet → komen geen tussenliggende waarden voor
o Toekenning waarden willekeurig, enkel om categorieën uit elkaar te houden
o Vb. geslacht (0 = man, 1 = vrouw, 2 = anders)
- Ordinale variabelen
o Tussen verschillende categorieën zit bepaalde ordening of rangorde
o Laten niet toe uitspraak te doen over ‘hoeveel meer of beter’
o Geen vaste meeteenheid → geen rekenkundige berekeningen
o Klassen zijn discreet → komen geen tussenliggende waarden voor
Kwalitatieve variabelen = codes, je hebt daar geen
parameters van die je kan gebruiken (geen
gemiddelde, SD berekenen)
Parametrische statistiek kan alleen bij kwantitative
variabelen → je kan met parameters van een waarde
aan de slag (gemiddelde, SD berekenen)
2.2.2 Metrische variabelen
= waarden van variabelen vertegenwoordigen specifieke numerieke score, je weet precies hoe ver de
waarnemingen uit elkaar liggen en er zijn tussenliggende waarden mogelijk
- Intervalvariabelen
o Kennen geen absoluut nulpunt, verschil tussen waarden is betekenisvol
o Oneindig veel mogelijke tussenliggende waarden
o Verhoudingen tussen waarden is niet zilvol !!
o Alleen optellen & aftrekken, geen gemiddelde berekenen
- Ratiovariabelen
o Wel absoluut nulpunt → maakt verschil tussen het zijn en niet zijn
o Vb. een doos die 0g weegt, bestaat niet, iemand met 0 euro is blut
o Verschil tussen waarden is betekenisvol, oneindig veel tussenliggende waarden
o Verhoudingen tussen de waarden is zinvol !!
o Vermenigvuldigen & delen, gemiddelde, SD berekenen
2
,2.2.3 Hiërarchie van meetniveaus
- Hiërarchie tussen de meetniveau’s van belang voor statistische bewerkingen
- Hoe hoger gerangschikt, hoe meer bewerkingen of anayse bepaald meetniveau toelaat
- Ratio > interval > ordinaal > nominaal
- Elk meetniveau is altijd even nuttig/waardevol → ene informatierijker dan ander
Vb. pijnnniveau na behandeling
Ø Pijn metrisch meten > pijn nominaal meten (0 = nee, 1 = ja)
Ø Nominale variabele geslacht meten = extra informatie, pijnniveau vergelijken tussen
de 2 doelgroepen
- Metrische variabelen kan je achteraf altijd categorisch maken → omgekeerd niet !!
- Vraagstelling in survey belangrijk → hoger meetniveau = meer informatie
Vb. leetijd
Ø Eerst metrisch gemeten (19 jaar)
Ø Achteraf toewijzen aan bredere maar minder informatierijke categorie steeds
mogelijk (categorie 18-24 jaar)
Ø Initieel ordinaal gemeten (18-24 jaar)
Ø Onmogelijk om nadien te achterhalen wat iemands exacte leeftijd was, je blijft
vasthangen op het ordinale niveau
Likertschalen = ordinale variabelen die tot één schaal behoren omvormen tot metrische schaal
2.3 De rol van variabelen in de onderzoeksvraag
- Als onderzoeker vaak geïnterreseerd in relatie tussen verschillende variabelen
- Variabelen worden beïnvloed door andere variabelen of gaan zelf andere beïnvloeden
- Weten welke vd 3 rollen elke variabele vervult, voordat je bepaalde analysetechniek toepast
2.3.1 Afh ankelijke variabelen
- Variabele waar hele onderzoeksvraag rond draait
- Eindpunt van je analyse → uitkomstvariabele (letter ‘Y’)
- Afhankelijk van omgeving, kunnen veranderen door invloed van andere variabele
- De verandering in Y = meest interessant voor onderzoekers
Vb. ‘gebruiken jongeren meer drugs dan ouderen?’
Ø Afhankelijke variabele = druggebruik
Ø Leeftijd is niet beïnvloedbaar → onafhankelijk
Ø Druggebruik is als enige beïnvloedbare factor
3
, Vb. ‘verband longkanker en roken’
Ø Longkanker = afhankelijke variabele
Ø Roken = invloed op afhankelijke variabelen (door roken krijg je longkanker)
2.3.2 Onafh ankelijke variabelen
- Variabele die invloed uitoefent op afhankelijke variabele
- Beginpunt van je analyse → predictor of determinant
- Onafhankelijk van omgeving, worden niet beïnvloed maar veroorzaken juist effect of
verandering bij andere variabelen
- MAAR causaliteit (oorzaak – gevolg) moeilijk te bewijzen !!
Vb. ‘gebruiken jongeren meer drugs dan ouderen?’
Ø Onafhankelijke variabele = leeftijd
Ø Leeftijd is niet beïnvloedbaar obv het druggebruik
Onafhankelijke variabele kan positieve of
negatieve invloed erop uitoefenen
Positieve correlatie = hoe ouder je wordt,
hoe meer drugs je pakt
Negatieve correlatie = hoe ouder je wordt,
hoe minder drugs je pakt
2.3.3 Beïnvloedende variabelen
- Variabele die relatie tusen OV en AV mogelijks beïnvloedt
Controlevariabelen
- Meegenomen in analyses om relatie tussen de OV en AV beter te isoleren
- Variabelen toegevoegd in de analyse om te controleren of de effecten wel echt afkomstig zijn
van de onafhankelijke variabele → komt invloed van X op Y wel degelijk van X
- Onterecht conclusies trekken door beïnvloedende variabele
Vb. ‘Eerder onderzoek: mannen gebruiken meer drugs dan vrouwen’
Ø Geslacht als controlevariabele in je analyse
Ø Foute conclusies voorkomen: leeftijd beïnvloed druggebruik, maar effect komt van geslacht
4