Statistiek data-analyse
Les 2 Correlatie & kruistabellen
Parametrische en non-parametrische technieken
Doorheen deze cursus: vertrekken vanuit de parametrische techniek. Daarbij geven we de analoge non-parametrische
techniek. Op examen zal DUIDELIJK aangegeven worden als je non- parametrisch moet testen.
Correlatie= verbanden
PEARSON CORRELATIE
• Verband tussen 2 kwantitatieve variabelen
• Correlatie :bv: Is er een verband tussen de leeftijd en het aantal uren sport per week?
à in spss Analyze < Correlate < Bivariate < Pearson
PEARMAN RANG CORRELATIE
• Analoog met bivariate correlatie
• Geeft een correlatiecoëfficiënt rs
• Pearson en Spearman r: niet zelfde waarde, op basis van andere procedure
à in spss Analyze < Correlate < Bivariate < Spearman r
PEARSON OF SPEARMAN CORRELATIE
• Wordt vaak gebruikt om de VALIDITEIT van een instrument na te gaan (interclass correlatie)
• Vooral relatie tussen instrument en een criterium/gouden standaard → criterium validiteit
• Hoe dichter bij 1, hoe meer valide
• Binnen onderzoek rond gezondheidspromotie wordt een correlatie van 0.30 à 0.40 beschouwd als een goede
validiteit
BETROUWBAARHEID
• Betrouwbaarheeid: de stabiliteit van de de test
• Voor BETROUWBAARHEID van een instrument → intraclass correlatie
• Bij twee keer of meer dezelfde variabele
à IN SPPS Analyze > Scale > reliability > intraclass correlatie
• Single Measure Intraclass correlation
— Als in de toekomst ook maar 1 keer een meting wordt gedaan (bv. Bijvragenlijsten)
• Average Measure Intraclass correlation
— Als in de toekomst de meting ook n keer wordt gedaan (bv. Bij een test met verschillende pogingen)
• Kan gebruikt worden voor:
— Betrouwbaarheid nagaan van een test
— Verschillende trials afnemen en kijken of er verschillen zijn (leereffect – vermoeidheid)
— Interbeoordelaarsbetrouwbaarheid
• Goede betrouwbaarheid vanaf ICC 0.70
• Redelijke betrouwbaarheid vanaf 0.60
• Onder 0.50 = te laag
à Significantie hier niet relevant!
KRUISTABELLEN EN CHI-KWADRATEN
• Verband tussen twee 2 kwalitatieve variabelen nagaan
Twee manieren van data ingeven
1.Gegevens per proefpersonen geven
• Kolom 1: 1ste variabele; bv. sociale klasse
• Kolom 2: 2de variabele; bv. uren sport
1
, à in spss Analyze < descriptive statistics < crosstabs
à Statistics: Chi-square
à Cells: rij, kolom, totale %
let op voldoende aantallen per cel anders samen nemen (liefst niet minder dan 5 per cel, anders categorieën samen
nemen)
• Bij r*k kruistabellen met ordinale variabelen: chi²-toets (p for trend of linear- by-linear association)
• Bij 2*2 kruistabellen EN indien voorwaarde chi-kwadraat niet zijn voldaan (80% van de cellen > 5 pp en overal
> 1 pp)
→ Fisher’s exact toets en p-waarde na continuïteitscorrectie
→ Wordt automatisch in de output weergegeven
2: enkel kruistabel ingeven percel
• Enkel de kruistabel is gegeven = aantallen per cel zijn
• NIET de echte data
à ingeven in SPSS: 3 kolommen
• Kolom 1ste variabele; bv. Geslacht
• Kolom 2de variabele; bv. Richting
• Kolom met aantallen
à “Weight cases” gebruiken: via via menubalk DATA
• Data < weight cases < weight cases by aantal
• Analyze < descriptive statistics < crosstabs
• Statistics: Chi-square
• Cells: rij, kolom, totale %
KAPPA
• Mate van overeenkomst bij categorische variabelen
• Bij validiteit of betrouwbaarheid
à IN SPSS Analyze > Descriptive Statistics > Crosstabs
→‘Kappa’ aanklikken bij Statistics
→0.40-0.70 is acceptabele overeenkomst, >0.70 is goede overeenkomst
CHIKWADRAAT TEST NONPARAMETRISCH
• Wordt gebruikt om verdeling van variabele te onderzoeken
à in spss : Analyze > Non-parametric tests > Legacy dialogs > Chi-square
Wat noteren bij intraclass
Table intraclass correlation coefficient
Note!
Eerst scatter plot opvragen voordat je correlatie gaat uitvoeren.
à in spss: via Graph
Voorbeeld van besluiten
Er is een statische significant postieve verband tussen test…..
Hypothese
Als een hypothese gesteld wordt moet je p-waarde delen door 2.
Let op rand significantie (p-waarde die tussen de 0,05 tot 0,10)
2
Les 2 Correlatie & kruistabellen
Parametrische en non-parametrische technieken
Doorheen deze cursus: vertrekken vanuit de parametrische techniek. Daarbij geven we de analoge non-parametrische
techniek. Op examen zal DUIDELIJK aangegeven worden als je non- parametrisch moet testen.
Correlatie= verbanden
PEARSON CORRELATIE
• Verband tussen 2 kwantitatieve variabelen
• Correlatie :bv: Is er een verband tussen de leeftijd en het aantal uren sport per week?
à in spss Analyze < Correlate < Bivariate < Pearson
PEARMAN RANG CORRELATIE
• Analoog met bivariate correlatie
• Geeft een correlatiecoëfficiënt rs
• Pearson en Spearman r: niet zelfde waarde, op basis van andere procedure
à in spss Analyze < Correlate < Bivariate < Spearman r
PEARSON OF SPEARMAN CORRELATIE
• Wordt vaak gebruikt om de VALIDITEIT van een instrument na te gaan (interclass correlatie)
• Vooral relatie tussen instrument en een criterium/gouden standaard → criterium validiteit
• Hoe dichter bij 1, hoe meer valide
• Binnen onderzoek rond gezondheidspromotie wordt een correlatie van 0.30 à 0.40 beschouwd als een goede
validiteit
BETROUWBAARHEID
• Betrouwbaarheeid: de stabiliteit van de de test
• Voor BETROUWBAARHEID van een instrument → intraclass correlatie
• Bij twee keer of meer dezelfde variabele
à IN SPPS Analyze > Scale > reliability > intraclass correlatie
• Single Measure Intraclass correlation
— Als in de toekomst ook maar 1 keer een meting wordt gedaan (bv. Bijvragenlijsten)
• Average Measure Intraclass correlation
— Als in de toekomst de meting ook n keer wordt gedaan (bv. Bij een test met verschillende pogingen)
• Kan gebruikt worden voor:
— Betrouwbaarheid nagaan van een test
— Verschillende trials afnemen en kijken of er verschillen zijn (leereffect – vermoeidheid)
— Interbeoordelaarsbetrouwbaarheid
• Goede betrouwbaarheid vanaf ICC 0.70
• Redelijke betrouwbaarheid vanaf 0.60
• Onder 0.50 = te laag
à Significantie hier niet relevant!
KRUISTABELLEN EN CHI-KWADRATEN
• Verband tussen twee 2 kwalitatieve variabelen nagaan
Twee manieren van data ingeven
1.Gegevens per proefpersonen geven
• Kolom 1: 1ste variabele; bv. sociale klasse
• Kolom 2: 2de variabele; bv. uren sport
1
, à in spss Analyze < descriptive statistics < crosstabs
à Statistics: Chi-square
à Cells: rij, kolom, totale %
let op voldoende aantallen per cel anders samen nemen (liefst niet minder dan 5 per cel, anders categorieën samen
nemen)
• Bij r*k kruistabellen met ordinale variabelen: chi²-toets (p for trend of linear- by-linear association)
• Bij 2*2 kruistabellen EN indien voorwaarde chi-kwadraat niet zijn voldaan (80% van de cellen > 5 pp en overal
> 1 pp)
→ Fisher’s exact toets en p-waarde na continuïteitscorrectie
→ Wordt automatisch in de output weergegeven
2: enkel kruistabel ingeven percel
• Enkel de kruistabel is gegeven = aantallen per cel zijn
• NIET de echte data
à ingeven in SPSS: 3 kolommen
• Kolom 1ste variabele; bv. Geslacht
• Kolom 2de variabele; bv. Richting
• Kolom met aantallen
à “Weight cases” gebruiken: via via menubalk DATA
• Data < weight cases < weight cases by aantal
• Analyze < descriptive statistics < crosstabs
• Statistics: Chi-square
• Cells: rij, kolom, totale %
KAPPA
• Mate van overeenkomst bij categorische variabelen
• Bij validiteit of betrouwbaarheid
à IN SPSS Analyze > Descriptive Statistics > Crosstabs
→‘Kappa’ aanklikken bij Statistics
→0.40-0.70 is acceptabele overeenkomst, >0.70 is goede overeenkomst
CHIKWADRAAT TEST NONPARAMETRISCH
• Wordt gebruikt om verdeling van variabele te onderzoeken
à in spss : Analyze > Non-parametric tests > Legacy dialogs > Chi-square
Wat noteren bij intraclass
Table intraclass correlation coefficient
Note!
Eerst scatter plot opvragen voordat je correlatie gaat uitvoeren.
à in spss: via Graph
Voorbeeld van besluiten
Er is een statische significant postieve verband tussen test…..
Hypothese
Als een hypothese gesteld wordt moet je p-waarde delen door 2.
Let op rand significantie (p-waarde die tussen de 0,05 tot 0,10)
2