Opties spss aanpassen
Filter off als je filter hebt gebruikt Via het menu krijg je dit voor elkaar door in Data>Select Cases
weer te opteren voor All cases. Levert op na paste:
FILTER OFF.
USE ALL.
EXECUTE.
Recode niet zomaar gebruiken want spss verwijdert gegevens niet
Check de P!!! /2 of niet?
Niet in de juiste richting? 1-p!!!
,SAMPLE SESSION 1: puntschattingen
PUNTSCHATTINGEN
Verdeling variabele in de populatie wordt populatieverdeling genoemd
Continue variabele: ratio/interval steekproefgemiddelde goede puntschatting! DESCRIPTIVES
Discrete variabelen: nominaal/ordinaal steekproefproportie goede puntschatting! (aantal mensen
die iets zeggen) MODUS/MEDIAAN
Proportie is gelijk aan gemiddelde 0-1 variabele, dus methode om gemiddelde te berekenen
(descriptives) kan worden toegepast bij het schatten van populatiegemiddelde continue variabele.
Modus en mediaan kunnen ook te pas komen voor gemiddelden.
▪ De populatiestandaardafwijking (sigma; σ) wordt geschat door de ) wordt geschat door de
steekproefstandaardafwijking/deviatie (s of SD). De noemer van s is n-1 en wordt ook wel
"vrijheidsgraden" genoemd.
BETROUWBAARHEIDSINTERVALLEN
Steekproefverdeling = verschillende puntschattingen achter elkaar
Sigma: de steekproef standaarddeviatie
Betrouwbaarheidsintervallen is een bereik van getallen
Kleinere standaardfout -> accurater puntschatting
Standaardfout: SE = Sigma/√n
Foutkans = alpha (1-betrouwbaarheidscoëfficiënt)
Een 95% CI houdt in dat we met 95% zekerheid kunnen zeggen dat het
betrouwbaarheidsinterval van de puntschatting de daadwerkelijke POPULATIE parameter
omvat. Dus 95% van de betrouwbaarheidsintervallen bevat, met herhaaldelijke
steekproeven, het populatiegemiddelde.
BETROUWBAARHEIDSINTERVAL OVER HET GEMIDDELDE
Standaardfout steekproef: SEgemiddelde = Sigma / √n
BETROUWBAARHEIDSINTERVAL VOOR EEN PROPORTIE
Standaardfout steekproefproportie: SEpi-voorspeld = √𝑝𝑖 ×(1−𝑝𝑖) 𝑛
,We kunnen stellen dat Ha een eenzijdige hypothese is, aangezien we expliciet een richting
benoemen. Als er niet een specifieke verwachting is over een toename of een afname in het
percentage van katholieken in Ha dan is er sprake van een tweezijdige hypothese.
~= notatie staat in SPSS voor “niet gelijk”.
CI95% = steekproefgemiddelde - 1.96 × SE; steekproefgemiddelde + 1.96 × SE
SEgemiddelde = Sigma / √n
ALS JE RICHTING VAN HYPOTHESE TOETSING NIET KLOPT, 1-P DOEN.
z-score is t statistiek in spss
Dit impliceert dat het gemiddelde van de steekproef X aantal standaardfout valt boven het
gemiddelde van de populatie die wordt gespecificeerd onder de H0.
MERK OP: SPSS rapporteert altijd de tweezijdige p-waarden dus in het geval van een eenzijdige
hypothese moet je de p-waarde delen door 2.
In plaats van teststatistiek (t-test), kan er ook getoetst worden met betrouwbaarheidsintervallen
CI: 90% eenzijdig
CI: 95% tweezijdig
Testen met betrouwbaarheidsinterval:
- Testwaarde achterhalen
- Testwaarde 0 invoeren
- Kijken of 90 of 95% interval
- t-test met betrouwbaarheidsinterval uitvoeren
- conclusies trekken over betrouwbaarheidsintervallen + wat testwaarde was. Klopt dit met
hypothese?
Gebruik met betrouwbaarheidsintervallen de ‘filter by’ optie i.p.v. de select if optie.
Als er een overlap tussen betrouwbaarheidsintervallen is, zouden we kunnen concluderen dat er
geen bewijs is dat het gemiddelde bedrag in donaties verschilt tussen mannen en vrouwen. Maar de
twee betrouwbaarheidsintervallen zijn niet genoeg om een definitief antwoord te kunnen geven
Levene’s test; significant? Onderste rij!
Levene’s test niet significant? Bovenste rij!
Bij t-test t-waarde en p-waarde rapporteren!
Type I fout -> H0 onterecht afwijzen
Type II fout -> H0 onterecht behouden
, ALTIJD RICHTING CHECKEN! VERKEERDE RICHTING? 1-P WAARDE!
Groep opsplitsen in twee gelijke groepen: LO THRU … & … THRU HI
SAMPLE SESSION 2: kruistabellen
KRUISTABELLEN: is er een samenhang tussen variabele X en Y?
Met resultaten ospchrijven: Cochran’s rule en chi kwadraat!
Adjusted R (residuen analyse) wat is de samenhang?
ONDERVERTEGENWOORDIGING/OVERVERTEGENWOORDIGING. Is dit in lijn met wat je zou
verwachten?
Onafhankelijke: kolommen
Afhankelijke: rijen
Aantal waarnemingen wordt frequentie genoemd
Reeks frequenties in rij of kolom wordt conditionele verdeling genoemd HC2!
Alle waarnemingen in de rijen of kolommen is marginale verdeling HC2!
- Als het aantal mogelijke tabellen met dezelfde marginale frequenties groot is, kan het zijn
dat we moeten zitten en wachten . In dergelijke situaties kunnen we ook Monte Carlo-
simulatie gebruiken. Dat wil zeggen dat niet alle mogelijke tabellen door SPSS worden
gevormd, maar slechts een willekeurige steekproef om zo de berekeningstijd te
verminderen.
- Aantal observaties klein exacte testen
Set alle frequenties: gezamenlijke verdeling
Deze verwachte frequenties worden aangegeven als fe(i,j). .De geobserveerde steekproeffrequenties
worden weergegeven als fo(i,j) of alleen f(i, j).
verwachte frequentie berekenen
i bovenste rij staat voor totaal in die rij, j bovenste rij staat voor totaal in kolom
(totaal i x totaal j)/totaal participanten
Chi kwadraat: hoge waarden H0 wordt nauwelijks ondersteund
Lage waarden H0 wordt veel ondersteund
Crosstabs om te onderzoeken of variabelen afhankelijk zijn van elkaar
Filter off als je filter hebt gebruikt Via het menu krijg je dit voor elkaar door in Data>Select Cases
weer te opteren voor All cases. Levert op na paste:
FILTER OFF.
USE ALL.
EXECUTE.
Recode niet zomaar gebruiken want spss verwijdert gegevens niet
Check de P!!! /2 of niet?
Niet in de juiste richting? 1-p!!!
,SAMPLE SESSION 1: puntschattingen
PUNTSCHATTINGEN
Verdeling variabele in de populatie wordt populatieverdeling genoemd
Continue variabele: ratio/interval steekproefgemiddelde goede puntschatting! DESCRIPTIVES
Discrete variabelen: nominaal/ordinaal steekproefproportie goede puntschatting! (aantal mensen
die iets zeggen) MODUS/MEDIAAN
Proportie is gelijk aan gemiddelde 0-1 variabele, dus methode om gemiddelde te berekenen
(descriptives) kan worden toegepast bij het schatten van populatiegemiddelde continue variabele.
Modus en mediaan kunnen ook te pas komen voor gemiddelden.
▪ De populatiestandaardafwijking (sigma; σ) wordt geschat door de ) wordt geschat door de
steekproefstandaardafwijking/deviatie (s of SD). De noemer van s is n-1 en wordt ook wel
"vrijheidsgraden" genoemd.
BETROUWBAARHEIDSINTERVALLEN
Steekproefverdeling = verschillende puntschattingen achter elkaar
Sigma: de steekproef standaarddeviatie
Betrouwbaarheidsintervallen is een bereik van getallen
Kleinere standaardfout -> accurater puntschatting
Standaardfout: SE = Sigma/√n
Foutkans = alpha (1-betrouwbaarheidscoëfficiënt)
Een 95% CI houdt in dat we met 95% zekerheid kunnen zeggen dat het
betrouwbaarheidsinterval van de puntschatting de daadwerkelijke POPULATIE parameter
omvat. Dus 95% van de betrouwbaarheidsintervallen bevat, met herhaaldelijke
steekproeven, het populatiegemiddelde.
BETROUWBAARHEIDSINTERVAL OVER HET GEMIDDELDE
Standaardfout steekproef: SEgemiddelde = Sigma / √n
BETROUWBAARHEIDSINTERVAL VOOR EEN PROPORTIE
Standaardfout steekproefproportie: SEpi-voorspeld = √𝑝𝑖 ×(1−𝑝𝑖) 𝑛
,We kunnen stellen dat Ha een eenzijdige hypothese is, aangezien we expliciet een richting
benoemen. Als er niet een specifieke verwachting is over een toename of een afname in het
percentage van katholieken in Ha dan is er sprake van een tweezijdige hypothese.
~= notatie staat in SPSS voor “niet gelijk”.
CI95% = steekproefgemiddelde - 1.96 × SE; steekproefgemiddelde + 1.96 × SE
SEgemiddelde = Sigma / √n
ALS JE RICHTING VAN HYPOTHESE TOETSING NIET KLOPT, 1-P DOEN.
z-score is t statistiek in spss
Dit impliceert dat het gemiddelde van de steekproef X aantal standaardfout valt boven het
gemiddelde van de populatie die wordt gespecificeerd onder de H0.
MERK OP: SPSS rapporteert altijd de tweezijdige p-waarden dus in het geval van een eenzijdige
hypothese moet je de p-waarde delen door 2.
In plaats van teststatistiek (t-test), kan er ook getoetst worden met betrouwbaarheidsintervallen
CI: 90% eenzijdig
CI: 95% tweezijdig
Testen met betrouwbaarheidsinterval:
- Testwaarde achterhalen
- Testwaarde 0 invoeren
- Kijken of 90 of 95% interval
- t-test met betrouwbaarheidsinterval uitvoeren
- conclusies trekken over betrouwbaarheidsintervallen + wat testwaarde was. Klopt dit met
hypothese?
Gebruik met betrouwbaarheidsintervallen de ‘filter by’ optie i.p.v. de select if optie.
Als er een overlap tussen betrouwbaarheidsintervallen is, zouden we kunnen concluderen dat er
geen bewijs is dat het gemiddelde bedrag in donaties verschilt tussen mannen en vrouwen. Maar de
twee betrouwbaarheidsintervallen zijn niet genoeg om een definitief antwoord te kunnen geven
Levene’s test; significant? Onderste rij!
Levene’s test niet significant? Bovenste rij!
Bij t-test t-waarde en p-waarde rapporteren!
Type I fout -> H0 onterecht afwijzen
Type II fout -> H0 onterecht behouden
, ALTIJD RICHTING CHECKEN! VERKEERDE RICHTING? 1-P WAARDE!
Groep opsplitsen in twee gelijke groepen: LO THRU … & … THRU HI
SAMPLE SESSION 2: kruistabellen
KRUISTABELLEN: is er een samenhang tussen variabele X en Y?
Met resultaten ospchrijven: Cochran’s rule en chi kwadraat!
Adjusted R (residuen analyse) wat is de samenhang?
ONDERVERTEGENWOORDIGING/OVERVERTEGENWOORDIGING. Is dit in lijn met wat je zou
verwachten?
Onafhankelijke: kolommen
Afhankelijke: rijen
Aantal waarnemingen wordt frequentie genoemd
Reeks frequenties in rij of kolom wordt conditionele verdeling genoemd HC2!
Alle waarnemingen in de rijen of kolommen is marginale verdeling HC2!
- Als het aantal mogelijke tabellen met dezelfde marginale frequenties groot is, kan het zijn
dat we moeten zitten en wachten . In dergelijke situaties kunnen we ook Monte Carlo-
simulatie gebruiken. Dat wil zeggen dat niet alle mogelijke tabellen door SPSS worden
gevormd, maar slechts een willekeurige steekproef om zo de berekeningstijd te
verminderen.
- Aantal observaties klein exacte testen
Set alle frequenties: gezamenlijke verdeling
Deze verwachte frequenties worden aangegeven als fe(i,j). .De geobserveerde steekproeffrequenties
worden weergegeven als fo(i,j) of alleen f(i, j).
verwachte frequentie berekenen
i bovenste rij staat voor totaal in die rij, j bovenste rij staat voor totaal in kolom
(totaal i x totaal j)/totaal participanten
Chi kwadraat: hoge waarden H0 wordt nauwelijks ondersteund
Lage waarden H0 wordt veel ondersteund
Crosstabs om te onderzoeken of variabelen afhankelijk zijn van elkaar