Daan Capitaine
,Inhoudstabel
Deel 1: Significantie Testen
Toetsen van samenhang (welke test gebruiken?)................................................................................ 1
Welke test? (Gebaseerd op vragen)........................................................................................................... 1
1. Kunnen we aantonen dat de mediane… van… meer is dan …? ......................................... 1
2. Zijn de verdelingen identiek? / Liggen de medianen van… en … anders? / Als er
controlegroep ter sprake komt ............................................................................................................. 2
3. Is de steekproef representatief? / Zijn de gegevens afkomstig van een… verdeling?
(gegeven de populatiegrootheden) ..................................................................................................... 2
4. Zijn de gegevens afkomstig van een normale verdeling? ................................................... 3
5. Is dit model significant? (Meervoudig lineair model)/ Zijn de gemiddelden van 3
of meer steekproeven aan elkaar gelijk? ........................................................................................... 3
6. Verklaart model … meer dan het eerste (of geen) model?................................................. 4
7. Hoeveel van de spreiding wordt verklaard door…? ............................................................. 4
8. Kan de spreiding op een zinvolle manier verklaard worden door… (een
coeëfficiënt)? /Is model significant (enkelvoudig model) ......................................................... 4
9. Zijn de variabelen … en … onafhankelijk van elkaar? (Kwalitatieve variabelen, zie
s-tabel) ............................................................................................................................................................ 5
10. Is er een lineair verband tussen… en …? (2kwantitatieve variabelen)..................... 5
Alles op een rij ................................................................................................................................................... 7
Tips voor SPSS:.................................................................................................................................................. 7
DEEL 2: Econometrie
Alternatieve vormen van modellen ........................................................................................................... 9
De Gauss-Markov voorwaarden.................................................................................................................. 9
1. Weglaten van relevante variabelen ............................................................................................. 9
2. Opnemen van irrelevante variabelen ...................................................................................... 10
3. Multicollineariteit (variabelen evolueren samen) ............................................................. 10
4. Heteroskedasticiteit (variantie van de foutenterm ≠constant) ................................... 10
5. Seriële correlatie /autocorrelatie ............................................................................................. 11
Oplossen? ............................................................................................................................................... 12
Deel 3: Alle p-waarden
, Deel 1: Significantie toetsen
Toetsen van samenhang (welke test gebruiken?)
Aantal kwalitatieve Aantal kwantitatieve Welke test?
variabelen variabelen
0 2 Pearson-correlatie
2 0 Chi² voor onafhankelijkheid
1 (2 categorieën) 1 Independent sample t-test
of MWW (kleine steekproef)
1 (3 of meer categorieën) 1 ANOVA
Welke test? (Gebaseerd op vragen)
Vragen 5, 6, 7 en 8 horen eigenlijk bij econometrie
1. Kunnen we aantonen dat de mediane… van… meer is dan …?
𝑻𝒆𝒌𝒆𝒏𝒕𝒐𝒆𝒕𝒔
𝐻 : 𝑝𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑒𝑝𝑒𝑑𝑖𝑎𝑎𝑛 = 𝑞
𝐻 : 𝑝𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑒𝑚𝑒𝑑𝑖𝑎𝑎𝑛 > 𝑞
Alle gegevens boven q een “+” en alles eronder “-“ geven. Onder𝐻 verwachten we
evenveel “+” als “-“.
𝑡𝑒𝑠𝑡𝑔𝑟𝑜𝑜𝑡ℎ𝑒𝑖𝑑 𝐵 = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑔𝑒𝑔𝑒𝑣𝑒𝑛𝑠 𝑚𝑒𝑡 𝑒𝑒𝑛 "+" ~𝐵𝑖𝑛(𝑛, 𝑝)
𝒑 − 𝒘𝒂𝒂𝒓𝒅𝒆 = 𝟏 − 𝒃𝒊𝒏𝒐𝒎𝒄𝒅𝒇(𝒏, 𝒑, 𝒂𝒂𝒏𝒕𝒂𝒂𝒍 "+")
𝑝 = 50% (𝑜𝑛𝑑𝑒𝑟 𝑑𝑒 𝑣𝑒𝑟𝑜𝑛𝑑𝑒𝑟𝑠𝑡𝑒𝑙𝑙𝑖𝑛𝑔 𝑑𝑎𝑡 𝐻 𝑤𝑎𝑎𝑟 𝑖𝑠)
Voordeel Nadeel
Eenvoudig en zeer breed inzetbaar Weinig Power
Voorwaarde: onderliggende variabele moet Alternatief= rangtekentoets van Wilcoxon
continu zijn (mogelijkheid uitsluiten dat er
waarnemingen precies gelijk zijn aan de
mediaan)
𝑹𝒂𝒏𝒈𝒕𝒆𝒌𝒆𝒏𝒕𝒐𝒆𝒕𝒔 𝒗𝒂𝒏 𝑾𝒊𝒍𝒄𝒐𝒙𝒐𝒏
Bereken 𝑥 − 𝑞 en |𝑥 − 𝑞| voor alle waarnemingen
Rangwaarden geven van klein naar groot (van |𝑥 − 𝑞|)
o Alle gelijke waarden geven we als rangwaarde het gemiddelde van die
rangwaarden
o Knopen (waarnemingen die samenvallen met de mediaan) laten we weg
Testgrootheid 𝑅 =
𝑑𝑒 𝑠𝑜𝑚 𝑣𝑎𝑛 𝑟𝑎𝑛𝑔𝑤𝑎𝑎𝑟𝑑𝑒𝑛 𝑣𝑎𝑛 𝑎𝑙𝑙𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑒𝑣𝑒 𝑣𝑒𝑟𝑠𝑐ℎ𝑖𝑙𝑙𝑒𝑛 (𝑣𝑎𝑛 𝑥 − 𝑞 )
( ) ( )( )
𝑅 ≈N , → 𝐸(𝑅 )& 𝑉𝑎𝑟(𝑅 )
𝒑 − 𝒘𝒂𝒂𝒓𝒅𝒆 = 𝒏𝒐𝒓𝒎𝒂𝒍𝒄𝒅𝒇(𝑹𝒏 , 𝑬𝟗𝟗, 𝑬(𝑹𝒏 ), 𝑽𝒂𝒓(𝑹𝒏 ))
Voorwaarde: n minstens 20
1