Sommatieteken ..........................................................................................................................2
Datatype variabelen ...................................................................................................................2
Kwalitatieve variabelen ........................................................................................................................ 2
1. Nominaal.................................................................................................................................... 2
2. Ordinaal ..................................................................................................................................... 2
Kwantitatieve variabelen ...................................................................................................................... 3
1. Discreet ..................................................................................................................................... 3
2. Continu ...................................................................................................................................... 3
Tabellen......................................................................................................................................3
Kruistabel ............................................................................................................................................. 3
Frequentietabel .................................................................................................................................... 4
Standaard gemiddelde ...............................................................................................................4
Standaardafwijking/standaarddeviatie/variantie ........................................................................4
Coëfficiënt van de variatie .........................................................................................................4
Mediaan, modus en interquartile range .....................................................................................5
Box plot ......................................................................................................................................5
Kansdichtheid.............................................................................................................................5
Normale verdeling ......................................................................................................................5
Normale verdeling m.b.v. Z waarde...........................................................................................5
Standard error of the mean........................................................................................................6
Student’s t-distributie .................................................................................................................6
Betrouwbaarheidsinterval (BHI): 2SE rule of thumb of student-t? ............................................7
One sample t-test.......................................................................................................................8
Eisen voor het uitvoeren van een t-test .....................................................................................8
Betrouwbaarheidsinterval voor de variantie ..............................................................................8
Soorten onderzoeken.................................................................................................................9
Bias verkleinen..................................................................................................................................... 9
Sampling error verkleinen .................................................................................................................... 9
Power en een sample size (n) kiezen......................................................................................10
Gepaarde sample vs. dubbel sample design ..........................................................................11
Gepaarde test berekeningen .............................................................................................................. 11
Dubbel-sample design .............................................................................................................12
F-test en Levene’s-test ............................................................................................................13
ANOVA .....................................................................................................................................14
Hypothesen bij ANOVA ...................................................................................................................... 14
ANOVA uitvoeren ............................................................................................................................... 14
Geplande vergelijkingen ..................................................................................................................... 15
Niet-geplande vergelijkingen .............................................................................................................. 15
Gefixeerde en willekeurige effecten .................................................................................................... 15
Tabellen van ANOVA ......................................................................................................................... 15
Som van kwadraten .................................................................................................................16
MSgroups (group mean square) berekenen ...............................................................................16
Variantie ratio, F .......................................................................................................................16
Variatie R2 ................................................................................................................................17
Multiple explanatory variables .................................................................................................17
Analyzing experiments with blocking .......................................................................................17
Covariantie berekenen .............................................................................................................18
Correlatiecoëfficiënt, r2.............................................................................................................18
Hypothesetoetsen .............................................................................................................................. 19
Veronderstellingen ............................................................................................................................. 19
(Lineaire) regressie ..................................................................................................................19
Veronderstellingen ............................................................................................................................. 20
Lineair verband toetsen ...........................................................................................................20
FA-BA107 samenvatting Pagina 1 van 22
, M1
Sommatieteken
waarbij n=aantal observaties (dus tot hoe ver je moet optellen), =som van aantal
opgetelde observaties, i=1 staat voor waar je moet beginnen met tellen.
Voorbeeld: Een steekproef van 5 volwassen poezen (Europese kort haar) levert de volgende
gewichten (in kg): X1 = 3.0, X2 = 3.5, X3 = 2.9, X4 = 3.4 en X5 = 2.7. Bereken
4
Xi
a) i =1 =3 + 3.5 + 2.9 + 3.4 = 12.8
4
Xi
b) i =2 =3.5 + 2.9 + 3.4 = 9.8
n
Xi
c) i =1 =3 + 3.5 + 2.9 + 3.4 + 2.7 = 15.5
n
X i2
d) i =1 9 + 12.25 + 8.41 + 11.56 + 7.29 = 48.51
2
n
X i
e) i =1 (15.5)2 = 240.25
Datatype variabelen
Kwalitatieve variabelen
Variabelen als geslacht, oogkleur, woonplaats, land van herkomst e.d.
zijn allemaal voorbeelden van kwalitatieve variabelen. Beste weergave
met staaf- of cirkeldiagrammen. Wanneer kwalitatieve data nominaal is
(geen logische volgorde heeft van klassen) zoals in de bovenstaande
figuur, dan is de beste manier van weergave het ordenen van
categorieën van lage naar hoge frequentie of andersom. In een
staafdiagram horen de staven los van elkaar te staan, het is een goede
gewoonte om je aan te leren het totale aantal observaties (n) te noteren
in het bijschrift. Zie hiernaast.
Figuur 1. Een staafdiagram. n=328
1. Nominaal: de bestaat variabele uit verschillende waarden waar geen verschil zit tussen beide. Er
zijn dus verschillende categorieën aan te duiden, maar er zijn geen verschillen tussen deze
categorieën. Het gaat hier daarom slechts om het benoemen van de bijbehorende waarde.
Voorbeelden zijn:
• vrouw / man
• abonnee op de krant / geen abonnee op de krant
• provincies
2. Ordinaal: de variabele bestaat uit verschillende waarden waar wel verschil tussen beide zit. Er zijn
verschillende categorieën aan te duiden, waar verschillen tussen zitten. Deze verschillen zijn echter
niet goed aan te duiden.
Voorbeelden zijn:
• eens / neutraal / oneens
• goud / zilver / brons
• vmbo / havo / vwo
FA-BA107 samenvatting Pagina 2 van 22
, Kwantitatieve variabelen
Variabelen als lichaamslengte, aantal kinderen, gewicht, een score op een toets, IQ e.d. zijn
voorbeelden van kwantitatieve variabelen. De waarde van zo'n variabele kan je uitdrukken in een
getal.
Kwantitatieve data kan men laten zien in een frequentietabel en een
histogram (ook nog een boxplot, strip chart, en error bar). Een
histogram lijkt erg op een staafdiagram, de waarden zijn vaak gesplit in
intervallen van gelijke breedte die worden laten zien als rechthoekige
staven. Een histogram kan verschillende vormen aannemen: uniform,
bel-vorm, asymmetrische, en een bimodale. In het figuur hiernaast is de
mode 30-40. Datapoints die ver van de andere data liggen worden
outliers genoemd. De boxplot, strip chart en error bar worden vaker
gebruikt om twee of meerdere groepen met elkaar te vergelijken.
Figuur 2. Een histogram. n=220
1. Discreet
Variabelen die geen tussenwaarden kunnen aannemen, gehele nummers.
Voorbeelden zijn:
• aantal kinderen
• een score op een toets van 40 meerkeuzevragen
2. Continu
Variabelen die allerlei tussenwaarden kunnen aannemen. Elke waarde binnen een bereik.
Voorbeelden zijn:
• lengte
• gewicht
• buitentemperatuur
• tijd
Tabellen
Kruistabel
Type
Kat Hond Totaal
Geslacht
Man 42 9 52
Vrouw 9 39 48
Totaal 51 49 100
FA-BA107 samenvatting Pagina 3 van 22