Analyse 1
Samenvatting colleges (grasple)
College 1:
⁎ Statistiek in het onderzoeksproces
⁕ Conceptualiseringsfase: statistiek wordt
gebruikt bij het opstellen van de vraagstelling
(concreet, feiten of mening).
⁕ Onderzoeksopzet: grootte en kwaliteit van de
steekproeven en de steekproef in de
populatie.
⁕ Uitvoeringsfase: statistiek wordt gebruikt bij
het ordenen en presenteren van de gegevens.
Er wordt gesproken van toetsende statistiek
als er wordt bepaald of de gegevens
overeenkomen met de theoretische
verwachtingen.
kwantitatief onderzoek: gemeten o.b.v. cijfers
kwalitatief onderzoek: meer diepgang
⁎ Terminologie
Variabele -> gemeten grootheid die kan variëren
⁕ Onafhankelijke variabelen hebben invloed op de afhankelijke
variabelen (oorzaak)
⁕ Afhankelijke variabelen worden verklaard (gevolg)
Onderzoekseenheid -> een eenheid waarbij de variabelen wordt gemeten
Score -> waarde van een onderzoekseenheid
Causaliteit -> de volgorde waarin de variabelen voorkomen (“is het zo of is
het andersom”)
Figuur 1: in de kolommen staan de variabelen en in de rijen de
onderzoekseenheden
causaliteit met meerdere
predictoren:
er zijn twee of meerdere variabelen
die zorgen voor de afhankelijke
variabelen
, causaliteit met een mediatie:
een relatie tussen 2 variabelen
die via een tussenvariabele loopt,
heet een mediator. Dit kan voor
een deel het verband verklaren of
volledig.
Causaliteit met moderatie:
Door een derde variabele is er invloed
op het geschetste verband. De derde
variabele kan ervoor zorgen dat het
verband wordt versterkt of is afgezwakt
⁎ Meetniveaus
Nominaal ->
geslacht
Ordinaal ->
opleidingsniveau
Interval ->
graden
Ratio -> lengte
⁎ Gege
vens ordenen / samenvatten met frequentieverdelingen
⁕ Relatieve frequenties
Absolute frequenties (Fi) is het aantal keer
dat een bepaalde waarde (Xi) voorkomt. ∑Fi
is het totaal van de aantal frequenties
(N=20). Proporties tellen op tot 1 en zijn
daarmee komma getallen. De percentages
tellen op tot 100 en zijn procenten.
⁕ Cumulatieve frequenties
Cumulatieve frequentie is de som van de
voorafgaande waardes. Een andere
benaming hiervoor is somfrequentie, cFi=
∑Fi1 + Fi2 + Fi3 ect…
Ook hierbij kun je de proportie en het
percentage berekenen.
Absolute frequenties zijn handiger als je informatie
wilt geven over exacte hoeveelheden en relatief is handiger voor als je scores wilt
vergelijken.
College 2
⁎ Centrummaten
⁕ Modus -> de meest voorkomende waarde
V voor alle meetniveau te bepalen
Snel en makkelijk af te lezen uit een frequentietabel
N weinig informatie wordt gebruikt
Erg afhankelijk van de klassenverdeling
Moeilijk te interpreteren
, ⁕ Mediaan -> de waarde van de middelste waarneming (laag -> hoog)
Oneven: de middelste
Even: tussen de middelste twee scores
V vanaf ordinaal meetniveau
Niet gevoelig voor uitschieters
N weinig informatie gebruikt
Niet geschikt om mee verder te rekenen
⁕ Gemiddelde -> maat gebaseerd op de afstand tot het middelpunt
*wordt gebruikt bij interval en ratio
Gemiddelde = som van alle scores : totaal aantal scores
V meer informatie gebruikt
Mogelijk om mee verder te rekenen
N gevoelig voor extreme uitschieters
Alleen mogelijk voor interval en ratio niveau
⁎ Uitschieters
Links scheve verdeling:
Rechts scheve verdeling
Vuistregel: bij een Skewness > 1
of < -1 spreek je van een
scheve, niet symmetrische
verdeling.
Dit is van invloed op verdere
statistische analyse
⁎ Spreidingsmaten
Voor een minder zwak model van de werkelijkheid gebruik je
centrummaten
Samenvatting colleges (grasple)
College 1:
⁎ Statistiek in het onderzoeksproces
⁕ Conceptualiseringsfase: statistiek wordt
gebruikt bij het opstellen van de vraagstelling
(concreet, feiten of mening).
⁕ Onderzoeksopzet: grootte en kwaliteit van de
steekproeven en de steekproef in de
populatie.
⁕ Uitvoeringsfase: statistiek wordt gebruikt bij
het ordenen en presenteren van de gegevens.
Er wordt gesproken van toetsende statistiek
als er wordt bepaald of de gegevens
overeenkomen met de theoretische
verwachtingen.
kwantitatief onderzoek: gemeten o.b.v. cijfers
kwalitatief onderzoek: meer diepgang
⁎ Terminologie
Variabele -> gemeten grootheid die kan variëren
⁕ Onafhankelijke variabelen hebben invloed op de afhankelijke
variabelen (oorzaak)
⁕ Afhankelijke variabelen worden verklaard (gevolg)
Onderzoekseenheid -> een eenheid waarbij de variabelen wordt gemeten
Score -> waarde van een onderzoekseenheid
Causaliteit -> de volgorde waarin de variabelen voorkomen (“is het zo of is
het andersom”)
Figuur 1: in de kolommen staan de variabelen en in de rijen de
onderzoekseenheden
causaliteit met meerdere
predictoren:
er zijn twee of meerdere variabelen
die zorgen voor de afhankelijke
variabelen
, causaliteit met een mediatie:
een relatie tussen 2 variabelen
die via een tussenvariabele loopt,
heet een mediator. Dit kan voor
een deel het verband verklaren of
volledig.
Causaliteit met moderatie:
Door een derde variabele is er invloed
op het geschetste verband. De derde
variabele kan ervoor zorgen dat het
verband wordt versterkt of is afgezwakt
⁎ Meetniveaus
Nominaal ->
geslacht
Ordinaal ->
opleidingsniveau
Interval ->
graden
Ratio -> lengte
⁎ Gege
vens ordenen / samenvatten met frequentieverdelingen
⁕ Relatieve frequenties
Absolute frequenties (Fi) is het aantal keer
dat een bepaalde waarde (Xi) voorkomt. ∑Fi
is het totaal van de aantal frequenties
(N=20). Proporties tellen op tot 1 en zijn
daarmee komma getallen. De percentages
tellen op tot 100 en zijn procenten.
⁕ Cumulatieve frequenties
Cumulatieve frequentie is de som van de
voorafgaande waardes. Een andere
benaming hiervoor is somfrequentie, cFi=
∑Fi1 + Fi2 + Fi3 ect…
Ook hierbij kun je de proportie en het
percentage berekenen.
Absolute frequenties zijn handiger als je informatie
wilt geven over exacte hoeveelheden en relatief is handiger voor als je scores wilt
vergelijken.
College 2
⁎ Centrummaten
⁕ Modus -> de meest voorkomende waarde
V voor alle meetniveau te bepalen
Snel en makkelijk af te lezen uit een frequentietabel
N weinig informatie wordt gebruikt
Erg afhankelijk van de klassenverdeling
Moeilijk te interpreteren
, ⁕ Mediaan -> de waarde van de middelste waarneming (laag -> hoog)
Oneven: de middelste
Even: tussen de middelste twee scores
V vanaf ordinaal meetniveau
Niet gevoelig voor uitschieters
N weinig informatie gebruikt
Niet geschikt om mee verder te rekenen
⁕ Gemiddelde -> maat gebaseerd op de afstand tot het middelpunt
*wordt gebruikt bij interval en ratio
Gemiddelde = som van alle scores : totaal aantal scores
V meer informatie gebruikt
Mogelijk om mee verder te rekenen
N gevoelig voor extreme uitschieters
Alleen mogelijk voor interval en ratio niveau
⁎ Uitschieters
Links scheve verdeling:
Rechts scheve verdeling
Vuistregel: bij een Skewness > 1
of < -1 spreek je van een
scheve, niet symmetrische
verdeling.
Dit is van invloed op verdere
statistische analyse
⁎ Spreidingsmaten
Voor een minder zwak model van de werkelijkheid gebruik je
centrummaten