Chapter 1: Statistics or Sadistics?
Statistics = set van tools en technieken gebruikt om data of informatie te beschrijven,
organiseren en interpreteren.
Data = opname van een observatie of een evenement zoals een testscore, een cijfer voor
wiskunde of reactietijd.
Data point = observatie.
Descriptive statistics = gebruikt om de eigenschappen van een verzameling van data te
organiseren en beschrijven. De verzameling van data wordt dataset of data genoemd.
Inferential statistics = tools gebruikt om eigenschappen van een populatie af te leiden,
gebaseerd op data van een sample van die populatie.
Populatie = al de mogelijke subjecten of gevallen van interesse.
Sample = subgroep van een populatie.
Statistiek helpt ons de wereld om ons heen te begrijpen. Descriptive en inferential statistics
gaan hand in hand, welke je gebruikt hangt af van je vraag.
Statistiek is belangrijk om beslissingen te maken gebaseerd op empirische observaties en
niet je eigen ideeën/door bias.
Chapter 2: Means to an End
Computing and understanding averages
Average = de meest representatieve score in een set van scores.
Measures of central tendency = mean, median, mode.
1. Mean (arithmetic mean/rekenkundig gemiddelde) =
type gemiddelde berekend door de waardes op te tellen en te delen door het aantal
waardes.
X met streepje erboven (X bar) is het gemiddelde.
Sigma is sommeringsteken, betekent tel op wat volgt.
X is elke individuele score in een groep scores.
n is de omvang van het sample waarvan je het gemiddelde berekent.
Stappenplan gemiddelde
1. Zet de waarden in kolommen: dit zijn allemaal X’en.
2. Bereken het totaal van de waarden.
3. Deel het totaal van de waarden door het aantal waarden.
Belangrijke punten
Mean wordt vaak aangegeven als M, ook wel typical, average of most central score
genoemd.
N = populatie en n = sample. Soms geen onderscheid gemaakt.
, Sample mean is de centrale tendens die het beste de population mean reflecteert.
Gemiddelde is als steunpunt op een wip.
Mean is heel erg gevoelig voor extreme scores, kan zorgen voor minder
representativiteit van de set scores.
Stappenplan gewogen gemiddelde
1. Zet alle waarden van het sample in een tabel als X.
2. Zet de frequentie waarmee de waarde voorkomt ernaast in een tabel.
3. Vermenigvuldig de waarde met de frequentie.
4. Tel alle waarden van de waarde x frequentie op.
5. Deel door de totale frequentie.
Romeinse letters voor sample (bijv gemiddelde X met streepje erboven).
Griekse letters voor populatie (bijv gemiddelde as μ - mu).
2. Median =
middelpunt in een set waarden, 50% van de gevallen valt boven de mediaan en 50% van de
gevallen valt onder de mediaan.
Stappenplan mediaan
1. Zet de waarden op volgorde van hoog naar laag of van laag naar hoog.
2. Vind de middelste score.
Oneven aantal waarden:
51 - 43 - 34 - 32 - 27 - 12 -6
Mediaan is middelste waarde, is 32.
Even aantal waarden:
51 - 43 - 34 - 32 - 27 - 12
Mediaan is gemiddelde van de middelste twee waarden dus 34+32 gedeeld door 2 is 33.
Percentile point = percentage gevallen gelijk aan en beneden een bepaalde score in een
distributie of set van scores.
Mediaan is het 50e percentiel - Q2
25e percentiel = Q1
50e percentiel = Q2
75e percentiel = Q3
Mediaan wordt gebruikt, omdat de mediaan niet gevoelig is voor erg extreme scores.
Extreme scores kunnen vervormen wat de echte centrale waarde is.
Skew/skewness (scheefheid) = de eigenschap van een distributie die zorgt voor
disproportionele frequentie van bepaalde scores.
Een langere staart rechts dan links komt overeen met een lager nummer gevallen aan de
hoge kant van de verdeling; dit is een positively skewed distribution,
Een kortere staart rechts dan links komt overeen met een hoger aantal gevallen op aan de
hoge kant van de verdeling; dit is een negatively skewed distribution.
,Belangrijke punten
Mediaan wordt vaak ook M genoemd, of Med of Mdn.
Mediaan is de middelste waarde in een set waarden.
Mediaan gaat om hoeveel gevallen er zijn, niet de waarden van de gevallen. Extreme
scores (outliers) tellen niet.
3. Mode =
vaakst voorkomende score in een verdeling.
Stappenplan modus
1. Noteer alle waarden, maar noteer elke waarde maar 1 keer.
2. Tel hoe vaak de waarden voorkomen.
3. De vaakst voorkomende waarde is de modus.
When to use what measure of central tendency (and all you need to know about scales
and measurement for now)
Welke measure of central tendency je moet gebruiken hangt af van kenmerken van data
waar je mee werkt, specifiek de scale of measurement.
Scale of measurement = verschillende manieren om uitkomsten van metingen te
categoriseren: nominaal, ordinaal, interval en ratio.
1. Nominal level of measurement = waarde in 1 en ook echt maar 1 categorie plaatsen.
2. Ordinal level of measurement = plaatst een waarde in een categorie en zet categorie
in een rangorde tegenover andere categorieën.
3. Interval level of measurement = plaatst een waarde in een categorie, in een rangorde
en de afstand is gelijk tussen de categorieën.
4. Ratio level of measurement = plaatst een waarde in een categorie, in een rangorde,
afstand is gelijk tussen de categorieën en er is een natuurlijk nulpunt/absolute zero.
Samengevat
Elke uitkomst kan worden toegeschreven aan een van de 4 schalen van meting.
Er zit een volgorde in, van minst precies (nominaal) naar meest precies (ratio).
Hoe hoger op de schaal, hoe preciezer de data is en hoe meer gedetailleerd en
informatief de data is.
, Ratioschaal heeft ook alle kenmerken van de schalen onder zich.
Wanneer welke central tendency gebruiken?
Kwalitatief, categorisch of nominaal → modus.
Kwantitatief → mediaan en mean.
3 richtlijnen
1. Gebruik de modus wanneer data categorisch is en waarden alleen in een categorie
passen, zoals haarkleur, politieke oriëntatie, wijk en religie. Dan noem je de
categorieën mutually exclusive.
2. Gebruik de mediaan wanneer je extreme scores hebt en je het gemiddelde niet wilt
vervormen, zoals wanneer de variabele inkomen in dollars is.
3. Gebruik het gemiddelde wanneer je data hebt die geen extreme waarden bevatten en
niet categorisch zijn, zoals score op een test of aantal seconden dat het duurt om 50
meter te zwemmen.
Chapter 3: Vive la Différence
Understanding variability
Belangrijk:
De som van de gekwadrateerde afwijkingen, (X-Xbar) ², wordt ook de som van vierkanten of
(sum of squares), eenvoudiger SS genoemd.
Variability = hoeveel scores van elkaar verschillen. Anders gezegd: hoeveelheid spread of
dispersion (spreiding) in een set scores.
Je kijkt naar hoe verschillende scores verschillen van het gemiddelde.
Je hebt (1) range, (2) standard deviation en (3) variance als measures of variability.
Hoe meer observaties, hoe minder variability, omdat er meer waardes tussen zullen
zitten die op elkaar en op het gemiddelde lijken.
1. Range =
het positieve verschil tussen de hoogste en de laagste score in een verdeling. Een grove
meting van variability.
Exclusive range is de hoogste score minus de laagste score (vaakst gebruikt).
r = h -l
Inclusive range is de hoogste score minus de laagste score plus 1.
r = h - l + 1.
r is range.
h is de hoogste score in de dataset.
l is de laagste score in de dataset.
2. Standard deviation =
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur erasmusuniversitysummaries. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €9,51. Vous n'êtes lié à rien après votre achat.