100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.6 TrustPilot
logo-home
Summary

Samenvatting Introduction to the practice of Statistics - Moore, McCabe en Craig - 9th edition H1 t/m 7

Rating
4.3
(9)
Sold
39
Pages
31
Uploaded on
07-06-2019
Written in
2018/2019

Samenvatting van het boek Moore - McCabe en Criag 9th edition H1 t/m 7 Hieronder een beschrijving wat er in de samenvatting staat: Hoofdstuk 1 (zonder Beyond the Basics: Density estimation) Hoofdstuk 2 (zonder 2.4 en 2.5) Hoofdstuk 3 (zonder Beyond the Basics: Capture-recapture) Hoofdstuk 4 (zonder Beyond the Basics: More laws of large numbers en Baye's rule) Hoofdstuk 5 (zonder Beyond the Basics: Weibull distribution, Nomral approximations for counts and proportions, The continuity correction, Bionomial formula en The Poisson distributions) Hoofdstuk 6 Hoofdstuk 7 (zonder Beyond the Basics: the bootstrap en 7.3)

Show more Read less
Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Connected book

Written for

Institution
Study
Course

Document information

Summarized whole book?
No
Which chapters are summarized?
Hoofdstuk 1 (zonder beyond the basics: density estimation) hoofdstuk 2 (zonder 2.4 en 2.5) hoofdstuk
Uploaded on
June 7, 2019
File latest updated on
October 9, 2019
Number of pages
31
Written in
2018/2019
Type
Summary

Subjects

Content preview

Hoofdstuk 1
1.1. Cases zijn de objecten beschreven als data (klanten, bedrijven, aantal deelnemers)
Label is een speciale variabele om de verschillende cases te onderscheiden
Een variabel is een karakterkenmerk van een case (hoogte, geslacht, salaris):
➔ Categorie variabel: plaats een case in een groep of categorie (man of vrouw)
➔ Kwantitatieve variabel: neemt numerieke waarderingen waar bewerkingen zoals optellen of
middeling zinvol zijn (hoogte in cm, salaris in dollars)
- Unit of measurement: beschrijving van welke kwantitatieve variabele (dollars, inches,
centimeters).
Variabelen kunnen verschillende waarden hebben voor verschillende cases of units.

Data beschrijven:
1. Wie? Welke objecten en hoeveel?
2. Wat? Hoeveel variabelen heeft het en wat zijn de exacte definities hiervan? (unit of
measurements)
3. Waarom? Wat is het doel van de data?

Instrumenten zijn nodig voor het meten van variabelen. Het is van belang dat je bij elk variabele echt
meet wat je wilt weten. Een slechte keuze van variabelen kan leiden tot misleidende conclusies.

1.2. Exploratory date analysis: data beschrijven
- Begin met onderzoeken van elke variabele op zichzelf. Dan naar de relaties tussen de
variabelen
- Begin met graph(s). Voeg dan numerieke samenvattingen van specifieke data toe

Categorie variabelen:
- Distribution of categorical variable: aantal, procent of proportion
- Staafdiagram: aantal of procenten
- Cirkeldiagram: procenten

Kwantitatieve variabelen:
1. Stemplot: geeft de verdeling van de numerieke waarden weer
➔ Back to back stemplot: om dingen te vergelijken, zie afbeelding >
2. Histogram: geeft alleen het aantal of procent weer dat binnen een klasse valt
- Scores verdelen in klasse van evenwichtige spreiding
- Frequentie van aantallen binnen de klasse
- Verschillende soorten: scheef naar links/recht of symmetrisch
- Unimodal: een grote piek binnen de histogram
- Outlier: een individuele waarde die buiten het patroon valt, uitleggen!

Timeplot: plot elke variabele die op een tijdstip werd gemeten. Altijd op de horizontale as

1.3. Zie afbeelding blz. 2. Modus: meest voorkomende cijfer
Mean x̄: gemiddelde waarde. Alles bij elkaar ∑ / n
Median: middelste waarde. n+ = de plaats van de mediaan. Die 2 cijfers bij elkaar / 2 = mediaan
Quartiles: Q1: 25%, Q3: 75%. Om kwartielen te berekenen:
1. M: vind de mediaan
2. Q1: mediaan van het stuk onder/links M
3. Q3: mediaan van het stuk boven/rechts M Five-number summary
4. Whiskers: lijnen tot het kleinste en grootste getal
5. Minimum en maximum getallen


1

,Interquartile range (IQR) = Q3 – Q1

Outlier: een sterke afwijking.
Zijn alleen als deze 1.5 x IQR onder of boven Q3 of Q1 ligt:
- Q1 – (1.5 x IQR)
- Q3 + (1.5 x IQR)

Modified boxplot: lijnen gaan naar de kleinste of grootste waarde vanuit de box,
die niet horen tot de IQR regel

Side-by-side boxplot: twee of meer boxplots om groepen te vergelijken op het
gebied van dezelfde variabelen

Standaarddeviatie (s): de mate van spreiding van getallen rondom het gemiddelde, √s2
Variantie (s2): mate waarin de waarden onderling verschillen




Een lineaire transformatie verandert de originele variabele x in een nieuwe variabele xnew:
xnew = a + bx.

1.4.
Density curves: een patroon die het algemene patroon van gegevens weergeeft maar onregelmatig
heden weglaat
➔ Is altijd op of boven de horizontale as
➔ Heeft een gebied precies onder zich
1. De median is het punt dat de curve verdeeld in 2 gelijke gebieden
2. De mean is het balans punt
* voor een symmetrische curve zijn de mean en median gelijk, de mean wordt weggetrokken als de
curve een ‘staart’ heeft.

Normaalverdeling = N(µ, σ)
µ = gemiddelde
σ = standaarddeviatie

68-95-99.7 rule:
- 68% van de waarden valt binnen σ van µ
- 95% van de waarden valt binnen 2σ van µ
- 99.7% van de waarden valt binnen 3σ van µ


2

,z-score vertelt hoeveel standaarddeviaties afwijken van het gemiddelde en in welke richting. Zie
tabel A in het boek.
De volgende formules worden nu gebruikt:

Soms worden gegevens voor de z-score gegeven (Tabel A)
➔ X = µ +zσ




Voorbeeld
Je haalt voor de toelatingstoets een 6.7. Het gemiddelde is een 5.5 en de SD is 1.481. Wat is de
proportie studenten die een 6.7 of lager heeft gehaald?

Z-score = (6.7 – 5.5)/1.481 = 0.81
Zie Tabel A voor P(z < 0.81)
P(z < 0.81)= 0.7910
Dus 0.791 (of 79.1%) van de studenten heeft een 6.7 of lager gehaald.


Cummulative proportions: verhoudingen van waarden in een verdeling die ligt op of beneden een
gegeven waarde.

Hoofdstuk 2
2.1.
Twee gemeten variabelen in hetzelfde geval zijn geassocieerd als een van de waarde van een
variabele iets zegt over de waarde van de andere variabele.
Belangrijke eigenschappen voor relaties tussen data:
1. Object: bepaal de objecten en hoeveel zijn er?
2. Categorie of kwantitatief: classificeer elke variabele als categorie of kwantitatief
3. Waarde: bepaal de waarde van elke variabele
4. Classificeer elke variabele als
- Respons/afhankelijke variabele: meet een uitkomst van een studie
- Explanatory/onafhankelijke variabele: verklaart of veroorzaakt veranderingen in de
respons variabele
5. Label: bepaal welke labels de variabelen hebben

2.2. Scatterplots
De meest gebruikte manier om de relatie tussen twee kwantitatieve variabelen weer te geven is
door middel van een scatterplot > spreidingsdiagram.
- De waarden van de ene variabelen komt op de horizontale as > explanatory variabele
- De waarden van de andere variabelen komt op de verticale as
- Elk object van data verschijnt als een ‘punt’
- Outlier: sterke afwijking

catterplot: puntjes geven de intersectie van X en Y waarden weer
Interpreteren van een scatterplot:
- Bekijk het algehele patroon en de afwijkingen

3

, 1. Vorm:
- Lineair: in een rechte lijn
- Curve: met een boog (non-lineair)
2. Richting:
- Positieve correlatie: hoge scores van de ene variabele hangen samen met hoge scores
van de andere variabele
- Negatieve correlatie: hoge scores van de ene variabele hangen samen met lage scores
van de andere variabele
3. Sterkte: hoe dichter de punten bij de lijn liggen, hoe sterker de relatie ertussen




Om een curve lineair te maken, kan er een transformatie plaats vinden. Dan worden originele
waarden vervangen door getransformeerde waarden en deze worden gebruikt voor de analyse.
➔ Meest belangrijke is de log transformatie: log(y)




Wanneer een variabele toe wordt gevoegd aan een scatterplot, gebruik je een andere kleur of
symbool of elke categorie.

Scatterplot smoothers: een methode om de relatie tussen twee kwantitatieve variabelen de
onderzoeken door een vloeiende curve in te brengen in data

2.3. Correlatie
De correlatie r meet de richting en sterkte van de lineaire relatie tussen twee kwantitatieve
variabelen. De correlatie tussen x en y is:


4
$7.91
Get access to the full document:
Purchased by 39 students

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Reviews from verified buyers

Showing 7 of 9 reviews
1 year ago

4 year ago

4 year ago

4 year ago

4 year ago

5 year ago

5 year ago

4.3

9 reviews

5
4
4
4
3
1
2
0
1
0
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
IlseGeers Universiteit Leiden
Follow You need to be logged in order to follow users or courses
Sold
329
Member since
9 year
Number of followers
261
Documents
12
Last sold
4 months ago
IlseGeers

Ik deel graag mijn samenvattingen met jullie. Deze leer ik zelf ook, en bestaan uit de inhoud van de boeken en (vaak) niet uit de stof van de colleges. Ik wil benadrukken dat iedereen op zijn eigen manier leert/samenvat. Voor mij betekent dit dat het mij vooral om een goede inhoud gaat, dus wellicht zal je typfouten en kromme zinnen tegen komen. Bedankt voor jullie vertrouwen in mij en succes met leren!

3.8

38 reviews

5
6
4
22
3
8
2
0
1
2

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions