100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4,6 TrustPilot
logo-home
Summary

Statistiek 1a - Samenvatting Introduction to the practice of statistics & syllabus

Rating
3,5
(4)
Sold
17
Pages
16
Uploaded on
29-12-2013
Written in
2013/2014

Een duidelijke, systematische samenvatting van de statistiek die de verschillen tussen bijvoorbeeld verschillende samenvattingsmaten of samenhangsmaten duidelijk in kaart brengt.

Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Connected book

Written for

Institution
Study
Course

Document information

Summarized whole book?
No
Which chapters are summarized?
H1 t/m h5 & syllabus
Uploaded on
December 29, 2013
Number of pages
16
Written in
2013/2014
Type
Summary

Subjects

Content preview

Samenvatting Statistiek Ia
Door Esther van Zessen, eerstejaars psychologie aan de RuG




Inhoudsopgave


H1 - Verdelingen
Grafieken, getallen, normale verdelingen en kansdichtheidscurves
H2 - Relaties
Scatterplots, correlatie, kleinste kwadraten regressie, voorzichtig met correlatie en regressie,
tweewegstabellen, causatie
H3 - Data produceren
Design van experimenten, steekproef design, statistische gevolgtrekking
H4 - Kansen, de studie van willekeur
Willekeur, kansmodellen, stochasten, gemiddelden en varianties van stochasten, algemene
kansregels
H5 - Steekproefverdelingen
Steekproefverdeling van een steekproefgemiddelde, steekproefverdeling van aantallen en
proporties


Syllabus
Samenhangsmaten, samenhang in rangordening, samenhang in absolute zin,
overeenstemmingsmaten voor kwalitatieve variabelen met gelijk categorieenstelsel


Extra
Afkortingen of termen
Veelvoorkomende begrippen ENG - NL
Belangrijkste formules

,H1 - Verdelingen
Grafieken
Een distributie is een verdeling. Een categorische verdeling kan worden weergegeven in een
staafdiagram of een taartdiagram. Kwantitatieve verdelingen kunnen worden weergegeven in een
(rug-aan-rug) stamdiagram of een histogram.
Een stamdiagram vergelijkt twee gerelateerde distrubuties, en er zijn twee modificaties mogelijk
aan een stamdiagram: splitten en trimmen. Bij splitten neem je elke stam en splits je ze
allemaal. Waar je dus normaal bladeren van 0 tot en met 9 voor een stam hebt, neem je nu twee
stammen, eentje met bladeren van 0 tot en met 4 en eentje met bladeren van 5 tot en met 9.
Trimmen is handig als de geobserveerde waarden uit erg veel getallen bestaan, dan haal je het
laatste cijfer of de paar laatste cijfers weg bij elk getal.
Een histogram is handiger bij grote data sets. Er zit geen ruimte tussen de staven, wat wel zo is bij een
staafdiagram. Soms is het handig een frequentietabel (als er geen individuele observaties zijn) of een
histogram van procenten (met de procenten op de verticale as uitgezet) te gebruiken om meerdere
distrubuties met een verschillende n observaties te vergelijken.
Een histogram is unimodaal als er 1 duidelijke piek te zien is. De term rechts-scheef wordt
gebruikt om een grafiek te beschrijven waarbij de rechterstaart veel groter is (ten opzichte van
de modus) dan de linkerkant.
Een tijdplot is goed te gebruiken als er een systematische verandering over tijd plaatsvindt (zet de tijd
horizontaal uit).
Getallen
Het gemiddelde en de mediaan (de middelste waarde van een geordende set, in het geval van twee
middelste waardes het gemiddelde van die twee) zijn centrummaten. Het gemiddelde is gevoelig voor
extreme waarden zoals outliers of zoals bij scheve vergelijkingen. Om deze reden is het gemiddelde
geen resistente centrummaat. De mediaan is resistenter.
De kwartielen zijn zowel een centrummaat als een spreidingsmaat. Het eerste kwartiel, Q1, is de
mediaan van de eerste helft getallen van de geordende set. Het tweede kwartiel, Q2, is de
mediaan en het derde kwartiel, Q3, is de mediaan van de tweede helft getallen van de geordende
set. In de vijf getallen samenvatting (minimum, Q1, Q2, Q3, maximum) worden deze duidelijk
weergegeven, waarna ze eventueel kunnen worden omgezet tot een boxplot. Dit is een betere
samenvattingsmaat bij scheve distributies of bij een dataset met veel outliers.
Een manier om outliers te identificeren is door de interkwartielafstand (IQR) te berekenen. Elke waarde
die verder onder Q1 of verder boven Q3 ligt dan 1,5 x IQR is een outlier. Q3-Q1 = IQR

, In een gemodificeerde boxplot zijn de outliers individueel geidentificeerd door middel van een
plusje, kruisje of ander herkenbare markering. Bevestigde outliers moet je niet meer meenemen
in het (opnieuw) berekenen van de kwartielen!
De standaarddeviatie is niet resistent en geeft weer hoe ver de observaties van het gemiddelde af
liggen. De standaarddeviatie wordt weergegeven door een kleine letter s. De formule: s = √(s2)
s2 is de variantie. De formule: s2 = 1/(n-1) Σ ((xi - xgem )2 ) De standaarddeviatie en de variantie zijn
klein als de observaties dichtbij het gemiddelde liggen.
Een lineaire transformatie (xnieuw = a + bx) verandert de vorm niet, maar de spreiding en het
centrum wel. Een vermenigvuldiging met +b vermenigvuldigt ook de spreiding en het centrum
met b, een optelling van +-a veroorzaakt een optelling van +a bij de centrummaten (IQR en
standaarddeviatie) maar geen verandering in de spreiding (gemiddelde en mediaan).
Normale verdelingen en kansdichtheidscurves
Een dichtheidscurve ligt op of boven de horizontale as en heeft een oppervlakte van 1. Een
symmetrische kansdichtheidscurve heet een normale verdeling. De modus is daarbij de piek. Het
gemiddelde is het zwaartepunt van de grafiek (waar balanceert de grafiek?) en de mediaan is het punt
waarbij 50% van het oppervlakte links ligt en 50% rechts. Het buigpunt van de grafiek is op afstand σ
(standaarddeviatie) van μ (gemiddelde). Een normale verdeling is een goede beschrijving van echte
data en een goede benadering voor veel kansen. Bovendien werken procedures gebaseerd op een
normale verdeling vaak ook erg goed voor andere, ongeveer symmetrische, verdelingen.
68% binnen σ van μ, 95% binnen 2σ van μ, 99,7% binnen 3σ van μ.
N(μ,σ) in units van σ en μ omschrijven heet standaardiseren. Dit is mogelijk met gebruik van de
formule z = (x-μ)/σ, welke een z-score geeft. Die z-score geeft weer hoeveel sigma (σ) van mu (μ) af
ligt alsmede de richting. Een standaard normale verdeling volgt N(0,1) (uit Z = (X-μ)/σ).
De cumulatieve proportie is het proportie observaties onder een waarde, waarbij z de
rechtergrens opmaakt. Als je de top 10% wilt berekenen, ligt er dus 0.90 onder x. De
dichtsbijzinde p daarvoor in tabel A is 0,8997, z is daarbij 1,28. (x-μ)/σ = 1,28, waaruit x
dan volgt. Alles ≥ x is dan de top 10%.


H2 - Relaties
Scatterplots
Bij geassocieerde variabelen vertelt het weten van de waarde van de ene variabele je iets over de
waarde van de tweede variabele (de grootte van een koffie bij Starbucks vertelt je iets over de prijs
ervan).
R68,33
Get access to the full document:
Purchased by 17 students

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Reviews from verified buyers

Showing all 4 reviews
9 year ago

.

12 year ago

8 year ago

12 year ago

3,5

4 reviews

5
1
4
1
3
1
2
1
1
0
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
Esthervan666 Rijksuniversiteit Groningen
Follow You need to be logged in order to follow users or courses
Sold
121
Member since
12 year
Number of followers
60
Documents
11
Last sold
2 year ago

Hoi! Ik ben Esther, tweedejaars psychologie aan de RuG. Hiervoor heb ik anderhalf jaar sterrenkunde gestudeerd, ook aan de RuG. Ik maak altijd een samenvatting van de leerstof gecombineerd met mijn aantekeningen van de hoorcolleges. Als je vragen hebt over een van mijn samenvattingen of een verzoek, stuur me even een berichtje!

3,3

15 reviews

5
1
4
6
3
4
2
4
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can immediately select a different document that better matches what you need.

Pay how you prefer, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card or EFT and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions