100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting Introduction to the Practice of Statistics.

Rating
-
Sold
5
Pages
9
Uploaded on
11-01-2015
Written in
2014/2015

Deze samenvatting is weliswaar uit de 5e druk, maar het enige verschil met de nieuwe druk is dat de volgorde een beetje is gewisseld. De stof is gelijk gebleven, en ik heb met mijn samenvatting een 7.4 op het vak gehaald.

Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Connected book

Written for

Institution
Study
Course

Document information

Summarized whole book?
No
Which chapters are summarized?
H1 tot en met h4
Uploaded on
January 11, 2015
Number of pages
9
Written in
2014/2015
Type
Summary

Content preview

Introduction to the Practice of Statistics

H1 Looking at Data
Introduction
Statistiek:
- vat kwantitatieve data samen
- geeft daarbij onnauwkeurigheidsmarges aan
- essentieel hulpmiddel bij onderzoek doen.
Data heeft een context nodig om het te begrijpen!

Als je een onderzoek begint:
- Waarom? Wat voor doel heeft de data?
- Wie? Welke en hoeveel individuelen beschrijft de data?
- Wat? Hoeveel variabelen bevat de data? Wat zijn de exacte definities hiervan? Meeteenheid?
Variabelen: kenmerken van een individu
- Categorische variabelen: in groepen of categorieën
- Kwantitatieve variabelen: nummers
Een verkeerde keuze van variabelen kan leiden tot vertekende conclusies (=misleidend)

1.1 Displaying Distributions with Graphs
Exploratory data analysis: het simpel beschrijven van wat we zien (m.b.v. statistische gereedschappen
en ideeën). Twee basisstrategieën:
- Begin met het onderzoeken van de variabelen en daarna een relatie daartussen zoeken
- Begin met grafiek(en). Voeg numerieke samenvattingen toe of specifieke aspecten van de data.
De verdeling van categorische variabelen geven het absolute aantal of het percentage aan.
Twee manieren van grafische verwerking (vaak gebruikt bij kwalitatieve data):
- Bar graph: staafdiagram. Flexibeler en makkelijker te lezen.
- Pie Chart: cirkeldiagram. Gebruik je als je alle categorieën wilt gebruiken om te kijken of er een
relatie is.

Belangrijke principes:
- Nadat je de achtergrond van de data weet  plot de data! Grafische verwerking!
- Als je naar je plot kijkt: kijk naar de globale verdeling en naar opvallende afwijkingen.

Kwantitatieve data analyseren:
- Stemplot: geeft een snel beeld van de verdeling en meteen ook de werkelijke getallen. Werkt het
best met cijfers boven 0.
> maken van een stemplot
- Elke observatie in een stengel.. Het laatste cijfer komt in een blad.
- Stengel wordt een verticale kolom met de kleinste bovenaan
- Maak de blaadjes.
> Bij 1 categorie: rechts van de stengel.
> Bij meerdere categorieën (bijv. man-vrouw): 1 links en 1 rechts. (=back-to-
back stemplot)
De blaadjes moeten vanaf de stengel naar buiten in oplopende volgorde zijn.
Stemplots werken niet goed bij een groot aantal data! Je zou dan bijvoorbeeld de stengels moeten
splitsen. Dus 1 stengel met blaadjes van 0-4 en een stengel met blaadjes van 5-9.
- Histogram
> beter bij groot aantal data.
> verdeelt data in klassen : vorm is hier heel erg afhankelijk van!

, > geeft niet alle werkelijke data.
> maken van een histogram:
- deel de data in klassen
- tel het aantal scores binnen deze klassen (frequentie)
- maak het histogram: x-as de klassenverdeling.
> je kunt ook frequentiehistogrammen maken: vergelijken van verschillende verdelingen.
> histogrammen hebben geen ruimte tussen de staven, staafdiagram wel.
Je kunt het patroon van een grafische verwerking beschrijven d.m.v. vorm, centrum en spreiding.
> gemiddelde = centrum: 50% links en 50% rechts.
> heeft het 1 of meerdere modus(sen)  1 = unimodaal
> Verdeling symmetrisch of scheef? (linksscheef/rechtsscheef)
> Let op „ouliers‟!
 foutje in de data? Verbeteren!
 afwijkende groep/persoon? Apart rapporteren!
Data verzameld over de tijd  Time plot!
> Trend: lange tijd dalen of stijgen.
> Seasonal variation: patroon dat zich herhaalt op bekende regelmatige tussenpozen van tijd.
 hierdoor vaak „seasonally adjusting‟ om misleiding te voorkomen. (aanpassen van
de grafieken)

1.2 Describing Distributions with Numbers
Centrummaten:
- Gemiddelde: niet resistent voor uitbijters!
- Mediaan: meer resistent voor uitbijters. Vergeet niet de getallen op volgorde te zetten!
> Verdeling symmetrisch? Gemiddelde = mediaan!
> Verdeling scheef? Gemiddelde is niet mediaan!
> Wanneer gemiddelde < mediaan? Bij linksscheve verdeling!
Spreidingsmaten:
- Kwartielen:
> Eerste kwartiel: de helft van de eerste helft. (mediaan van de getallen links v/d mediaan =
25%)
> Derde kwartiel: de helft van de tweede helft. (de mediaan van de getallen rechts v/d
mediaan = 75%)
- Afstand eerste en laatste kwartiel = middelste 50% = IQR.
 5 number summary en de bijbehorende grafische verwerking: boxplot (side by side = 2 boxplots)
- minimum
- Q1
- mediaan
- Q3
- maximum
Als een getal meer dan 1,5 x IQR van het minimum of maximum af ligt  outlier  apart weergeven.
- Gemiddelde absolute afwijking
- Variantie


- Standaarddeviatie
Wortel variantie. Standaardafwijking. Som van de afwijkingen van alle observaties is altijd 0!
Standaarddeviatie is groot als de spreiding vanaf het gemiddelde ook groot is.
> niet resistent voor outliers.

Wanneer centrum- of spreidingsmaten?  5 number summary voor een asymmetrische verdeling,

, voor symmetrische verdeling: gemiddelde en standaarddeviatie, variantie, gemiddelde absolute
afwijking, IQR.

Lineaire transformaties:
xnew=a+bx
x: scores van alle proefpersonen op variabele x
a: optelconstante
b: vermenigvuldigingsconstante
- effect op gemiddelde : x new  a  bx
- effect op standaardafwijking: s  b s
x new x



DIA 22 van College 4a voor transformaties!

1.3 Density Curves and Normal Distributions
Empirische cyclus:
> Vraagstelling  zorgvuldige formulering
> Operationalisatie:  hoe meet je het begrip/de variabelen van de vraagstelling?
> Onderzoeksopzet:  experiment/survey?
> Data verzamelen  het meeste werk
> Data screenen  plaatjes maken
> Data reductie/resultaten  samenvattingsmaten voor centrum en spreiding en complete
verdeling
> Onzekerheidsmarges

Dichtheidscurve
- geeft aan hoeveel van de scores is een willekeurig interval liggen
- = BENADERING
- altijd boven de x-as
- totale oppervlakte onder de curve is 1
- geen frequenties en geen y-as
- gladgestreken beeld van de verdeling van de scores
- dus ook maten voor centrum en spreiding. Gemiddelde: wanneer µ
Normale verdeling (=symmetrisch, unimodaal): en wanneer ?
- gemiddelde = mediaan = modus  steekproef
Waarom normale verdeling belangrijk? µ  hele populatie
- veel verdelingen zijn in de praktijk normaal
- kansprocessen  normaal verdeeld
- nuttig bij bepalen van onzekerheidsmarges
- je kunt er mee rekenen! 
> 68-95-99.7 regel:
- 68% binnen gem en daar een
standaarddeviatie vanaf
- 95% binnen gem en daar twee standaarddeviaties vanaf
- 99.7% binnen gemiddelde en 3 standaarddeviaties daar vanaf.
Weergave normale verdelingen : N(gemiddelde,standaarddeviatie)

Om mee te werken/vergelijken  standaardiseren:
- x is normaal verdeeld x
- x – gemiddelde is normaal verdeeld. Gemiddelde is 0 z

- Z is normaal verdeeld  standaard normale verdeling. Gemiddelde is 0 en standaardafw 1

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
Araaanka Universiteit van Amsterdam
Follow You need to be logged in order to follow users or courses
Sold
892
Member since
10 year
Number of followers
303
Documents
72
Last sold
2 weeks ago

3.5

132 reviews

5
15
4
70
3
25
2
15
1
7

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions