100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.6 TrustPilot
logo-home
Class notes

Aantekeningen hoorcolleges Beschrijvende Statistiek studiejaar 2022/2023 - 7.6 gehaald - Premaster (forensische) orthopedagogiek + Pedagogische Wetenschappen

Rating
-
Sold
-
Pages
56
Uploaded on
10-01-2023
Written in
2022/2023

7.6 gehaald voor dit tentamen (december 2022) Samenvatting/aantekeningen van de hoorcolleges van BS in 2022. Het is een duidelijke, overzichtelijke, gestructureerde samenvatting aangevuld met voorbeelden. Succes met leren!

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
January 10, 2023
Number of pages
56
Written in
2022/2023
Type
Class notes
Professor(s)
Annette van maanen en elisa de koning
Contains
All classes

Subjects

Content preview

Beschrijvende statistiek aantekeningen

College 1: Introductie

Typen variabelen
- Type variabele bepaald welke analyse je moet toepassen
1. Categorische variabelen
- Variabelen indelen in categorieën
- De waarden zijn categorieën
- Bijvoorbeeld: haarkleur, geslacht etc.
- Je kan hier niet mee rekenen (je kunt wel een nummer toekennen aan elke
categorie)
- Meetniveaus: nominaal (bijv: wat is je lievelingseten?) of ordinaal (bijv:
opleidingsniveau of stellingen)
- Grafiekvormen: cirkeldiagram, staafdiagram en frequentietabel
2. Kwantitatieve variabelen
- Hebben cijfers/waarden
o Waarde is hoeveel je van die variabele hebt
- Hebben wel betekenis
- De waarde representeert de grootte van de variabele
- Bijvoorbeeld: leeftijd
- Meetniveaus: interval (bijv: IQ) of ratio (bijv: inkomen)
- Grafiekvormen: dotplot, stem and leaf (stengel en blad) en histogram
- 2 soorten kwantitatieve variabelen:
o Discrete variabele
 Slechts gehele waarden
 Vaste waarden zonder tussenliggende variabel
 Bijvoorbeeld: aantal kinderen in een gezin
 Hele getallen (7, 9, 22)
o Continue variabele
 Waarden kunnen onbeperkt weinig van elkaar verschillen
 Alle mogelijke waarden vormen een continuüm
 Tussenliggende waarden hebben wel een betekenis
 Bijvoorbeeld: lengte (177,5 cm)
 Oneindig aantal mogelijke waarde (niet specifiek aantal)

 Modus: waarde met de grootste frequentie
 Gemiddelde: som van alle waarden gedeeld door het aantal waarden
 Mediaan: de middelste waarde


Soorten statistiek
- Toetsende statistiek
o Statistic (statistiek): samenvatting van steekproef uit populatie
o Parameter: samenvatting van de populatie
o Ookwel inferentiële/inductieve statistiek genoemd
o Het gebruiken van ‘statistic’ om iets te zeggen over die populatie
(parameter)


1

, o Met hoeveel zekerheid kunnen we zeggen dat de gegevens uit de
steekproef ook iets zeggen over hoe die populatie in elkaar zit?
o Je maakt inferenties en generaliseert van je steekproef naar je populatie
- Beschrijvende statistiek
o Beschrijven en samenvatten van je data
o Vooral over de steekproef
o Patronen proberen te ontdekken in je data

Beschrijvende statistiek
A) Voor één variabele
- Beschrijven door middel van grafische weergave van data
- Kijken naar goede centrummaten
o 1 representatieve waarde om je data weer te geven (bijv: gemiddelde of
mediaan).
- Kijken naar goede spreidingsmaten
B) Voor categoriale variabele
- Grafische weergave met bijvoorbeeld: cirkeldiagram of staafdiagrammen
o Gebruiken voor werkelijke aantallen of percentages
- Weergaven in frequentietabellen
- Correct categorie = modale categorie
o De categorie waarin de meeste waarden zitten
C) Voor kwantitatieve variabelen
- De waarden in de frequentietabel hebben numerieke betekenis. Het gaat nu om
het aantal
- Kijken naar de modus, mediaan en het gemiddelde (centrummaten)
o Mediaan: data eerst ordenen van klein naar groot > dan in 2e delen >
middelste waarde is de mediaan
o Gemiddelde: houdt rekening met alle waarde in je data set
- Formule gemiddelde:




o X = waarde die erbij hoort
o I = elke individuele observatie (bijv: van het specifieke kind
o N = aantal observaties  de omvang van je steekproef
- Gemiddelde van frequentieverdeling
o Formule:




2

, o Som teken = alles om het somteken optellen bij elkaar
o Een snellere manier gebruik maken van gegevens die in je
frequentietabel staan
- Mediaan versus gemiddelde
o Welke je gebruikt hangt af van de verdeling van de waarden/variabele
o Normaalverdeling: mediaan en gemiddelde zijn gelijk aan elkaar. In
principe gebruik je de mediaan
o Scheve verdeling:
 Gemiddelde wordt te veel omlaag of omhooggetrokken
 Scheef naar links; de staart is link
 Beter de mediaan kiezen voor representatiever beeld. Ook bij
uitschieters.




3

, College 2: Spreiding in data

- Staafdiagram: ruimte tussen de staven
- Cirkel en staafdiagram is minder handig bij veel mogelijke waarden

Kwantitatieve variabele grafische weergeven
- Histogram wordt vaak gebruikt
- Dotplots gebruikt bij een kleine data set (minder vaak gebruikt)
- Steelblad diagram
- Histogram:
o Staven tegen elkaar
o Gebruiken van intervallen/klassen op de x-as
o Frequentietabel maken en opdelen van intervallen in gelijke grootte
o Tussen 5 á 10 klassen aanhouden voor een goed leesbaar histogram
o X-as is de range van oplopende waarde
o Informatiever dan een staafdiagram
o Als je een bepaalde waarde niet hebt, geeft dat een gat weer.

Spreiding
- Om iets te zeggen over de steekproef is een centrummaat en spreiding nodig
- Je data is variabel, 1 centrummaat is niet genoeg.
- Centrummaat geeft geen informatie over de spreiding
- Spreidingsmaat gebruiken om te bepalen wat een ‘normale’ score is
- Verschillende manieren kijken naar spreiding van scores:
o Kijken naar het bereik (range)
o Interkwartiel afstand
o Boxplot
o Dotplot
o Deviatie
- Spreidingsmaten: range (bereik), interkwartiel afstand en standaarddeviatie

Kijken naar het bereik (range)
- Range of variatiebreedte genoemd
- Verschil tussen maximum en minimum score; de laagste en hoogste waarden van
elkaar aftrekken
- Wordt sterk beïnvloed door extreme waarde
- Geen resistente manier om spreiding in data weer te geven
- Kan niet negatief zijn! Altijd positief of nul

Interkwartiel afstand (IKA)
- Gebaseerd op percentielen
o Deelt je data op in 100 stukjes
o P50 = mediaan
o Werken met p25, p50 en p75
o P% van je data is kleiner of gelijk aan is
- Gebruiken bij scheef verdeelde data
- Behorende spreidingsmaat bij mediaan Waard %
e
7 73%
4 8 74%
9 77%
10 81%
$7.78
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached


Also available in package deal

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
hannaheinen Universiteit van Amsterdam
Follow You need to be logged in order to follow users or courses
Sold
296
Member since
6 year
Number of followers
200
Documents
39
Last sold
1 month ago

4.0

38 reviews

5
10
4
19
3
9
2
0
1
0

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions