100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting Alle hoorcolleges statistiek. Alle Tentamenstof!

Rating
1.0
(1)
Sold
1
Pages
21
Uploaded on
03-11-2021
Written in
2021/2022

Uitwerkingen van alle hoorcolleges van statistiek uit blok 1.2 van jaar 1 Bedrijfskunde aan de RUG. Deze aantekeningen vormen alle tentamenstof voor dit vak. Met deze samenvatting een 9 gehaald voor statistiek.

Institution
Course










Whoops! We can’t load your doc right now. Try again or contact support.

Connected book

Written for

Institution
Study
Course

Document information

Summarized whole book?
Yes
Uploaded on
November 3, 2021
Number of pages
21
Written in
2021/2022
Type
Summary

Subjects

Content preview

Statistiek Eindtentamen
Rijksuniversiteit Groningen

Inhoud:
- Overzicht hoorcolleges 1-7

, Hoorcollege 1 Beschrijvende statistiek

Probleem: Rauwe data is complex en moeilijk interpreteerbaar
Oplossing: Data samenvatten in grafiek en enkele getallen.

Populatie is de gehele groep (mensen/dingen/…) waarover we iets willen zeggen.
Parameters zijn waarden die berekend worden aan de hand van populatiedata. Sprake van zekerheid hierover.
Steekproef (sample) is het deel (subset) van de populatie dat daadwerkelijk onderzocht wordt.
Statistieken (statistics) zijn waarden die berekend worden aan de hand van steekproefdata. Dit is onzeker.
Aan de hand van een steekproef willen we iets kunnen zeggen over een populatie.
Voor parameters en statistieken worden verschillende symbolen gebruikt, omdat dit niet hetzelfde is.
Populatie: Hoofdletter Steekproef: Kleine letter

Er zijn verschillende soorten data, hier is de methode afhankelijk van.
1. Kwalitatieve data: Waarden zijn categoriën. Hier kan/mag je niet mee rekenen.
a. Ordinale data: Waarden hebben een hiërarchische volgorde.
b. Nominale data: Er is geen logische volgorde van de waarden.
2. Kwantitatieve data: Waarden zijn getallen waarmee je kan/mag rekenen.
a. Intervaldata: Zowel negatieve als positieve waarden zijn mogelijk
b. Ratiodata: Er is een werkelijk nulpunt, een negatieve waarde is onmogelijk.
c. Continu: Je kunt het tellen
d. Discreet: Alle mogelijke getallen

Grafische grafieken Het type data bepaalt welk type diagram geschikt is.
Kwalitatieve data:
- Frequentieverdelling (frequency distribution)
o Aantal groepen moet voldoende zijn om de data goed te beschrijven
o Breedte van de groep is (max-min)/aantal groepen
- Staafdiagram (bar chart)
- Kruistabel (crosstab / contingency table)

Kwantitatieve data
- Frequentieverdeling (frequency distribution)
o Aantal groepen moet voldoende zijn om de data goed te beschrijven
o Breedte van de groep is (max-min)/aantal groepen
- Histogram
o Laat de kansverdeling zien, dus hoevaak welke waarden voorkomen
o Belangrijke informatie is of het histogram (ongeveer) symmetrisch is. Dit is makkelijk samen
te vatten.
o Asymmetrisch kan rechts scheef verdeeld (staart wijst naar rechts) of links scheef verdeelt
(staart wijst naar links).
- Spreidingsdiagram (scatter plot)
- Lijndiagram (line chart)
Staafdiagram Kruistabel
Frequentieverdeling




Lijndiagram


Spreidingsdiagram
Histogram

, Numerieke technieken Dit geeft meer detail dan een grafische weergave.
Er zijn drie categorieën van dingen die we uit kunnen rekenen.
- Centrale tendens middelpunt van een verdeling
Gemiddelde (mean) is de som van alle waarden gedeeld door aantal waarden.

Populatiegemiddelde:

Steekproefgemiddelde:
Nadeel: Gevoelig voor extreme waarden / uitschieters (outliers)
Mediaan is het middelpunt van de gesorteerde waarden. Dus het middelste getal. (50e percentiel)


Modus is de meest voorkomende/geobserveerde waarde (als deze bestaat). Er kunnen ook meerdere zijn.
Voordeel: Kan ook gebruikt worden bij categoriale data.

- Variabiliteit uitwijking rondom het gemiddelde
De variatie rondom het gemiddelde is op diverse manieren in een getal uit te drukken:
Bereik / spreidingsbreedte (range) is maximum – minimum.
Interkwartielafstand (interquartile range, IQR) is Q3 – Q1. (= minder gevoelig voor uitschieters)
Variantie / standaardafwijking (=standaarddeviatie)
- Delen door N-1 bij een steekproef
- Delen door N bij een populatie


Interpretatie: Hoe ver wijkt een observatie gemiddeld genomen af van het gemiddelde.
Hoe hoger de standaardafwijking, hoe meer afwijkingen/spreiding van het gemiddelde de getallen hebben…

Door de empirische regel kun je vrij nauwkeurig zeggen welk % van de data binnen een aantal
standaardafwijkingen van het gemiddelde ligt. De bel-vormige verdeling:




- Relatie tussen variabelen. Relatie tussen variabelen
2 maten van relatie tussen variabelen: X is de onafhankelijke variabele (independent variable)
Y is de afhankelijke variabele (dependent variable)
Covariantie (covariance)
Dit meet de richting van een lineaire relatie tussen 2 variabelen.

Populatiecovariantie:

Steekproefcovariantie:

- Cov(x,y) > 0 ⇒ x en y zijn geneigd in dezelfde richting te bewegen
- Cov(x,y) < 0 ⇒ x en y zijn geneigd in tegengestelde richting te bewegen
o Dus als X hoger wordt, wordt Y lager.
- Cov(x,y) = 0 ⇒ x en y zijn niet geneigd in dezelfde of tegengestelde richting te bewegen. (horizontaal?)

Correlatie (correlation)
Mate van zowel de richting als de sterkte van het lineaire verband tussen 2 variabelen.
Deze is makkelijker interpreteerbaar dan de covariantie.
Populatiecorrelatiecoëfficient: - Geen eenheid
- Ligt tussen −1 en 1
- Dichter bij −1: sterker negatief lineair verband
- Dichter bij 1: sterker positief lineair verband
- Dichter bij 0: zwakker lineair verband
- Belangrijk: een correlatie betekent nog niet dat er
perse een causaal verband is! Het kunnen volstrekt
ongerelateerde variabelen zijn!
$3.61
Get access to the full document:

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached


Also available in package deal

Reviews from verified buyers

Showing all reviews
3 year ago

1.0

1 reviews

5
0
4
0
3
0
2
0
1
1
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
Willemijn3 Rijksuniversiteit Groningen
Follow You need to be logged in order to follow users or courses
Sold
142
Member since
5 year
Number of followers
91
Documents
24
Last sold
1 month ago

4.0

25 reviews

5
6
4
14
3
4
2
0
1
1

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions