Statistics for Business and Economics, Global Edition
Uitwerkingen van alle hoorcolleges van statistiek uit blok 1.2 van jaar 1 Bedrijfskunde aan de RUG. Deze aantekeningen vormen alle tentamenstof voor dit vak.
Met deze samenvatting een 9 gehaald voor statistiek.
Probleem: Rauwe data is complex en moeilijk interpreteerbaar
Oplossing: Data samenvatten in grafiek en enkele getallen.
Populatie is de gehele groep (mensen/dingen/…) waarover we iets willen zeggen.
Parameters zijn waarden die berekend worden aan de hand van populatiedata. Sprake van zekerheid hierover.
Steekproef (sample) is het deel (subset) van de populatie dat daadwerkelijk onderzocht wordt.
Statistieken (statistics) zijn waarden die berekend worden aan de hand van steekproefdata. Dit is onzeker.
Aan de hand van een steekproef willen we iets kunnen zeggen over een populatie.
Voor parameters en statistieken worden verschillende symbolen gebruikt, omdat dit niet hetzelfde is.
Populatie: Hoofdletter Steekproef: Kleine letter
Er zijn verschillende soorten data, hier is de methode afhankelijk van.
1. Kwalitatieve data: Waarden zijn categoriën. Hier kan/mag je niet mee rekenen.
a. Ordinale data: Waarden hebben een hiërarchische volgorde.
b. Nominale data: Er is geen logische volgorde van de waarden.
2. Kwantitatieve data: Waarden zijn getallen waarmee je kan/mag rekenen.
a. Intervaldata: Zowel negatieve als positieve waarden zijn mogelijk
b. Ratiodata: Er is een werkelijk nulpunt, een negatieve waarde is onmogelijk.
c. Continu: Je kunt het tellen
d. Discreet: Alle mogelijke getallen
Grafische grafieken Het type data bepaalt welk type diagram geschikt is.
Kwalitatieve data:
- Frequentieverdelling (frequency distribution)
o Aantal groepen moet voldoende zijn om de data goed te beschrijven
o Breedte van de groep is (max-min)/aantal groepen
- Staafdiagram (bar chart)
- Kruistabel (crosstab / contingency table)
Kwantitatieve data
- Frequentieverdeling (frequency distribution)
o Aantal groepen moet voldoende zijn om de data goed te beschrijven
o Breedte van de groep is (max-min)/aantal groepen
- Histogram
o Laat de kansverdeling zien, dus hoevaak welke waarden voorkomen
o Belangrijke informatie is of het histogram (ongeveer) symmetrisch is. Dit is makkelijk samen
te vatten.
o Asymmetrisch kan rechts scheef verdeeld (staart wijst naar rechts) of links scheef verdeelt
(staart wijst naar links).
- Spreidingsdiagram (scatter plot)
- Lijndiagram (line chart)
Staafdiagram Kruistabel
Frequentieverdeling
Lijndiagram
Spreidingsdiagram
Histogram
, Numerieke technieken Dit geeft meer detail dan een grafische weergave.
Er zijn drie categorieën van dingen die we uit kunnen rekenen.
- Centrale tendens middelpunt van een verdeling
Gemiddelde (mean) is de som van alle waarden gedeeld door aantal waarden.
Populatiegemiddelde:
Steekproefgemiddelde:
Nadeel: Gevoelig voor extreme waarden / uitschieters (outliers)
Mediaan is het middelpunt van de gesorteerde waarden. Dus het middelste getal. (50e percentiel)
Modus is de meest voorkomende/geobserveerde waarde (als deze bestaat). Er kunnen ook meerdere zijn.
Voordeel: Kan ook gebruikt worden bij categoriale data.
- Variabiliteit uitwijking rondom het gemiddelde
De variatie rondom het gemiddelde is op diverse manieren in een getal uit te drukken:
Bereik / spreidingsbreedte (range) is maximum – minimum.
Interkwartielafstand (interquartile range, IQR) is Q3 – Q1. (= minder gevoelig voor uitschieters)
Variantie / standaardafwijking (=standaarddeviatie)
- Delen door N-1 bij een steekproef
- Delen door N bij een populatie
Interpretatie: Hoe ver wijkt een observatie gemiddeld genomen af van het gemiddelde.
Hoe hoger de standaardafwijking, hoe meer afwijkingen/spreiding van het gemiddelde de getallen hebben…
Door de empirische regel kun je vrij nauwkeurig zeggen welk % van de data binnen een aantal
standaardafwijkingen van het gemiddelde ligt. De bel-vormige verdeling:
- Relatie tussen variabelen. Relatie tussen variabelen
2 maten van relatie tussen variabelen: X is de onafhankelijke variabele (independent variable)
Y is de afhankelijke variabele (dependent variable)
Covariantie (covariance)
Dit meet de richting van een lineaire relatie tussen 2 variabelen.
Populatiecovariantie:
Steekproefcovariantie:
- Cov(x,y) > 0 ⇒ x en y zijn geneigd in dezelfde richting te bewegen
- Cov(x,y) < 0 ⇒ x en y zijn geneigd in tegengestelde richting te bewegen
o Dus als X hoger wordt, wordt Y lager.
- Cov(x,y) = 0 ⇒ x en y zijn niet geneigd in dezelfde of tegengestelde richting te bewegen. (horizontaal?)
Correlatie (correlation)
Mate van zowel de richting als de sterkte van het lineaire verband tussen 2 variabelen.
Deze is makkelijker interpreteerbaar dan de covariantie.
Populatiecorrelatiecoëfficient: - Geen eenheid
- Ligt tussen −1 en 1
- Dichter bij −1: sterker negatief lineair verband
- Dichter bij 1: sterker positief lineair verband
- Dichter bij 0: zwakker lineair verband
- Belangrijk: een correlatie betekent nog niet dat er
perse een causaal verband is! Het kunnen volstrekt
ongerelateerde variabelen zijn!
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Willemijn3. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.35. You're not tied to anything after your purchase.