100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Summary Applied Statistics in Business and Economicsc van Douane/Seward

Beoordeling
3,6
(9)
Verkocht
79
Pagina's
50
Geüpload op
17-10-2016
Geschreven in
2016/2017

Een samenvatting van zowel de hoorcolleges als het boek: Applied Statistics in Business and Economics
















Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Heel boek samengevat?
Ja
Geüpload op
17 oktober 2016
Aantal pagina's
50
Geschreven in
2016/2017
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Quantitative Research Methods II

 Data
Statistiek is de studie van het verzamelen, analyseren, interpreteren, presenteren en
organiseren van gegevens. Data zijn geobserveerde feiten.
De rol van data:
- Het suggereren van theorieën (pizza’s met een hoge prijs zijn minder populair).
- Het testen van hypotheses
of beweringen (adverteren
verhoogt de verkopen).
Data in een matrix:
Binnen een matrix staan de
variabelen (variables) bij de
kolommen en het geval waar het
om gaat in de rijen (subjects/cases).
Binnen de cellen staan de
geobserveerde feiten. Er kan veel
informatie uit een matrix worden
gehaald. Zo kan er op basis van één
variabele al iets kunnen worden
geconcludeerd. Ook kunnen verschillende variabelen met elkaar worden vergeleken.
Eén variabele  De gemiddelde leeftijd.
Twee variabalen  De correlatie tussen de leeftijd en lengte.
Types data:
- Scale  In woorden (categorical) of in cijfers (numerical).
- Countability  Hele getallen (discrete) of kommagetallen (continuous).
- Range  Oneindig (infinite) of begrensd (restricted).
- Coding  Nominale of ordinale categorieën in cijfers vervangen.
- Recoding  Het groeperen van categoriale of numerieke data.
Dummy  0 (nee) of 1 (ja).
Enige valkuilen:
- Er wordt data gemist.
- Dat gecodeerde categorieën als nummers worden behandeld.
- Data moet in de juiste unit worden genoteerd.

,Het verkrijgen van gegevens:
- Typen uit boeken
- Downloaden van online databases of algemene webpagina’s.
- Informatie uit al uitgevoerde onderzoeken.
- Zelf onderzoeken doen door middel van interviews, experimenten of observaties.
Meetniveaus:
- Ordinaal Hier is sprake van specifieke ordening tussen zaken. Denk hierbij aan
groot, groter en het grootst.
- Nominaal  Onderscheid maken tussen zaken. Namen zijn voorbeelden hiervan. Er
is geen specifieke ordening van zaken.
- Interval  Waarde kan geen 0 zijn.
- Ratio  Waarde kan wel 0 zijn.

 Data summaries
Er zijn twee soorten samenvattingen:
- Graphical summaries.
- Statistical summaries.
Numerical (Graphical summaries)  Scatterplot.
Numerieke data (Statistical summaries)  Mediaan, modus, gemiddelde, variantie,
standaardafwijking, minimum, maximum, range en skewness.
Numerieke data (box plot)  Minimum, eerste kwartiel (𝑄1 ), mediaan, derde kwartiel (𝑄3 )
en maximum.
Numerieke data (histogram)  Frequentieverdeling.
Categorische data (Graphical summaries)  Cirkeldiagram of staafdiagram.
Categorische data (Statistical summaries)  Frequenties, proporties of percentages.


Numerieke data (centrality):
1 𝑛
Gemiddelde  𝑥̅ = ∑ 𝑥
𝑛 𝑖=1 𝑖
𝑀𝑖𝑛𝑖𝑚𝑢𝑚+𝑚𝑎𝑥𝑖𝑚𝑢𝑚
Midrange 
2
Range  𝑀𝑎𝑥𝑖𝑚𝑢𝑚 − 𝑀𝑖𝑛𝑖𝑚𝑢𝑚
Median  Middelste getal.
Mode  Meest voorkomend getal.
Geomatric mean  De wortel van het product van de n aantal termen.
k% trimmed mean  Gemiddelde waar k% van de hoogste en laagste waarnemingen wordt
weggelaten.

,Numerieke data (dispersion):
1
Variance  𝑠 2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑛−1
Standard deviation  𝑠 = √𝑠 2
Interquartile range  𝐼𝑄𝑅 = 𝑄3 − 𝑄1
𝑠
Coefficient of variation  𝐶𝑉 = 𝑥̅

1
Standard deviation data as sample  √𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
1
Standard deviation population as sample  √𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2

Numerieke data (shape):
Skewness  Meetstaaf die de asymmetrie berekend.
1 x −x̅
Formule voor het berekenen van de skewness  𝑀3 ≈ 𝑛 ∑𝑛𝑖=1 ( is )3
x




Kurtosis  Meetstaaf die de mate van vlakte berekend
1 x −x̅
Formule voor het berekenen van de kurtosis  𝑀4 ≈ 𝑛 ∑𝑛𝑖=1 ( is )4 − 3
x




Verschillende datatypes:
- Twee numerieke data vectoren  Scatterplot, correlatie analyse.
- Eén numerieke data vector en één categoriale data vector.
- Twee categoriale data vectoren.

Samenvatting hangt af van verschillende factoren:
- Aard van de variabelen  numerical vs categorical, numerical: dicrete vs continuous
of categorical: binary or not.
- Aantal variabelen  Univariate, bivariate of multivariate.
- Range van de data/aantal categorieën.
- Niveau van detail en nauwkeurigheid.
- Publiek.

Risico van het samenvatten van data is dat je informatie kan verliezen.

,  Basic probability

Data as a random sample  Gegevens worden willekeurig uit de populatie verkregen.

1
Coin: 𝑃(ℎ𝑒𝑎𝑑𝑠) = 2
1
Die: 𝑃(𝑜𝑢𝑡𝑐𝑜𝑚𝑒 = 3) = 6

Types kansverdeling:

- Classical theory  Wat is de kans dat ik vijf gooi met een dobbelsteen?
- Empirical  Zelf onderzoek doen naar de kans van een bepaalde gebeurtenis aan de
hand van observaties.
- Subjective  Wat is de kans dat Nederland wereldkampioen wordt?

𝑃(𝐴) Kans op specifieke gebeurtenis A.
𝑃(𝐵) Kans op specifieke gebeurtenis B.

𝑃(𝐴⋃𝐵)  A of B of allebei.
𝑃(𝐴 ∩ 𝐵) Zowel A als B.

𝑃(𝐴′ ) = 1 − 𝑃(𝐴)  Complement van A.
𝑃(𝐵 ′ ) = 1 − 𝑃(𝐵)  Complement van B.

𝑃(𝐴⋃𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴∩𝐵)
𝑃(𝐴|𝐵) = 𝑃(𝐵)

Onafhankelijkheid test:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)

 Discrete distributions

0 < 𝑃(𝑥𝑖 ) < 1
∑𝑛𝑖=1 𝑃(𝑥𝑖 ) = 1

Notatie: 𝑃(𝑋 = 𝑥𝑖 ) 𝑜𝑟 𝑃𝑥 (𝑥𝑖 ) 𝑜𝑟 𝑃(𝑥𝑖 )

Naam van de variabele Mogelijke uitkomst

Cumulative distribution function: 𝐹𝑥 (𝑥) = 𝑃(𝑋 < 𝑥) = 𝐹(𝑥) = ∑𝑥𝑘=−∞ 𝑃(𝑋 = 𝑘)
Experiment met het gooien van een dobbelsteen:
1 1
𝑃(𝑋 = 2) = 6 𝑒𝑛 𝐹𝑥 (2) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 1) = 3

Expected value: 𝐸(𝑋) = ∑𝑛𝑖=1 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖 )

,Bernoulli distribution:

Er is of succes of er is geen succes. Succes wordt genoteerd als 𝑃(𝑋 = 1) en geen succes
wordt genoteerd als 𝑃(𝑋 = 0).
X is aantal keren succes binnen een experiment. De kans van dat succes wordt bij de
Bernoulli distribution genoteerd als 𝜋 (0 < 𝜋 < 1).
𝑃(𝑋 = 1) = 𝜋
𝑃(𝑋 = 0) = 1 − 𝜋
𝑿~𝑩𝒆𝒓𝒏𝒐𝒖𝒍𝒍𝒊(𝝅)  Bernoulli distribution met parameter 𝜋.
𝑬(𝑿) = 𝜋
𝑽𝒂𝒓(𝑿) = 𝜋(1 − 𝜋)
𝝈𝒙 = √𝜋(1 − 𝜋)
𝜋 𝑖𝑓 𝑥 = 1
𝑷𝑫𝑭: 𝑃(𝑥; 𝜋) = {
1−𝜋 𝑖𝑓 𝑥 = 0

Binomial distribution:

Y is aantal keren succes. De kans van dat succes wordt bij de Bionomial distribution
genoteerd als 𝜋 (0 < 𝜋 < 1).
𝑿~𝑩𝒊𝒏𝒐𝒎𝒊𝒂𝒍(𝒏, 𝝅)  Binomial distribution met parameters n en 𝜋.
𝑬(𝑿) = 𝑛𝜋
𝑽𝒂𝒓(𝑿) = 𝑛𝜋(1 − 𝜋)
𝝈𝒙 = √𝑛𝜋(1 − 𝜋)
𝑷𝑫𝑭: 𝑃(𝑥; 𝑛; 𝜋) = (𝑛𝑥) ∗ 𝜋 𝑥 (1 − 𝜋)𝑛−𝑥
𝑪𝑫𝑭: 𝐹(𝑥; 𝑛; 𝜋) = ∑𝑥𝑘=0 𝑃(𝑥; 𝑛; 𝜋)

Voorbeeld:

𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(8,0.5)  Gebruik van formule.
𝑃(𝑋 = 3) = (82) ∗ 0,53 ∗ 0,55 = 0,2188
𝑃(𝑋 < 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 0,3634

𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(8,0.5)  Gebruik
van tabel
𝑃(𝑋 = 3) = 0,2188
𝑃(𝑋 < 3) = 0,0039 + 0,0313 +
0,1094 + 0,2188 = 0,3634

𝑃(𝑋 < 𝑥) = 𝑃(𝑋 < 𝑥 − 1)
𝑃(𝑋 > 𝑥) = 1 − 𝑃(𝑋 < 𝑥)
𝑃(𝑋 > 𝑥) = 1 − 𝑃(𝑋 < 𝑥 − 1)
𝑃(𝑥 < 𝑋 < 𝑦) = 𝑃(𝑋 < 𝑦) − 𝑃(𝑋 < 𝑥)

,Poisson distribution:

X is aantal gebeurtenissen in een tijd interval.
Eén parameter λ  gemiddeld aantal gebeurtenissen tijdens een bepaald interval.
Als n > 20 is en 𝜋 ≤ 0,05  Gebruik Poisson verdeling.
𝑿~𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝝀)  Poisson distribution met parameter λ.
𝑬(𝑿) = 𝜆
𝑽𝒂𝒓(𝑿) = 𝜆
𝜆𝑥 𝑒 −𝜆
𝑷𝑫𝑭: 𝑃(𝑋 = 𝑥; 𝜆) = 𝑥!
𝑥 𝜆𝑘 𝑒 −𝜆
𝑪𝑫𝑭: 𝐹(𝑥; 𝜆) = ∑𝑘=0 𝑃(𝑘; 𝜆) = ∑𝑥𝑘=0 𝑘!

,Hypergeometric distribution:

De hypergeometric distribution is erg vergelijkbaar met de binomial distribution. Alleen is er
bij deze verdeling sprake van zonder terugleggen.
𝑛
𝑁
≤ 0,05  Dan is deze verdeling OK.
𝑿~𝑯𝒚𝒑(𝒏, 𝑺, 𝑵)  Hypergeometric distribution met parameters n, S en N.
𝑬(𝑿) = 𝑛𝜋
𝑁−𝑛
𝑽𝒂𝒓(𝑿) = 𝑛𝜋(1 − 𝜋) 𝑁−1
(𝑆 𝑁−𝑆
𝑥)( 𝑛−𝑥 )
𝑷𝑫𝑭: 𝑃(𝑋 = 𝑥) =
(𝑁
𝑛)

, Transformatieregels gemiddelde:

𝐸(𝑘 + 𝑋) = 𝑘 + 𝐸(𝑋)
𝐸(𝑎𝑋) = 𝑎 ∗ 𝐸(𝑋)
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)

Transformatieregels varianties:

𝑉𝑎𝑟(𝑘 + 𝑋) = 𝑉𝑎𝑟(𝑋)
𝑉𝑎𝑟(𝑎𝑋) = 𝑎2 ∗ 𝑉𝑎𝑟(𝑋)
𝑉𝑎𝑟(𝑋 + 𝑌) = 𝑉𝑎𝑟(𝑋) + 𝑉𝑎𝑟(𝑌) + 2 𝐶𝑂𝑉(𝑋, 𝑌)

 Continuous distributions

𝐏𝐃𝐅: f(x)
𝑥
𝐂𝐃𝐅: F(X) = P(X < 𝑥) = ∫−∞ 𝑓(𝑦)𝑑𝑦

𝑬(𝑿) = 𝜇𝑥 = ∫−∞ 𝑥𝑓(𝑥)𝑑𝑥

𝑽𝒂𝒓(𝒙) = ∫−∞(𝑥 − 𝜇)2 𝑓(𝑥)𝑑𝑥
F(−∞) = 0 en F(∞) = 1
𝑏
𝑃(𝑎 < 𝑋 < 𝑏) = ∫𝑎 𝑓(𝑥)𝑑𝑥  Oppervlakte tussen a en b.

Uniform continuous distribution:

1
𝑷𝑫𝑭: 𝑓(𝑥; 𝑎; 𝑏) = (𝑥 ∈ [𝑎, 𝑏])
𝑏−𝑎
𝑥−𝑎
𝑪𝑫𝑭: 𝐹(𝑋) = 𝑥−𝑏
𝑎+𝑏
𝑬(𝑿) = 𝜇 = 2
(𝑏−𝑎)2
𝑽𝒂𝒓(𝑿) = 12
€5,49
Krijg toegang tot het volledige document:
Gekocht door 79 studenten

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Beoordelingen van geverifieerde kopers

7 van 9 beoordelingen worden weergegeven
3 jaar geleden

5 jaar geleden

5 jaar geleden

6 jaar geleden

6 jaar geleden

7 jaar geleden

7 jaar geleden

3,6

9 beoordelingen

5
1
4
4
3
3
2
1
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
joeyyvdB123 Vrije Universiteit Amsterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
399
Lid sinds
9 jaar
Aantal volgers
320
Documenten
4
Laatst verkocht
2 maanden geleden

3,7

67 beoordelingen

5
16
4
26
3
19
2
3
1
3

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen