100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
College aantekeningen

College aantekeningen MTO-B MAW: Inleiding Statistiek (424503-B-5)

Beoordeling
-
Verkocht
2
Pagina's
149
Geüpload op
04-10-2021
Geschreven in
2020/2021

Alle aantekeningen van de hoorcolleges van MTO-B. Dit vak afgerond met een 8,5. Staan veel screenshots in.












Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
4 oktober 2021
Aantal pagina's
149
Geschreven in
2020/2021
Type
College aantekeningen
Docent(en)
-
Bevat
Alle colleges

Voorbeeld van de inhoud

Hoorcollege 1 - MTO – B

Correlatie is niet hetzelfde als causatie

- Beschrijvende en inferentiële statistiek
- Typen random variabelen
- Frequentie en kansverdelingen
- Centrummaten en spreidingsmaten

Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken,
interpreteren en presenteren van gegevens

Statistiek in de empirische cyclus (dit herhaalt zich steeds): observatie → inductie → deductie
→ toetsing → evaluatie → en dan weer observatie

Beschrijvende statistiek
➢ Gebruik: kwantitatieve samenvatting van informatie/data
➢ Relevante jargon: summary statistics, gemiddelde, mediaan, modus, variantie,
standaarddeviatie, covariantie, frequentieverdeling, histogram etc.

Inferentiële statistiek
➢ Gebruik: maak inductieve inferenties van data (een steekproef) naar een meer
algemene situatie (de populatie)
➢ Relevante jargon: sampling error, standaardfout, schatten, confidence intervals,
margin of error, hypothese toetsing, etc.
➢ Maak je uitspraken over iets, bijvoorbeeld toetsingen, steekproeven, hypothese,
toetsing etc.

Je neemt dus uit de populatie een steekproef (MTO A), vervolgens breng je steekproef terug
naar de populatie (MTO B/inferentiële statistiek)

Data: random variabelen (X)
➢ Variabelen waarvan de mogelijke uitkomsten het resultaat zijn van een random
fenomeen
➢ Statistische notatie meestal X of Y
➢ Specifieke uitkomsten en specifieke observaties worden opgeschreven met een kleine
x of y
➢ Leeftijd kan dan bv X zijn en dan x4 → de 4de persoon is bijv. 23 dus x4 is dan 23

Kwantificeren van random variabelen
➢ Cijfers toekennen aan elke mogelijke variabele in spss, man 0,vrouw 1
➢ Het meetniveau van een variabele bepaalt wat voor betekenis de nummers die we
toewijzen hebben: 4 niveaus: nominaal, ordinaal, interval, ratio
➢ De niveaus zijn cumulatief – elk level heeft de eigenschappen van de vorige levels
➢ Het meetniveau van een random variabele bepaalt wat voor analyses je er beter
wel/niet op kan uitvoeren

Meetniveaus van random variabelen:
1. Nominale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten

, ➢ Voorbeelden: geslacht (man/vrouw), nationaliteit (Nederlands, Duits etc.), teamnaam
2. Ordinale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ Voorbeelden: dosering (laag, medium, hoog), rangen (1e plaats, 2e plaats etc.), Likert
schalen (zeer oneens, oneens, neutraal etc.), leeftijdscategorieën (9-13,14-18)
3. Interval variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Voorbeelden: temperatuur in graden Celsius, Fahrenheit, jaartallen
4. Ratio → bij 0 stopt het
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Absoluut nulpunt, een nul betekent dat de gemeten eigenschap afwezig is
➢ Voorbeelden: dosering in milligram (0,1 etc.), lengte in cm (0 betekent geen lengte),
temperatuur in Kelvin → 0 is ook geen temperatuur

In de sociale wetenschap: een ordinale variabelen met meer dan 5 uitkomstcategorieën wordt
vaak ook als interval gezien of in ieder geval zo behandeld.

Afstanden hetzelfde: interval (graden), niet hetzelfde: ordinaal (zeer oneens, eens, zeer eens)

Lengte meten met een meetlint van de grond (ratio → want je kan niet kleiner zijn dan de
grond/0) en lengte meten vanaf 1m van de muur met een streepje (interval → mensen kunnen
kleiner zijn dan 1m dus kan onder dat 0 punt komen)

Discrete vs. continue random variabelen
➢ Het type variabele bepaalt wat voor analyses we er beter wel/niet op uit kunnen voeren
➢ Discrete variabele → de mogelijke uitkomsten voor de variabelen zijn te vangen in
een eindige, telbare lijst van waarden – Let op! Als de gemeten score discreet is, hoeft
de onderliggende variabele dat niet te zijn (bv. leeftijd afgerond op hele jaren)
Voorbeelden: aantal kinderen per gezin, dosering categorieën (laag, medium,
hoog), sekse (man/vrouw), beroepsgroep (docent, advocaat, tandarts)
➢ Continue variabele → de mogelijke uitkomsten van de variabele kunnen elke waarde
aannemen binnen een bepaald interval (dat interval zou kunnen lopen van -oneindig
tot oneindig)
Alle waardes zijn mogelijk, bv. ook bij temperatuur (zonder afronding)
Voorbeelden: leeftijd (niet afgerond), hoeveelheid gedronken alcohol in ml,
dosering in grammen, lengte, sekse schalen (van vrouwelijk tot mannelijk)
Denk bij discreet aan staven bij staafgrafiek en bij continu aan een vloeiende lijn/parabool

Continue variabelen hebben over het algemeen interval/ratio niveaus. Interval/ ratio
variabelen zijn niet per se continu.
Nominale/ordinale variabelen zijn over het algemeen discreet. Discrete variabelen zijn niet
per se nominaal/ordinaal.

,Mogelijke tentamenvraag:
Een ziekenhuis is geïnteresseerd in het gezinsleven en de leef-werkbalans van hun
medewerkers en zet daarom en survey uit. Aan elke werknemer wordt gevraagd hoeveel
kinderen zij hebben.
Stelling: De resulterende variabele, namelijk het aantal kinderen voor elke werknemer, is een
discrete variabele met een ratio meetniveau.
A. Juist OF B. Onjuist
→ discreet omdat het duidelijk is dat het 1 of 2 etc. kind is en geen half kind, het is een ratio
meetniveau omdat je alle 4 de voorwaarden kunt toepassen, ruimte is even groot en 0 betekent
ook echt 0 en kan hier niet onder zitten.

Frequentieverdelingen en kansverdelingen
- Frequentie (van de uitkomsten van een random variabele) → hoe vaak een bepaalde
uitkomst is geobserveerd
- Frequentieverdelingen → een tabel of grafiek die weergeeft hoe vaak een bepaalde uitkomst
is geobserveerd, voor elke mogelijke uitkomst voor die variabele
- Kansverdelingen → de relatieve frequentie van de uitkomst, hoe vaak de uitkomst voorkomt
in verhouding tot aantal observaties
Kansverdelingen laten de kans zien op elke mogelijke uitkomst voor een random variabelen
Deze kansen moeten altijd optellen tot 1!

Beschrijvende statistiek → centrummaten en spreidingsmaten voor het samenvatten van
variabelen en hun kansverdelingen in een paar getallen
• Centrummaten → beschrijven het centrum/midden van variabelen + modus (wat het
meeste voorkomt), mediaan en gemiddelde
• Spreidingsmaten → beschrijven variatie, spreiding, breedte van variabelen + bereik
(hoogste-laagste), variantie en standaarddeviatie → als je het wil uitrekenen, eerst de
getallen – het gemiddelde doen

Centrummaten:
1. Modus → de uitkomst die het vaakst voorkomt, d.w.z., de uitkomst met de hoogste
frequentie → dus bv. cijfers: 7,6,8,7 dan is de modus 7
2. Mediaan → de waarde die de hoogste helft van de data scheidt van de laagste helft van de
data, 50% van de data ligt boven deze waarde, en 50% ligt onder deze waarde → dus bv. stel
je hebt de volgende cijfers: 7,7,6,8,9 → start met ordenen: 6,7,7,8,9 → de mediaan is dan de
middelste waarde → 7 dus → MAAR bij een even aantal cijfers kijk je naar de twee
middelste cijfers en daar het gemiddelde van dus stel je voor 7 en 8 → dan 7,5
3. Gemiddelde → stel je hebt deze cijfers: 7,7,8,6,9 → dan deze bij elkaar optellen en delen
door het aantal cijfers dus delen door 5 → dit geeft 7,4
Op hun manier: tel alle observaties voor variabele X op (neem de som van X) dan bepaal het
totale aantal observaties, we noemen dat getal N of n en vervolgens delen we de som uit stap
1 door het totale aantal observaties van stap 2 → notatie µ voor het gemiddelde van een
populatie → hoort nog moeilijke formules bij

Op welke manier geeft het gemiddelde het centrum of het midden van onze verdeling aan?
- De som van de deviaties (afwijkingen van: X-µ) tussen de observaties en het gemiddelde is
altijd 0
- D.w.z., de totale afstand tussen de observaties hoger dan het gemiddelde, en de totale
afstand tussen de observaties lager dan het gemiddelde zijn precies even groot

, DUS: je kijkt voor elke X bv. 6,7,7,8,9 dan haal je van deze getallen steeds het gemiddelde af
dus 6-7,4 enz. al deze getallen die hier uitkomen heffen elkaar op en uitkomst: 0
Daarom is gemiddelde het meest betekenisvol voor interval/ratio variabelen want
hierbij zijn de afstanden even groot waardoor je beter conclusies kunt trekken over
gemiddelde

Spreidingsmaten:
1. Bereik → het verschil tussen de laagste en hoogste waarde van de variabele dus weer bij
diezelfde cijfers → 9-6 = 3
2. Variantie → hoe ver zijn de observaties, gemiddeld genomen, van het centrum van de
verdeling (het gemiddelde) → definitie variantie: de gemiddelde gekwadrateerde afwijking
(deviatie) van het gemiddelde
1. Voor elke observatie bereken je de afwijking (deviatie) van het gemiddelde → dus
weer het cijfer – het gemiddelde
2. Kwadrateer alle deviaties die je in stap 1 hebt berekend
3. Neem de som van alle gekwadrateerde deviaties uit stap 2 → dus alles optellen
4. Bepaal het totaal aantal observaties, we noemen dat aantal N of n
5. Deel de som van de gekwadrateerde deviaties door het totaal aantal observaties (N)
3. Standaarddeviatie → de wortel van de variantie. Handig om te hebben omdat het
uitgedrukt wordt in dezelfde eenheden als de observaties, i.p.v. die kwadraten in de variantie
1. Bereken de variantie
2. Neem de wortel van de variantie

Variantie en standaarddeviatie voor de populatie vs. een steekproef (zijn dus verschillend)
Populatie → a en steekproef → s (en bij het delen niet door N maar door N-1) dus komen
verschillende antwoorden uit. Steekproef dus delen door n-1

Mogelijke tentamenvraag:
Rechts zie je een grafiek van een perfect symmetrische kansverdeling, voor deze verdeling
geldt dat: (een vloeiende curve)
A. De modus, mediaan en gemiddelde allemaal dezelfde waarde hebben in het midden
van deze verdeling
B. De modus ligt in het midden van de verdeling, maar de mediaan en gemiddelde zouden
meer rechts of links kunnen liggen
C. De modus en mediaan liggen in het midden van de verdeling, maar het gemiddelde zou
meer links of meer rechts kunnen liggen
D. We hebben niet genoeg informatie om iets te kunnen zeggen over de modus, mediaan of
het gemiddelde

Hoorcollege 2 – MTO – B
Aantekeningen online
Kansen staan op de y-as
Uitkomsten staan op de x-as

Kans → de relatieve frequentie van de uitkomst → weergegeven met p (x=uitkomst) dus bv.
p(auto=groot) of P(groot)
Kansverdeling → laten de kans zien op elke mogelijke uitkomst voor een random variabele,
moeten altijd optellen tot 1
Voor mutueel exclusieve gebeurtenissen A en B reken je P;(A) + P(B)

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
zaravss Tilburg University
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
80
Lid sinds
5 jaar
Aantal volgers
58
Documenten
29
Laatst verkocht
9 maanden geleden

2,3

4 beoordelingen

5
0
4
1
3
1
2
0
1
2

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen