100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4.2 TrustPilot
logo-home
Notas de lectura

College aantekeningen MTO-B MAW: Inleiding Statistiek (424503-B-5)

Puntuación
-
Vendido
2
Páginas
149
Subido en
04-10-2021
Escrito en
2020/2021

Alle aantekeningen van de hoorcolleges van MTO-B. Dit vak afgerond met een 8,5. Staan veel screenshots in.

Institución
Grado











Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
4 de octubre de 2021
Número de páginas
149
Escrito en
2020/2021
Tipo
Notas de lectura
Profesor(es)
-
Contiene
Todas las clases

Temas

Vista previa del contenido

Hoorcollege 1 - MTO – B

Correlatie is niet hetzelfde als causatie

- Beschrijvende en inferentiële statistiek
- Typen random variabelen
- Frequentie en kansverdelingen
- Centrummaten en spreidingsmaten

Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken,
interpreteren en presenteren van gegevens

Statistiek in de empirische cyclus (dit herhaalt zich steeds): observatie → inductie → deductie
→ toetsing → evaluatie → en dan weer observatie

Beschrijvende statistiek
➢ Gebruik: kwantitatieve samenvatting van informatie/data
➢ Relevante jargon: summary statistics, gemiddelde, mediaan, modus, variantie,
standaarddeviatie, covariantie, frequentieverdeling, histogram etc.

Inferentiële statistiek
➢ Gebruik: maak inductieve inferenties van data (een steekproef) naar een meer
algemene situatie (de populatie)
➢ Relevante jargon: sampling error, standaardfout, schatten, confidence intervals,
margin of error, hypothese toetsing, etc.
➢ Maak je uitspraken over iets, bijvoorbeeld toetsingen, steekproeven, hypothese,
toetsing etc.

Je neemt dus uit de populatie een steekproef (MTO A), vervolgens breng je steekproef terug
naar de populatie (MTO B/inferentiële statistiek)

Data: random variabelen (X)
➢ Variabelen waarvan de mogelijke uitkomsten het resultaat zijn van een random
fenomeen
➢ Statistische notatie meestal X of Y
➢ Specifieke uitkomsten en specifieke observaties worden opgeschreven met een kleine
x of y
➢ Leeftijd kan dan bv X zijn en dan x4 → de 4de persoon is bijv. 23 dus x4 is dan 23

Kwantificeren van random variabelen
➢ Cijfers toekennen aan elke mogelijke variabele in spss, man 0,vrouw 1
➢ Het meetniveau van een variabele bepaalt wat voor betekenis de nummers die we
toewijzen hebben: 4 niveaus: nominaal, ordinaal, interval, ratio
➢ De niveaus zijn cumulatief – elk level heeft de eigenschappen van de vorige levels
➢ Het meetniveau van een random variabele bepaalt wat voor analyses je er beter
wel/niet op kan uitvoeren

Meetniveaus van random variabelen:
1. Nominale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten

, ➢ Voorbeelden: geslacht (man/vrouw), nationaliteit (Nederlands, Duits etc.), teamnaam
2. Ordinale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ Voorbeelden: dosering (laag, medium, hoog), rangen (1e plaats, 2e plaats etc.), Likert
schalen (zeer oneens, oneens, neutraal etc.), leeftijdscategorieën (9-13,14-18)
3. Interval variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Voorbeelden: temperatuur in graden Celsius, Fahrenheit, jaartallen
4. Ratio → bij 0 stopt het
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Absoluut nulpunt, een nul betekent dat de gemeten eigenschap afwezig is
➢ Voorbeelden: dosering in milligram (0,1 etc.), lengte in cm (0 betekent geen lengte),
temperatuur in Kelvin → 0 is ook geen temperatuur

In de sociale wetenschap: een ordinale variabelen met meer dan 5 uitkomstcategorieën wordt
vaak ook als interval gezien of in ieder geval zo behandeld.

Afstanden hetzelfde: interval (graden), niet hetzelfde: ordinaal (zeer oneens, eens, zeer eens)

Lengte meten met een meetlint van de grond (ratio → want je kan niet kleiner zijn dan de
grond/0) en lengte meten vanaf 1m van de muur met een streepje (interval → mensen kunnen
kleiner zijn dan 1m dus kan onder dat 0 punt komen)

Discrete vs. continue random variabelen
➢ Het type variabele bepaalt wat voor analyses we er beter wel/niet op uit kunnen voeren
➢ Discrete variabele → de mogelijke uitkomsten voor de variabelen zijn te vangen in
een eindige, telbare lijst van waarden – Let op! Als de gemeten score discreet is, hoeft
de onderliggende variabele dat niet te zijn (bv. leeftijd afgerond op hele jaren)
Voorbeelden: aantal kinderen per gezin, dosering categorieën (laag, medium,
hoog), sekse (man/vrouw), beroepsgroep (docent, advocaat, tandarts)
➢ Continue variabele → de mogelijke uitkomsten van de variabele kunnen elke waarde
aannemen binnen een bepaald interval (dat interval zou kunnen lopen van -oneindig
tot oneindig)
Alle waardes zijn mogelijk, bv. ook bij temperatuur (zonder afronding)
Voorbeelden: leeftijd (niet afgerond), hoeveelheid gedronken alcohol in ml,
dosering in grammen, lengte, sekse schalen (van vrouwelijk tot mannelijk)
Denk bij discreet aan staven bij staafgrafiek en bij continu aan een vloeiende lijn/parabool

Continue variabelen hebben over het algemeen interval/ratio niveaus. Interval/ ratio
variabelen zijn niet per se continu.
Nominale/ordinale variabelen zijn over het algemeen discreet. Discrete variabelen zijn niet
per se nominaal/ordinaal.

,Mogelijke tentamenvraag:
Een ziekenhuis is geïnteresseerd in het gezinsleven en de leef-werkbalans van hun
medewerkers en zet daarom en survey uit. Aan elke werknemer wordt gevraagd hoeveel
kinderen zij hebben.
Stelling: De resulterende variabele, namelijk het aantal kinderen voor elke werknemer, is een
discrete variabele met een ratio meetniveau.
A. Juist OF B. Onjuist
→ discreet omdat het duidelijk is dat het 1 of 2 etc. kind is en geen half kind, het is een ratio
meetniveau omdat je alle 4 de voorwaarden kunt toepassen, ruimte is even groot en 0 betekent
ook echt 0 en kan hier niet onder zitten.

Frequentieverdelingen en kansverdelingen
- Frequentie (van de uitkomsten van een random variabele) → hoe vaak een bepaalde
uitkomst is geobserveerd
- Frequentieverdelingen → een tabel of grafiek die weergeeft hoe vaak een bepaalde uitkomst
is geobserveerd, voor elke mogelijke uitkomst voor die variabele
- Kansverdelingen → de relatieve frequentie van de uitkomst, hoe vaak de uitkomst voorkomt
in verhouding tot aantal observaties
Kansverdelingen laten de kans zien op elke mogelijke uitkomst voor een random variabelen
Deze kansen moeten altijd optellen tot 1!

Beschrijvende statistiek → centrummaten en spreidingsmaten voor het samenvatten van
variabelen en hun kansverdelingen in een paar getallen
• Centrummaten → beschrijven het centrum/midden van variabelen + modus (wat het
meeste voorkomt), mediaan en gemiddelde
• Spreidingsmaten → beschrijven variatie, spreiding, breedte van variabelen + bereik
(hoogste-laagste), variantie en standaarddeviatie → als je het wil uitrekenen, eerst de
getallen – het gemiddelde doen

Centrummaten:
1. Modus → de uitkomst die het vaakst voorkomt, d.w.z., de uitkomst met de hoogste
frequentie → dus bv. cijfers: 7,6,8,7 dan is de modus 7
2. Mediaan → de waarde die de hoogste helft van de data scheidt van de laagste helft van de
data, 50% van de data ligt boven deze waarde, en 50% ligt onder deze waarde → dus bv. stel
je hebt de volgende cijfers: 7,7,6,8,9 → start met ordenen: 6,7,7,8,9 → de mediaan is dan de
middelste waarde → 7 dus → MAAR bij een even aantal cijfers kijk je naar de twee
middelste cijfers en daar het gemiddelde van dus stel je voor 7 en 8 → dan 7,5
3. Gemiddelde → stel je hebt deze cijfers: 7,7,8,6,9 → dan deze bij elkaar optellen en delen
door het aantal cijfers dus delen door 5 → dit geeft 7,4
Op hun manier: tel alle observaties voor variabele X op (neem de som van X) dan bepaal het
totale aantal observaties, we noemen dat getal N of n en vervolgens delen we de som uit stap
1 door het totale aantal observaties van stap 2 → notatie µ voor het gemiddelde van een
populatie → hoort nog moeilijke formules bij

Op welke manier geeft het gemiddelde het centrum of het midden van onze verdeling aan?
- De som van de deviaties (afwijkingen van: X-µ) tussen de observaties en het gemiddelde is
altijd 0
- D.w.z., de totale afstand tussen de observaties hoger dan het gemiddelde, en de totale
afstand tussen de observaties lager dan het gemiddelde zijn precies even groot

, DUS: je kijkt voor elke X bv. 6,7,7,8,9 dan haal je van deze getallen steeds het gemiddelde af
dus 6-7,4 enz. al deze getallen die hier uitkomen heffen elkaar op en uitkomst: 0
Daarom is gemiddelde het meest betekenisvol voor interval/ratio variabelen want
hierbij zijn de afstanden even groot waardoor je beter conclusies kunt trekken over
gemiddelde

Spreidingsmaten:
1. Bereik → het verschil tussen de laagste en hoogste waarde van de variabele dus weer bij
diezelfde cijfers → 9-6 = 3
2. Variantie → hoe ver zijn de observaties, gemiddeld genomen, van het centrum van de
verdeling (het gemiddelde) → definitie variantie: de gemiddelde gekwadrateerde afwijking
(deviatie) van het gemiddelde
1. Voor elke observatie bereken je de afwijking (deviatie) van het gemiddelde → dus
weer het cijfer – het gemiddelde
2. Kwadrateer alle deviaties die je in stap 1 hebt berekend
3. Neem de som van alle gekwadrateerde deviaties uit stap 2 → dus alles optellen
4. Bepaal het totaal aantal observaties, we noemen dat aantal N of n
5. Deel de som van de gekwadrateerde deviaties door het totaal aantal observaties (N)
3. Standaarddeviatie → de wortel van de variantie. Handig om te hebben omdat het
uitgedrukt wordt in dezelfde eenheden als de observaties, i.p.v. die kwadraten in de variantie
1. Bereken de variantie
2. Neem de wortel van de variantie

Variantie en standaarddeviatie voor de populatie vs. een steekproef (zijn dus verschillend)
Populatie → a en steekproef → s (en bij het delen niet door N maar door N-1) dus komen
verschillende antwoorden uit. Steekproef dus delen door n-1

Mogelijke tentamenvraag:
Rechts zie je een grafiek van een perfect symmetrische kansverdeling, voor deze verdeling
geldt dat: (een vloeiende curve)
A. De modus, mediaan en gemiddelde allemaal dezelfde waarde hebben in het midden
van deze verdeling
B. De modus ligt in het midden van de verdeling, maar de mediaan en gemiddelde zouden
meer rechts of links kunnen liggen
C. De modus en mediaan liggen in het midden van de verdeling, maar het gemiddelde zou
meer links of meer rechts kunnen liggen
D. We hebben niet genoeg informatie om iets te kunnen zeggen over de modus, mediaan of
het gemiddelde

Hoorcollege 2 – MTO – B
Aantekeningen online
Kansen staan op de y-as
Uitkomsten staan op de x-as

Kans → de relatieve frequentie van de uitkomst → weergegeven met p (x=uitkomst) dus bv.
p(auto=groot) of P(groot)
Kansverdeling → laten de kans zien op elke mogelijke uitkomst voor een random variabele,
moeten altijd optellen tot 1
Voor mutueel exclusieve gebeurtenissen A en B reken je P;(A) + P(B)
$7.26
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada


Documento también disponible en un lote

Conoce al vendedor

Seller avatar
Los indicadores de reputación están sujetos a la cantidad de artículos vendidos por una tarifa y las reseñas que ha recibido por esos documentos. Hay tres niveles: Bronce, Plata y Oro. Cuanto mayor reputación, más podrás confiar en la calidad del trabajo del vendedor.
zaravss Tilburg University
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
80
Miembro desde
5 año
Número de seguidores
58
Documentos
29
Última venta
9 meses hace

2.3

4 reseñas

5
0
4
1
3
1
2
0
1
2

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes