Escrito por estudiantes que aprobaron Inmediatamente disponible después del pago Leer en línea o como PDF ¿Documento equivocado? Cámbialo gratis 4,6 TrustPilot
logo-home
Resumen

Samenvatting - Statistiek 1

Puntuación
-
Vendido
1
Páginas
11
Subido en
01-04-2025
Escrito en
2023/2024

In deze samenvatting zijn alle onderwerpen opgenomen voor de basiskennis van statistiek. Hierop zijn de volgende onderwerpen van toepassing: Meetniveaus, centrummaten en spreiding; Datavisualisatie en kansrekening; Normaal-verdeling en inferentie; Inferentie voor proporties; Inferentie voor kruistabellen; Inferentie voor numerieke data (gemiddelden vergelijken) en; Inferentie voor numerieke data (statistische power & ANOVA).

Mostrar más Leer menos
Institución
Grado

Vista previa del contenido

Meetniveaus, centrummaten, spreiding

Meetniveaus
Variabele = iets dat gemeten kan worden en verschilt tussen entiteiten of momenten. Hierbij
onderscheid te maken tussen onafhankelijke en onafhankelijke variabele. O heeft impact op A.
Meerdere niveaus van de variabele (wat voor soort variabele):
- Nominaal (categoriaal); verschillende categorieën, geen volgorde (zoals religie, land of
con icttype)
- Ordinaal (categoriaal); volgorde (zoals frequentie bezoek)
- Interval-ratio (numeriek); de afstand tussen opties heeft betekenis (zoals inkomen, leeftijd, links-
rechtspositie of aantal internationale con icten)

Variabelen in de kolommen, casussen in de rijen. Elke cel is dan de waarde van een variabele.

Scheefheid (Skewness) = variabele is niet symmetrisch verdeeld. Staart rechts noemen we rechts
scheef en staart rechts noemen we links scheef.

Centrummaten
Manier van het samenvatten van frequentieverdeling. De centrummaten corresponderen met het
meetniveau dat je hebt. Bij nominaal kun je de modus uitrekenen, bij ordinaal de modus en de
mediaan, bij interval-ratio de modus, de mediaan en het gemiddelde.
- Modus = de meest frequente waarde
- Mediaan = de middelste waarde, ook wel de ‘doorsnee’ waarde genoemd. Bij oneven aantal
getallen makkelijk aan te wijzen. Bij even gemiddelde van de twee middelste waarden nemen.
- Gemiddelde = formule! Hoeft niet uit het hoofd te leren.
Dit kan allemaal uitgerekend worden in R.

Spreidingsmaten
Nominaal heeft geen spreidingsmaat want we kunnen geen ordening aanbrengen, ordinaal heeft
de interkwartiel afstand (inter-quartile range; waarde tussen het eerste en tweede kwartiel) en
interval-ratio heeft variantie of standaardafwijking (variance/standard deviation; maat van de
spreiding van waarden rond het gemiddelde).
Totale afwijking is altijd gelijk aan 0. Niet zo’n nuttige maat voor spreiding. Daarom kwadrateren
we de verschillen: sum of squared errors (sum of squares). Hoe groter de n, hoe groter de sum of
squares. Niet goed te vergelijken. Daarom delen we de sum of squared errors door n-1. De
variantie is de sum of squares gedeeld door n-1.
Hoe groter de standaardafwijking, hoe groter de spreiding rond het gemiddelde. Deze
standaardafwijking is wel afhankelijk van de schaal waarop gemeten is. Je kunt dus niet zomaar
standaardafwijking vergelijken tussen verschillende variabelen.

Datavisualisatie & Kansrekening

Bij datavisualisatie kan er gebruik worden gemaakt van gra eken en/of tabellen.

Veelgebruikte gra eken (code van toepassen in R te vinden in de sheets)
- Puntenwolk (scatterplot) -> duidelijker/beter te maken, te splitsen in types (landen), van label
(landennamen) te voorzien.
- Dot plot
- Histogram
- Boxplot
- Staafdiagram -> te gebruiken voor tellingen, maar ook voor samenvattende statistiek (zoals
groepsgemiddelden). Te onderscheiden in gestapelde staafdiagram (stacked bar plot), staven
naast elkaar of groepsgemiddelden (gemiddelden i.p.v. aantallen op de y-as).

Tabellen
- Frequentietabel
- Kruistabel -> richtlijnen aanwezig, zoals ‘onafhankelijke variabele in kolommen en afhankelijke
variabele in rijen’, etc.




fl fi fl fi

, Kans (op een uitkomst) = het gedeelte van de keren dat deze uitkomst voorkomt als we het
toevallige (stochastische) proces een oneindig aantal keer zouden observeren.
We spreken van uitkomsten (outcomes) en gebeurtenissen (events). Een set van uitkomsten is een
gebeurtenis.
Disjuncte gebeurtenissen (disjoint event) = kansen zijn op te tellen (zoals kans van 1 of 2 gooien
met dobbelsteen), wat volgt uit de somregel (addition rule).
Niet-disjuncte gebeurtenissen = kansen zijn niet op te tellen (zoals kans op vrouw als minister),
wat volgt uit de algemene somregel.

Algemene somregel: P(A of B) = P(A) + P(B) - P(A en B)

Kansverdeling omvat alle disjuncte uitkomsten en bijbehorende kansen. Drie bijbehorende regels:
1. De uitkomsten moeten disjunct zijn
2. Elke kans moet tussen de 0 en de 1 liggen
3. De kansen moeten optellen tot 1

Twee processen zijn onafhankelijk als de uitkomst van de ene geen informatie geeft over de
uitkomst van de andere. Bijvoorbeeld: twee dobbelstenen gooien. Voor de onafhankelijke
processen geldt de productregel: P(A en B) = P(A) * P(B)

Simultane kans (joint possibility) = de kans op uitkomsten voor twee of meer variabelen.
Conditionele kans = kijkt naar de kans op een bepaalde uitkomst A gegeven de conditie B.

Als A en B twee uitkomsten/gebeurtenissen representeren geldt de algemene productregel: P(A
en B) = P(A|B) * P(B) -> #de streep moet je zien als een breuk!

Belangrijk te onthouden over werken met kansen:
1. Wat is nou een kans/kansverdeling?
2. Disjuncte kansen/gebeurtenissen (die niet tegelijkertijd plaats kunnen vinden)
3. Proces (onafhankelijk)

Boomdiagram (Tree diagram) geeft inzicht in conditionele kansen.

Twee disjuncte gebeurtenissen kunnen niet tegelijkertijd plaatsvinden, twee onafhankelijke
processen wel.

Normaal-verdeling & Inleiding Inferentie

Een kansverdeling visualiseren, Van kansen naar verdelingen: discrete verdeling/uniforme
verdeling (kans op elke uitkomst is even groot). We kunnen aantal gooide ogen een stochastische
variabele noemen.
Verwachte waarde
Wanneer er voldoende grote aantallen zijn, kun je dit soort discrete verdelingen benaderen met
een continue verdeling, zoals de normaalverdeling. Hiervan weten we goed hoe die eruit ziet, wat
een voordeel is.
Een normaalverdeling heeft twee parameters: een gemiddelde (mu) en een standaardafwijking
(sigma). Het gemiddelde, de mediaan en de modus zijn aan elkaar gelijk -> als perfect
symmetrisch. De standaardafwijking zegt iets over de spreiding/de schaal waarop je hem plot.
De standaard normaalverdeling heeft een mean van 0 en een sd van 1.
Met standaardiseren passen we de schaal aan. Dit doen we door de Z-score uit te rekenen.
Z = (x-mu) / sigma. En Z-score van 1 houdt 1 standaardafwijking boven het gemiddelde in.
Oppervlakte onder de curve berekenen: via tabel of statistische software. We moeten beide
kunnen!

Bij standaard normaalverdeling valt 95% binnen 1,96 keer de standaardafwijking. Dat is een
gegeven waarvan we gebruik maken om het betrouwbaarheidsinterval te berekenen. Dus: 95%
van de waarden ligt tussen -1,96 en +1,96 standaardafwijkingen bij een (standaard)
normaalverdeling.

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
1 de abril de 2025
Número de páginas
11
Escrito en
2023/2024
Tipo
RESUMEN

Temas

$6.53
Accede al documento completo:

¿Documento equivocado? Cámbialo gratis Dentro de los 14 días posteriores a la compra y antes de descargarlo, puedes elegir otro documento. Puedes gastar el importe de nuevo.
Escrito por estudiantes que aprobaron
Inmediatamente disponible después del pago
Leer en línea o como PDF

Conoce al vendedor
Seller avatar
svenvanstal

Documento también disponible en un lote

Conoce al vendedor

Seller avatar
svenvanstal Universiteit Leiden
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
6
Miembro desde
11 meses
Número de seguidores
0
Documentos
6
Última venta
2 días hace

0.0

0 reseñas

5
0
4
0
3
0
2
0
1
0

Documentos populares

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes