100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4.2 TrustPilot
logo-home
Resumen

Samenvatting Beschrijvende en Inferentiële Statistiek – Eindtoets

Puntuación
-
Vendido
-
Páginas
15
Subido en
19-04-2025
Escrito en
2024/2025

Deze samenvatting is een vervolg op de samenvatting van de deeltoets die ik gedeeld heb. Het document behandelt hoe je op verantwoorde wijze uitspraken kunt doen over populaties op basis van steekproeven, met behulp van betrouwbaarheidsintervallen, hypothesetoetsen en regressiemodellen. Het legt nadruk op correcte interpretatie van statistische resultaten en hoe je voorkomt dat je foutieve conclusies trekt. De samenvatting is bedoeld als voorbereiding op de eindtoets van het vak 'Beschrijvende- en Inferentiële statistiek op de VU. Dit was voor mijn premaster. LET OP! De samenvatting is geschreven op basis van SPSS

Mostrar más Leer menos
Institución
Grado









Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
19 de abril de 2025
Número de páginas
15
Escrito en
2024/2025
Tipo
Resumen

Temas

Vista previa del contenido

Samenvatting Beschrijvende en Inferentiële statistiek - Eindtoets


Methoden om data samen te vatten wordt beschrijvende statistiek genoemd. De kenmerken van een
dataset worden samengevat, ofwel de data hier is een beschrijving van de statistische feiten.
Bij inferentiële statistiek daarentegen wordt een hypothese getoetst of bepaal je of je data
generaliseerbaar zijn naar een bredere populatie. Er worden conclusies getrokken, parameters afgeleid,
verbanden gelegd tussen feiten, er wordt betekenis aan de data gegeven en er worden uitspraken gedaan
over deze data over een gehele populatie (doel).
Statistische inferentie = het proces waarbij conclusies worden getrokken over een populatie door
middel van statistische analyses van een steekproef van die populatie. Op basis van
steekproefinformatie worden er conclusies getrokken over de populatie waaruit de steekproef is
getrokken.
Er zijn twee typen statistische inferentie. Er zijn dus twee manieren om het ‘echte’ populatiegemiddelde
(mu) schatten op basis van een steekproef:
1. Schatten van de populatieparameters.
Binnen de statistische inferentie waarbij je de populatieparameters schat zijn er ook 2 manieren
om dat te doen:
a. Puntschatter/point estimate. Het is één getal dat de beste schatting is van de
populatieparameters. Bij de puntschatter wordt er een schatting gedaan van een specifieke
waarde, bijvoorbeeld x-bar.
Dit is een benadering van een populatieparameter (mu of sigma) met een specifieke waarde
uit één steekproef (x-bar of s).
X-bar = mu
b. Intervalschatting. Het is een reeks waarden waarbinnen er verwacht wordt dat de
parameters gaan vallen.
Er wordt een betrouwbaarheidsinterval (B.I.) gebruikt om een intervalschatting te doen.
Het betrouwbaarheidsinterval van een parameter is een interval van waarden, waarvan we
met een bepaald vertrouwen aannemen dat de ‘ware’ waarde van de populatieparameter
daarbinnen ligt.
Betrouwbaarheidsniveau. De kans dat de populatieparameter (intervalschatting)
daadwerkelijk binnen dat interval ligt. Het betrouwbaarheidsniveau heeft altijd een waarde
rondom/dicht bij 1 (meestal 0,95 → 95% betrouwbaarheidsinterval).
Hoe hoger het betrouwbaarheidsniveau, hoe groter het interval waarschijnlijk is.
2. Hypothesen over deze parameters testen.
Om een betrouwbaarheidsinterval te maken, gebruik je de steekproefverdeling van het gemiddelde.
Betrouwbaarheidsinterval berekenen:
1. Neem de puntschatting (x-bar)
2. Betrouwbaarheidsniveau bepalen (bijvoorbeeld 95%)
3. Foutmarge berekenen
4. BI = puntschatter +/- foutmarge
Benodigde z-score bij 95% betrouwbaarheidsinterval: zoek in de tabel naar de z-score.
Deel de alpha door 2. Dit wordt gedaan, omdat het verdeeld wordt aan beide kanten van de
normaalverdeling. In de twee staarten zit de 5% verdeeld → dus 2,5% aan de ene kant en 2,5% aan de
andere kant. Kijk in de tabel dan bij de rij van 0,025 en zoek de bijbehorende z-score.
Als je een conclusie trekt kun je (bijvoorbeeld) met 95% zekerheid zeggen dat de werkelijke gemiddelde
koffiepauzetijd in de populatie tussen 5.02 en 6.98 minuten ligt.
Let op! De interpretatie is dus NIET: “95% kans dat de populatieparameter een bepaalde waarde
aanneemt.”

, Samenvatting Beschrijvende en Inferentiële statistiek - Eindtoets


De formule van een 95% betrouwbaarheidsinterval:

• CI = betrouwbaarheidsinterval (confidence interval)
• X-bar = populatiegemiddelde
• Z = de kritieke waarde van de z-verdeling (tabel)
• Sigma = de standaarddeviatie van de populatie
• Wortel n = de vierkantswortel van de populatiegrootte
Er is een probleem met de formule van een 95% betrouwbaarheidsinterval, want de sigma van het
populatiegemiddelde (sigma-x-bar) is vaak onbekend, waardoor de formule niet uitgerekend kan
worden.
De oplossing is door de standaarddeviatie van de populatie te schatten.
De 95% betrouwbaarheidsinterval geeft aan dat het betrouwbaarheidsinterval van een willekeurig
geselecteerde steekproef de populatieparameters omvat, 0,95 is. De waarschijnlijkheid dat het
betrouwbaarheidsinterval het populatiegemiddelde niet omvat is 0,05.
De boven- en ondergrens van het interval zijn de foutmarge (onzekerheidsmarge). De foutmarge vertelt
accuraat hoe het steekproef-
gemiddelde (x-bar) het
populatiegemiddelde (mu)
waarschijnlijk schat. De
foutmarge is de afstand van
‘X’ standaarddeviaties.
Bijvoorbeeld: de foutmarge
is 1% bij de VVD. De puntschatter is 18% en het interval is van 17% tot 19%, dus het heeft een
foutmarge van 1%.
Foutenkans (a=alpha) = kans dat iets niet zo is. bij een betrouwbaarheidsniveau is dat 0,05 dat dat niet
zo is.
Betrouwbaarheidsniveau = 1 – a
T-verdeling = een manier om data te beschrijven die nagenoeg de normale verdeling volgen, maar
waarbij de variantie onbekend is. De t-verdeling houdt rekening met een extra fout.
De staarten van de verdeling kunnen dikker zijn dan die van een normaalverdeling. En een t-verdeling
heeft een grotere standaarddeviatie.
Een t-verdeling bevat een lagere top en hogere staarten dan die van
een normaalverdeling.
Let op outliers bij de t-verdeling.
De vorm van een t-verdeling hangt af van de steekproefgrootte.
Hoe groter de steekproefomvang, hoe meer de distributie op een
normaalverdeling lijkt. En hoe kleiner de steekproefomvang, hoe
lager de top en hoe hoger de staarten van de verdeling worden.
De vorm van een t-verdeling hangt af van de vrijheidsgraden
(degrees of freedom - df).
Formule vrijheidsgraad bij het gemiddelde = n – 1

• Een kleine steekproef heeft meer spreiding
• Grote steekproef → benadert normaalverdeling
• De t-verdling corrigeert voor extra onzekerheid
• Toepassing: sigma (standaarddeviatie) is onbekend, dus we gebruiken s en t-statistiek
$7.33
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada

Conoce al vendedor
Seller avatar
lottedennederlanden

Documento también disponible en un lote

Conoce al vendedor

Seller avatar
lottedennederlanden Vrije Universiteit Amsterdam
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
2
Miembro desde
8 meses
Número de seguidores
0
Documentos
6
Última venta
2 semanas hace

0.0

0 reseñas

5
0
4
0
3
0
2
0
1
0

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes