100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4,6 TrustPilot
logo-home
Resumen

Samenvatting Toetsende Statistiek (Agresti & Franklin) Hoofdstuk 8 t/m 15 + collegeaantekeningen

Puntuación
-
Vendido
1
Páginas
33
Subido en
12-03-2021
Escrito en
2020/2021

Hierbij een samenvatting voor het vak Toetsende Statistiek. Alle hoofdstukken voor dit vak zijn uitgebreid beschreven met voorbeelden en collegeaantekeningen

Institución
Grado











Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Libro relacionado

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

¿Un libro?
No
¿Qué capítulos están resumidos?
Hoofdstuk 8 t/m hoofdstuk 15
Subido en
12 de marzo de 2021
Número de páginas
33
Escrito en
2020/2021
Tipo
Resumen

Temas

Vista previa del contenido

Samenvatting Toetsende Statistiek




College 1
Hoofdstuk 8 Statistical inference: confidence intervals
Toetsende (inferentiële) statistiek (inferential statistics) = gebruiken van de statistics om iets te
zeggen over de parameter, methode voor het maken van voorspellingen over een populatie

Statistische conclusies (statistical inference) = concluderende methoden helpen ons om te
voorspellen hoe dicht een steekproefstatistic ligt bij een populatieparameter
 Statistische concluderende methoden zijn belangrijk:
1. Gebruiken kansberekeningen die ervan uitgaan dat de data zijn verzameld door middel van
willekeurige steekproeven of een willekeurig experiment
2. De kansberekeningen verwijzen naar een kansverdeling of een statistic, die meestal een
ongeveer normaalverdeling heeft

Er zijn twee typen van statistische concluderende methoden:
1. Schatting van populatieparameters
2. Testen van hypotheses over de waarden van de parameters
- Parameter= een numerieke samenvatting van de populatie – statistics= een numerieke
samenvatting van een steekproef (werken we het vaakst mee, gebruiken we voor de
parameter

De meest informatieve schattingsmethode= construeert een interval van getallen, een
betrouwbaarheidsinterval, waar we verwachten dat de onbekende parameter binnen zal vallen

8.1 Point and interval estimates of population parameters
Een puntschatting (point estimate) = een enkel getal die onze beste schatting is naar de parameter
 Enkel een puntschatting is vaak niet voldoende, omdat het ons niet verteld hoe dicht de
schatting waarschijnlijk bij de parameter zal liggen
Een intervalschatting (interval estimate) = een interval van getallen waarvan geloofd wordt dat het
de werkelijke waarde van de parameter bevat (puntschatting in het midden hiervan)

, - Is handiger dan een puntschatting, door het integreren van de foutmarge (helpt de
intervalschatting ons bij het pellen van de nauwkeurigheid van de puntschatting)

Puntschatting: een zo goed mogelijke schatting maken van de populatieparameter:
Als we de data verzameld hebben, vinden we de puntschatting door: een geschikte
steekproefstatistic te gebruiken
- Bv. voor een populatiegemiddelde is het steekproefgemiddelde een puntschatting van μ

Eigenschappen van puntschatters:
 Een goede schatter van een parameter heeft twee eigenschappen:
1. Een steekproefverdeling die gecentreerd is rond de parameter = een zuivere (unbiased)
schatter
2. Een kleine standaarddeviatie vergeleken met andere schatters > vertelt ons dat de
schatting dichter bij de parameter neigt te vallen dan andere schatters

Voor elke specifieke parameter zijn verschillende mogelijke puntschattingen (bv. voor een
normaalverdeling is het centrum ‘het gemiddelde en de mediaan’ > mogelijke puntschattingen zijn:
- 1. Het steekproefgemiddelde 2. De steekproefmediaan (want symmetrische verdeling)

Intervalschatting: een interval construeren dat de parameter benaderd:
Om te weten of de schatting nuttig is, moeten we weten hoe dicht de schatting waarschijnlijk zal
vallen bij de eigenlijke waarde van de parameter.
 Een intervalschatting indiceert precisie door een aantal getallen rond de puntschatting
 Het interval is opgebouwd uit getallen die de meest geloofwaardige waarden zijn voor de
onbekende parameter, gebaseerd op de geobserveerde data

Een intervalschatting wordt ook wel ‘betrouwbaarheidsinterval’ genoemd, omdat ze met een
vermoedelijke waarden voor de parameter bevat:
 Wordt gevormd door een methode die de puntschatting combineert met de foutmarge
 De kans dat deze methode een interval vormt die de parameter bevat, wordt het
betrouwbaarheidsniveau genoemd (= een gekozen getal, dat dicht bij 1 ligt, meestal 0,95)

Om een betrouwbaarheidsinterval te construeren is de steekproevenverdeling van de puntschatting
de sleutel > deze verdeling verteld ons de kans dat de puntschatting binnen een bepaalde afstand
van de parameter zal vallen

De logica achter het construeren van een betrouwbaarheidsinterval:
 Een betrouwbaarheidsinterval voor een proportie in de populatie, is gebaseerd op de
steekproevenverdeling van een steekproefproportie, eigenschappen:
- Geeft de mogelijke waarden voor de steekproefproportie en hun kansen weer
- Heeft een ongeveer normale verdeling, voor een groot aantal willekeurige steekproeven
(waarbij np ≥ 15 en n(1-P) ≥ 15)
- Heeft een gemiddelde dat gelijk is aan de populatieproportie p
- Heeft een standaarddeviatie die gelijk is aan √ p(1 – p) / n

De foutenmarge (margin of error) = meet hoe nauwkeurig de puntschatting is in hoe waarschijnlijk hij
de parameter zal schatten
 Als een steekproef is geselecteerd, normaal verdeeld is, en de steekproefproportie inderdaad
binnen 1.96 standaarddeviaties van de populatieproportie ligt (95% van de tijd)
- Dan bevat het interval van ‘steekproefproportie -1.96’ tot ‘steekproefproportie +1.96’ de
populatieproportie

,  In andere woorden: met een kans van ongeveer 0.95 doet een steekproefproportie zich zo
voor dat het interval de onbekende populatieproportie bevat (95% betrouwbaarheidsinterval
voor de populatieproportie)

8.2 Constructing a confidence interval to estimate a population proportion
Als een categorische variabele meer dan twee categorieën heeft, kan hij nog steeds benaderd
worden als binomiaal door een van de categorieën te classificeren als een succes en de overgebleven
categorieën als een mislukking

Vinden van de 95% betrouwbaarheidsinterval voor een populatieproportie:
 De steekproefproportie (de puntschatting) wordt gesymboliseerd door ^p (het dakje staat
hier voor de puntschatting van de parameter) > X gedeeld door alle n
 Voor grote willekeurige steekproeven: vertelt de centrale limietstelling ons dat de
steekproevenverdeling van de steekproefproportie ^p ongeveer normaal is
- Dus een foutmarge voor een 95% betrouwbaarheidsinterval bij een normale
steekproefverdeling= 1.96 > dus ongeveer 95% kans dat ^p binnen 1.96
standaarddeviaties van de populatieproportie (p) valt
- Een 95% betrouwbaarheidsinterval wordt gegeven door: puntschatting ± foutmarge, wat
dan wordt: ^p ± 1.96
- De standaarddeviatie van een steekproefproportie is gelijk aan > √ p(1 – p) / n > is
afhankelijk van de onbekende populatieproportie (p) (in praktijk moeten we p schatten)

Een 95% betrouwbaarheidsinterval wordt als volgt berekend voor de populatieproportie (p) = ^p ±
1.96 (se) met SE = √ ^p (1 – ^p) / n
- De standaardfout (SE)= de geschatte standaarddeviatie van de steekproevenverdeling
 Bij rapporteren van resultaten alleen de eerste twee of drie decimalen

Steekproefgrootte (n) nodig voor de validiteit van het betrouwbaarheidsinterval voor een proportie:
 Het betrouwbaarheidsinterval geld alleen bij grote willekeurige steekproeven (n) > minstens
15 successen en 15 mislukkingen hebt voor een binomiale uitkomst (n ^p ≥ en n(1- ^p) ≥ 15)

Een ander betrouwbaarheidsniveau gebruiken dan 95%:
- 95% is meest gebruikte keuze, sommige toepassingen vragen grotere betrouwbaarheid
- Wel geldt: hoe hoger het betrouwbaarheidsniveau, hoe groter de foutenmarge en hoe
breder het betrouwbaarheidsinterval > dus onnauwkeuriger
 Om de kans op een juiste schatting te verhogen gebruiken we een groter
betrouwbaarheidsniveau, zoals 0.99 > berekenen: p = ^p ± 2.58 (se)
 Om 100% zeker te zijn van een bepaalde schatting, moet het betrouwbaarheidsinterval alle
mogelijke waarden voor de parameter bevatten > in praktijk daarom iets minder perfecte
betrouwbaarheid > ze kunnen zo een beter betrouwbaarheidsinterval geven (meer waard)

Hoe reken je met een ander betrouwbaarheidsniveau:
De algemene formule voor het betrouwbaarheidsinterval
voor een populatieproportie =

- Dus steekproefproportie ± z-score van de
normale tabel (standaardfout)
- De z-score is afhankelijk van het betrouwbaarheidsinterval > bv. 70%, dan zoek je de z-
waarde van 0.15 of 0.85 (want hier vallen de grenzen) > beide zelfde z-score (+ en -)
 De foutmarge is: z(se) = z x (√ ^p (1 – ^p) / n)

, - Dit neemt af wanneer de steekproefomvang (n) toeneemt, voor een gegeven waarde van
^p (hoe groter de waarde van n, hoe smaller het interval)
- En de marge neemt toe als het betrouwbaarheidsniveau groter wordt

Interpretatie van het betrouwbaarheidsinterval:
 De 95% betrouwbaarheid is verwezen naar een interpretatie op de lange termijn > hoe de
methode presteert wanneer steeds opnieuw gebruikt bij vele willekeurige steekproeven
 Dus op lange termijn zal 95% van alle intervallen de correcte resultaten geven, die de
populatieproporties bevatten

Kansen gelden voor statistics (zoals steekproefproportie), niet voor parameters
 De schatting ^p, niet de parameter p, is de toevalsvariabele die een steekproefverdeling en
kansen weergeeft (kunnen dit niet zeggen over de populatie)
 De 95% betrouwbaarheid verwijst niet naar de kans van de populatieproportie p > maar naar
de kans die geldt voor de betrouwbaarheidsintervalmethode in de zin van zijn relatieve
frequentie
- Als we deze keer op keer zouden gebruiken voor verschillende methoden, dan zullen we
op de lange termijn in 95% van de gevallen een juiste schatting maken
 Bayesische statistieken= statistische schatting gebaseerd op de subjectieve definitie van kans
(hiermee kan je wel wat zeggen over de parameter, maar subjectief)

8.3 Constructing a confidence interval to estimate a population mean
Een betrouwbaarheidsinterval maken voor een populatiegemiddelde:
 Het steekproefgemiddelde ( x ) is de puntschatter van het gemiddelde in populatie (μ)
 De standaarddeviatie van het steekproefgemiddelde is: σ / √ n , waarbij σ de
standaarddeviatie van de populatie is
 Maar σ kennen we hier niet > dus de geschatte standaarddeviatie die gebruikt wordt bij
betrouwbaarheidsintervallen is de standaardfout SE = s / √ n
- Hierbij is zowel μ als σ onbekend > dus geen z-score maar een t-waarde (vallen iets
strenger dan een z-waarde om de missende waarden)

De t-verdeling en zijn proporties:
De t-waarde= als de z-score, maar deze komt van een klokvormige verdeling die iets dikkere
uiteinden heeft (dus meer variabiliteit laat zien) dan een normale verdeling
- Deze verdeling noemen we de t-verdeling

Degrees of freedom (vrijheidsgraden), genoteerd als df= voor een schatting van een
populatiegemiddelde, gelijk aan df= n -1, 1 minder dan de steekproefomvang

Gebruik van de t-verdeling om een betrouwbaarheidsinterval van het gemiddelde op te stellen:
 Een 95% betrouwbaarheidsinterval voor het populatiegemiddelde (is= x ± t.025 (se), waarbij
SE = s / √ n
- Een t-waarde kan je opzoeken in de t-tabel in het formuleboek (in combinatie met df)>
daarna keer de standaardfout
- Wanneer df toeneemt, neemt de t-score af richting de z-score
(standaardnormaalverdeling)
- De standaardnormale verdeling is de t-verdeling met df = ∞ > wanneer df boven de 100
ligt, is hij ‘oneindig’ en kijk je naar de onderste balk met dit teken
 Je ziet bij een overschrijdingskans van 0.025 (95%) en een n boven 100 > een t-score
van 1.96 (dus gelijk aan standaardnormaalverdeling) > waarden eigenlijk zelfde als z-
score
$8.78
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada


Documento también disponible en un lote

Conoce al vendedor

Seller avatar
Los indicadores de reputación están sujetos a la cantidad de artículos vendidos por una tarifa y las reseñas que ha recibido por esos documentos. Hay tres niveles: Bronce, Plata y Oro. Cuanto mayor reputación, más podrás confiar en la calidad del trabajo del vendedor.
rosaforto Universiteit van Amsterdam
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
237
Miembro desde
8 año
Número de seguidores
194
Documentos
21
Última venta
2 meses hace

3.8

55 reseñas

5
13
4
22
3
17
2
0
1
3

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes