100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4.2 TrustPilot
logo-home
Resumen

Samenvatting Statistiek voor Data Sciences _ D0H19A

Puntuación
-
Vendido
11
Páginas
52
Subido en
12-01-2023
Escrito en
2020/2021

Maak het leren van Statistics for Data Sciences gemakkelijk met deze document! Deze uitgebreide samenvatting gebaseerd op het boek Statistiek - twaalfde editie van Terry Sincich en James McClave geeft u een duidelijk en beknopt overzicht van de belangrijkste theorieën en concepten van de cursus. Met deze samenvatting kunt u er zeker van zijn dat u over alle informatie beschikt die u nodig hebt om het materiaal van de les Data Sciences te begrijpen en te behouden. Dit is de perfecte metgezel voor elke student die het vak Statistiek wil begrijpen en beheersen. Maak je klaar om zeker te slagen voor je examens ! Disclaimer: Dit document is een samenvatting en kan niet als enig studiemateriaal worden beschouwd.

Mostrar más Leer menos
Institución
Grado











Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Libro relacionado

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

¿Un libro?
No
¿Qué capítulos están resumidos?
Hoofdstuk 6 t.e.m. hoofdstuk 12
Subido en
12 de enero de 2023
Número de páginas
52
Escrito en
2020/2021
Tipo
Resumen

Temas

Vista previa del contenido

Statistiek voor data sciences
Hoofdstuk 6: Verdelingen van steekproefgrootheden
In de praktijk kennen we de verdeling van een stochastische variabele (verwachting,
variantie en kansen) niet.

Verwachting en standaardafwijking zijn onbekende grootheden die we moeten schatten.

Parameter: numerieke beschrijvende maat van een populatie. Omdat grootheid van
populatie is de waarde ervan bijna altijd onbekend

Vb: kans p, verwachting µ, standaardafwijking 𝜎


Steekproefgrootheid: numerieke beschrijvende maat van een steekproef. Deze grootheid
wordt berekend uit de waarden in de steekproef.

Vb: gemiddelde 𝑥̅ , variantie 𝑠 ' , standaardafwijking s

Verdeling van een steekproefgrootheid

Uitkomst van een steekproefgrootheid hangt af van toeval omdat de steekproef zelf van
toeval afhangt => steekproef dus stochastische variabele.
Uitkomst van een steekproefgrootheid ligt niet vast => steekproefgrootheid heeft een
kansverdeling.

In plaats van het steekproefgemiddelde 𝑥̅ , zouden we ook de steekproefmediaan m als
schatter kunnen gebruiken.

Als we de eigenschappen van verschillende steekproefgrootheden willen vergelijken,
kunnen we dat niet doe op grond van slechts een uitkomst, maar moeten we hun
kansverdelingen vergelijken. Gaan het steekproefexperiment een zeer groot aantal malen
herhalen.

Hoe geven we ons voorkeur aan een steekproefgrootheid?

Ÿ A is meer geconcentreerd rondom de
doelparameter 𝜎 ' , de kans dat je schatting
dichterbij 𝜎 ' ligt is dan groter




1

,In het algemeen hebben de waarde van 𝑥̅ meer neiging om zich om µ te concentreren dan
de waarde van de mediaan m. 𝑥̅ bevat dus meer informatie over µ dan m.

De centrale limietstelling

We willen een conclusie trekken over de verwachtingen µ. De steekproefgemiddelde 𝑥̅ is
een goede schatter van µ.



)
Eigenschappen van de kansverdeling van 𝒙

1. µ+̅ = 𝐸 (𝑥̅ ) = µ
0
2. 𝜎+̅ = = standaardfout van het gemiddelde
√2




2 belangrijke stellingen over de vorm van de kansverdeling 𝑥̅

Steekproef uit een normale verdeling

Als een aselecte steekproef van n waarnemingen uit een populatie met een normale
kansverdeling wordt genomen, zal de kansverdeling van 𝑥̅ een normale verdeling zijn.



Steekproef uit een willekeurige verdeling: centrale limietstelling

Als een aselecte steekproef van n waarnemingen uit een willekeurige populatie met
verwachting µ en standaardafwijking 𝜎 wordt genomen, zal, als n groot genoeg is, de
kansverdeling van 𝑥̅ bij benadering normaal zijn met verwachting µ+̅ = µ en
0
standaardafwijking 𝜎+̅ = . Hoe groter de steekproef is, des beter zal de benadering zijn.
√2



Ÿ Voor steekproeven die groot genoeg zijn, is de kansverdeling van het
steekproefgemiddelde bij benadering normaal, ongeacht de kansverdeling van de
populatie.
Ÿ Hoe meer de populatieverdeling afwijkt van de vorm van een normale verdeling, des
te groter de steekproefomvang moet zijn voordat de kansverdeling van 𝑥̅ goed
benaderd.
Vuistregel: n ≥ 30




2

, 0
Als 𝑥̅ bij benadering normaal verdeeld is met µ = µ+̅ en 𝜎+̅ = :
√2

+̅ 456)
𝑧= 06)




Continuïteitscorrectie: om discrete stochastische variabelen X zo goed mogelijk te
benaderen met een continue stochastische variabele Y.

8 8
P(X=𝑥) benaderen we door P (𝑥 − ' ≤ 𝑌 ≤ 𝑥 + ')


Hoofdstuk 7: Betrouwbaarheidsintervallen gebaseerd op één enkele
steekproef

Schatten van een paramater

We gaan hier de onbekende waarde van een parameter van de populatie te schatten.
Steeds zullen we een steekproefgrootheid gebruiken om de populatieparameter te schatten
en bovendien de kansverdeling van de steekproefgrootheid gebruiken om een indicatie te
geven van de nauwkeurigheid van de schatting.

Als we ‘verwachting’ gebruiken, gaat het om parameter µ, als we ‘fractie’, ‘proportie’ of
‘percentage’ gebruiken, is de parameter waarin we geïnteresseerd zijn zeker p.

Schatter = procedure waar we één schatting geven voor de onbekende parameter
><
Betrouwbaarheidsinterval: procedure waarbij we twee grenzen schatten waar de werkelijke
waarde van de parameter tussen zou moeten liggen.

Ÿ Meestal 𝑥̅ als schatter voor µ, 𝑝̂ (fractie successen in steekproef) als schatter voor p
en dan 𝑠 ' als schatter voor 𝜎 ' .

Schatter: regel of formule die ons zegt hoe we uit de steekproef een getal moeten
berekenen om de populatieparameter te schatten. Het is dus een steekproefgrootheid. De
uitkomst ervan = schatting

Betrouwbaarheidsinterval: regel of formule die ons zegt hoe we uit de steekproef een
interval moeten berekenen dat de waarde van de paramater met een bepaalde hoge
waarschijnlijkheid bevat.




3

, Betrouwbaarheidsinterval voor een verwachting bij een grote steekproef

Betrouwbaarheidsinterval voor µ, gebaseerd op een grote steekproef (n≥30):

0 0
𝑃 @𝑥̅ − 𝑧AB' < µ < 𝑥̅ + 𝑧AB' D ≈ 100(1 − 𝛼 )%
√2 √2


Ÿ Kans dat parameter µ tussen deze grenzen ligt is ongeveer 100(1 − 𝛼 )%

(! n ≥ 30 is geen scherpe grens. Als kansverdeling heuvelvormig is kan een kleinere n
voldoende zijn)

Betrouwbaarheidsinterval voor µ, gebaseerd op een grote steekproef met 𝝈 onbekend:

Ÿ Omdat de steekproefomvang groot is, zullen we in de formule s als schatter
gebruiken voor 𝜎.
K K
𝑃(𝑥̅ − 𝑧AB' < µ < 𝑥̅ + 𝑧AB' ) ≈ 100(1 − 𝛼 )%
√2 √2




Betrouwbaarheidscoëfficiënt (1 − 𝛼 ) is de kans dat een betrouwbaarheidsinterval de
populatieparameter bevat; als in percentage uitgedrukt dan noemen we het ook
betrouwbaarheidsniveau


Als BI 100(1 − 𝛼 )% bedraagt, zal op den duur 100(1 − 𝛼 )% van de intervallen µ wél
bevatten en 100𝛼% niet.

We kunnen echter niet
achter komen of ons interval
wel tot die 100(1 − 𝛼 )%
Behoort die µ bevat of niet.



Voorwaarden voor de geldigheid van de formules voor een BI voor µ

1. Aselecte steekproef uit de populatie
2. Steekproefgrootte is groot (n≥30) (// centrale limietstelling) => hierdoor 𝑥̅ bij
benadering normaal en s goede schatter voor 𝜎



De breedte van een betrouwbaarheidsinterval hangt af van:
- De keuze van de betrouwbaarheidscoëfficiënt: 95% BI zal breder zijn dan een 90% BI.
90% BI is dus preciezer maar ten koste van het vertrouwen die lager zal zijn.


4
$8.48
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada


Documento también disponible en un lote

Conoce al vendedor

Seller avatar
Los indicadores de reputación están sujetos a la cantidad de artículos vendidos por una tarifa y las reseñas que ha recibido por esos documentos. Hay tres niveles: Bronce, Plata y Oro. Cuanto mayor reputación, más podrás confiar en la calidad del trabajo del vendedor.
chlodewandeleer Katholieke Universiteit Leuven
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
17
Miembro desde
4 año
Número de seguidores
14
Documentos
9
Última venta
9 meses hace
Summary Ultra

Vind je snelkoppeling naar succes - krijg nu samenvattingen!

0.0

0 reseñas

5
0
4
0
3
0
2
0
1
0

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes