100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting Beschrijvende en Inferentiële Statistiek – Eindtoets

Beoordeling
-
Verkocht
-
Pagina's
15
Geüpload op
19-04-2025
Geschreven in
2024/2025

Deze samenvatting is een vervolg op de samenvatting van de deeltoets die ik gedeeld heb. Het document behandelt hoe je op verantwoorde wijze uitspraken kunt doen over populaties op basis van steekproeven, met behulp van betrouwbaarheidsintervallen, hypothesetoetsen en regressiemodellen. Het legt nadruk op correcte interpretatie van statistische resultaten en hoe je voorkomt dat je foutieve conclusies trekt. De samenvatting is bedoeld als voorbereiding op de eindtoets van het vak 'Beschrijvende- en Inferentiële statistiek op de VU. Dit was voor mijn premaster. LET OP! De samenvatting is geschreven op basis van SPSS

Meer zien Lees minder
Instelling
Vak









Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
19 april 2025
Aantal pagina's
15
Geschreven in
2024/2025
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Samenvatting Beschrijvende en Inferentiële statistiek - Eindtoets


Methoden om data samen te vatten wordt beschrijvende statistiek genoemd. De kenmerken van een
dataset worden samengevat, ofwel de data hier is een beschrijving van de statistische feiten.
Bij inferentiële statistiek daarentegen wordt een hypothese getoetst of bepaal je of je data
generaliseerbaar zijn naar een bredere populatie. Er worden conclusies getrokken, parameters afgeleid,
verbanden gelegd tussen feiten, er wordt betekenis aan de data gegeven en er worden uitspraken gedaan
over deze data over een gehele populatie (doel).
Statistische inferentie = het proces waarbij conclusies worden getrokken over een populatie door
middel van statistische analyses van een steekproef van die populatie. Op basis van
steekproefinformatie worden er conclusies getrokken over de populatie waaruit de steekproef is
getrokken.
Er zijn twee typen statistische inferentie. Er zijn dus twee manieren om het ‘echte’ populatiegemiddelde
(mu) schatten op basis van een steekproef:
1. Schatten van de populatieparameters.
Binnen de statistische inferentie waarbij je de populatieparameters schat zijn er ook 2 manieren
om dat te doen:
a. Puntschatter/point estimate. Het is één getal dat de beste schatting is van de
populatieparameters. Bij de puntschatter wordt er een schatting gedaan van een specifieke
waarde, bijvoorbeeld x-bar.
Dit is een benadering van een populatieparameter (mu of sigma) met een specifieke waarde
uit één steekproef (x-bar of s).
X-bar = mu
b. Intervalschatting. Het is een reeks waarden waarbinnen er verwacht wordt dat de
parameters gaan vallen.
Er wordt een betrouwbaarheidsinterval (B.I.) gebruikt om een intervalschatting te doen.
Het betrouwbaarheidsinterval van een parameter is een interval van waarden, waarvan we
met een bepaald vertrouwen aannemen dat de ‘ware’ waarde van de populatieparameter
daarbinnen ligt.
Betrouwbaarheidsniveau. De kans dat de populatieparameter (intervalschatting)
daadwerkelijk binnen dat interval ligt. Het betrouwbaarheidsniveau heeft altijd een waarde
rondom/dicht bij 1 (meestal 0,95 → 95% betrouwbaarheidsinterval).
Hoe hoger het betrouwbaarheidsniveau, hoe groter het interval waarschijnlijk is.
2. Hypothesen over deze parameters testen.
Om een betrouwbaarheidsinterval te maken, gebruik je de steekproefverdeling van het gemiddelde.
Betrouwbaarheidsinterval berekenen:
1. Neem de puntschatting (x-bar)
2. Betrouwbaarheidsniveau bepalen (bijvoorbeeld 95%)
3. Foutmarge berekenen
4. BI = puntschatter +/- foutmarge
Benodigde z-score bij 95% betrouwbaarheidsinterval: zoek in de tabel naar de z-score.
Deel de alpha door 2. Dit wordt gedaan, omdat het verdeeld wordt aan beide kanten van de
normaalverdeling. In de twee staarten zit de 5% verdeeld → dus 2,5% aan de ene kant en 2,5% aan de
andere kant. Kijk in de tabel dan bij de rij van 0,025 en zoek de bijbehorende z-score.
Als je een conclusie trekt kun je (bijvoorbeeld) met 95% zekerheid zeggen dat de werkelijke gemiddelde
koffiepauzetijd in de populatie tussen 5.02 en 6.98 minuten ligt.
Let op! De interpretatie is dus NIET: “95% kans dat de populatieparameter een bepaalde waarde
aanneemt.”

, Samenvatting Beschrijvende en Inferentiële statistiek - Eindtoets


De formule van een 95% betrouwbaarheidsinterval:

• CI = betrouwbaarheidsinterval (confidence interval)
• X-bar = populatiegemiddelde
• Z = de kritieke waarde van de z-verdeling (tabel)
• Sigma = de standaarddeviatie van de populatie
• Wortel n = de vierkantswortel van de populatiegrootte
Er is een probleem met de formule van een 95% betrouwbaarheidsinterval, want de sigma van het
populatiegemiddelde (sigma-x-bar) is vaak onbekend, waardoor de formule niet uitgerekend kan
worden.
De oplossing is door de standaarddeviatie van de populatie te schatten.
De 95% betrouwbaarheidsinterval geeft aan dat het betrouwbaarheidsinterval van een willekeurig
geselecteerde steekproef de populatieparameters omvat, 0,95 is. De waarschijnlijkheid dat het
betrouwbaarheidsinterval het populatiegemiddelde niet omvat is 0,05.
De boven- en ondergrens van het interval zijn de foutmarge (onzekerheidsmarge). De foutmarge vertelt
accuraat hoe het steekproef-
gemiddelde (x-bar) het
populatiegemiddelde (mu)
waarschijnlijk schat. De
foutmarge is de afstand van
‘X’ standaarddeviaties.
Bijvoorbeeld: de foutmarge
is 1% bij de VVD. De puntschatter is 18% en het interval is van 17% tot 19%, dus het heeft een
foutmarge van 1%.
Foutenkans (a=alpha) = kans dat iets niet zo is. bij een betrouwbaarheidsniveau is dat 0,05 dat dat niet
zo is.
Betrouwbaarheidsniveau = 1 – a
T-verdeling = een manier om data te beschrijven die nagenoeg de normale verdeling volgen, maar
waarbij de variantie onbekend is. De t-verdeling houdt rekening met een extra fout.
De staarten van de verdeling kunnen dikker zijn dan die van een normaalverdeling. En een t-verdeling
heeft een grotere standaarddeviatie.
Een t-verdeling bevat een lagere top en hogere staarten dan die van
een normaalverdeling.
Let op outliers bij de t-verdeling.
De vorm van een t-verdeling hangt af van de steekproefgrootte.
Hoe groter de steekproefomvang, hoe meer de distributie op een
normaalverdeling lijkt. En hoe kleiner de steekproefomvang, hoe
lager de top en hoe hoger de staarten van de verdeling worden.
De vorm van een t-verdeling hangt af van de vrijheidsgraden
(degrees of freedom - df).
Formule vrijheidsgraad bij het gemiddelde = n – 1

• Een kleine steekproef heeft meer spreiding
• Grote steekproef → benadert normaalverdeling
• De t-verdling corrigeert voor extra onzekerheid
• Toepassing: sigma (standaarddeviatie) is onbekend, dus we gebruiken s en t-statistiek
$7.34
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper
Seller avatar
lottedennederlanden

Ook beschikbaar in voordeelbundel

Maak kennis met de verkoper

Seller avatar
lottedennederlanden Vrije Universiteit Amsterdam
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
2
Lid sinds
8 maanden
Aantal volgers
0
Documenten
6
Laatst verkocht
2 weken geleden

0.0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen