- Geslacht
- Bloeddruk
- Vind je dit een interessante cursus (helemaal niet/niet/wel/heel zeker)
- Behaald aantal punten (op 20) op het examen
- Percentage studenten met onderscheiding
- Behaalde graad op het examen (onvoldoende/voldoening/onderscheiding/grote onderscheiding)
Welke van onderstaande variabelen zijn numerieke variabelen (meerdere antwoorden mogelijk)?
- Geslacht
- Bloeddruk
- Vind je dit een interessante cursus (helemaal niet/niet/wel/heel zeker)
- Behaald aantal punten (op 20) op het examen
- Percentage studenten met onderscheiding
- Behaalde graad op het examen (onvoldoende/voldoening/onderscheiding/grote onderscheiding)
Voor een ordinale variabele geldt:
- De data zijn discreet en kunnen meerdere waarden aannemen
- De data zijn continu en volgen een geordende reeks
- De data zijn categorisch
- De categorieën zijn geordend
- Er zijn maar twee categorieën mogelijk
Welke van onderstaande stellingen in correct?
- Een nominale variabele heeft neemt waarden aan met een zekere orde
- Kwantitatieve data krijg je als de data een getalwaarde weergeven
- Een ordinale waarde is gebaseerd op een numerieke waarde
- Een binaire categorische variabele kan je als nominaal of ordinaal beschouwen
- Numerieke variabelen zijn vaak een geobserveerde meetwaarde
Het rekenkundig gemiddelde (arithmetic mean) is
- Is een maat voor de locatie van “typische” observatie
- Is nuttig bij een rechts scheve verdeling
- Komt overeen met de mediaan als de data symmetrisch verdeeld zijn
- Is altijd groter dan de mediaan
- Kan niet berekend worden bij negatieve waarden
- Is gevoelig voor outliers
De mediaan is
- Een maat voor de spreiding van de data
- Is nuttig bij een rechts scheve verdeling
- Is groter dan het rekenkundig gemiddelde als de data rechts scheef verdeeld zijn
- Gebruikt minder informatie dan het rekenkundig gemiddelde
- Is gevoelig voor outliers
Welke beweringen over de kwantielen zijn waar?
- Als je de observaties ordent van klein naar groot, is het eerste percentiel groter dan 99% van alle observaties
- Het eerste deciel is gelijk aan de 90e percentiel
- Als je de observaties ordent van klein naar groot, is het eerste deciel groter dan 10% van de observaties
- De mediaan is gelijk aan de 50e percentiel
- De range is het verschil tussen de 1e en de 99e percentiel
- De interkwartiel afstand ligt tussen het 1e en het derde kwartiel
- De kwartielen verdelen de data in 10 gelijke groepen
Welke beweringen over de standaard afwijking zijn correct ?
- Is een maat voor locatie van een “typische” observatie
- Is de vierkantswortel uit de variantie, en bestaat enkel als alle geobserveerde waarden positief zijn
- Heeft dezelfde meeteenheid als de ruwe data
1
, - Is een spreidingsmaat gelijk aan de range
- Is ongevoelig voor outliers
- Mag je niet gebruiken bij scheef verdeelde data
Welke beweringen zijn correct? Een waarschijnlijkheidsfunctie…
- Is een functie die de waarschijnlijkheid weergeeft op het voorkomen van een bepaalde waarde
- Geeft de geobserveerde waarden van een variabele weer in een dataset
- Kan weergegeven worden door een curve, met de totale oppervlakte onder de curve gelijk aan 1
- Kan weergegeven worden door een curve, waarbij de oppervlakte tussen 2 punten (a en b) weergeeft wat de kans is
dat de variabele een waarde aanneemt tussen a en b
- Heeft altijd de vorm van een klok
- Kan zowel discreet als continu zijn
Welke beweringen over de normale verdeling zijn waar? De normale verdeling…
- Geeft de verdeling weer van gezonde controlepersonen
- Is rechts-scheef verdeeld
- Heeft als gemiddelde nul en standaard afwijking 1
- Heeft als mediaan het gemiddelde
- Heeft 67% van de observaties binnen het interval gemiddelde +/- standard afwijking
- Is volledig bepaald door het gemiddelde
- Is een continue waarschijnlijkheidsverdeling
Een normale verdeling heeft als gemiddelde 20 en standaard afwijking 5. Dan bevindt 95% van de observaties zich tussen de
volgende grenzen:
- 15.0 - 25.0
- 10.2 - 29.9
- 7.1 – 32.9
Welke beweringen zijn correct?
- Een steekproefstatistiek is een puntschatting van een parameter
- De fout op een steekproef is het gevolg van onnauwkeurige data-invoer
- Een willekeurige steekproef is een onnauwkeurige manier van data verzamelen
- Voor een gegeven dataset is de standaard afwijking altijd groter dan de standaard fout
- Bij statistische inferentie worden conclusies getrokken over de eigenschappen van de steekproef
Welke beweringen zijn correct? De standaard fout…
- Is de standaardafwijking van de verdeling van de steekproefgemiddelden
- Is een maat voor de nauwkeurigheid van het steekproefgemiddelde (waarmee het populatiegemiddelde wordt
geschat)
- Kan enkel worden berekend als men meerdere steekproeven van de populatie neemt
- Neemt toe bij een grotere steekproefgrootte
- Hangt enkel af van de steekproefgrootte
Volgens de centrale limietstelling geldt dat…
- Alle verdelingen normaal worden, zolang de steekproefgrootte hoog genoeg is
- Komt het gemiddelde van een steekproef uit een normale verdeling, als de steekproef voldoende groot is
- Komt het gemiddelde van een steekproef uit een normale verdeling, als de variabele in de gehele populatie normaal
verdeeld is
- Als men uit een populatie zeer veel steekproeven zou nemen, en telkens het steekproefgemiddelde berekent, dan
zou het gemiddelde van de steekproefgemiddelden gelijk zijn aan het onderliggende populatiegemiddelde
- Als men uit een populatie zeer veel steekproeven zou nemen, en telkens het steekproefgemiddelde berekent, dan
zou de variantie van de steekproefgemiddelden gelijk zijn aan de standaard fout
- De standaard fout is onafhankelijk van de steekproefgrootte
Het 95% betrouwbaarheidsinterval rond het gemiddelde is:
- Het interval waarin 95% van de steekproefgemiddelden zou liggen, als met herhaaldelijk een willekeurige steekproef
zou nemen uit de populatie
- Wordt geïnterpreteerd als het interval waarin met 95% zekerheid het werkelijke populatiegemiddelde ligt
2