Data-onderzoek
Inleiding:
1. Wat is statistiek?
Statistiek is de wetenschap van het verzamelen, verwerken en
interpreteren van (numerieke) gegevens over een bepaald onderwerp.
Het toepassen van statistische methodes leidt tot conclusies met bekende
risico’s. Statistiek is de ‘wetenschap van gegevens’.
Een statistiek is ook een steekproefwaarde of een steekproefgrootheid.
2. Waarom worden er statistische methodes toegepast?
De statistische methodes bij het beschrijven en analyseren van gegevens en
verschijnselen worden dagelijks gebruikt. Kranten, tijdschriften en
nieuwszenders publiceren regelmatig resultaten van enquêtes en onderzoeken,
hetzij op papier, hetzij digitaal. Ze maken daarbij gebruik van tabellen, grafieken
en statistische grootheden.
Door statistiek leer je nadenken over gegevens en krijg je inzicht in de
methodes die worden gebruikt om die gegevens te interpreteren. Dit is
noodzakelijk want statistiek en statistieken worden gebruikt om beslissingen te
nemen.
Vandaar de uitspraak: STATISTIEK IS EEN SLEUTEL TOT MANAGEMENT
3. Hoe wordt er in een statistisch onderzoek te werk gegaan?
1. Gegevens observeren en verzamelen, daarna de verzameling
kritisch bekijken. (hoofdstuk 1)
2. De gegevens ordenen in tabellen volgens bepaalde kenmerken.
(hoofdstuk 2)
3. De geordende gegevens voorstellen in grafieken.
(hoofdstuk 3)
4. De gegevens analyseren op basis van de grafiek (hoofdstuk 3) en
ze samenvatten in typische cijfers om het centrum en de spreiding
(hoofdstuk 4) te beschrijven. Bij de analyse wordt er soms overgestapt
op indexcijfers (hoofdstuk 5) in plaats van absolute cijfers. Een andere
mogelijkheid is verbanden onderzoeken en beschrijven.
5. De resultaten interpreteren en veralgemenen, een regelmaat
ontdekken, een hypothese verifiëren.
Alle fasen van het verzamelen tot en met de analyse behoren tot de
beschrijvende statistiek.
Een kengetal in de beschrijvende statistiek is een getal dat een kenmerk /
eigenschap / variabele van een gegevensverzameling (= steekproef =
dataset) samenvat.
Data-onderzoek = gebruikelijke grafieken en kentallen bespreken die het
mogelijk maken om een dataset te verkennen.
Het interpreteren en veralgemenen is de verklarende of inductieve
statistiek.
1
,H1: Verzamelen van gegevens
De steekproef moet zorgvuldig gekozen
worden om een getrouw miniatuurbeeld van
de populatie te geven.
De getallen die gebruikt worden om de verschillende mogelijkheden voor een
variabele weer te geven, hebben niet altijd evenveel betekenis. Dit wil zeggen
dat de statistische variabelen verschillen in meetschaal of meetniveau.
2
, Een kwalitatieve of niet-numerieke variabele is een variabele waarbij de
getalwaarde weinig betekenis heeft. Je kan ze evengoed in letters uitdrukken. Je
kan met deze getallen geen rekensom maken. (symbolisch)
Bij kwalitatieve variabelen worden er nog 2 niveaus onderscheiden:
Nominale variabele: als de getallen die gebruikt worden louter een code
zijn.
Ordinale variabelen: als de getallen die gebruikt worden een natuurlijke
volgorde van de variabelen weergeven ondanks dat ze symbolisch zijn.
Een kwantitatieve of numerieke variabele is een variabele die wordt
voorgesteld door een getal dat een reële betekenis heeft, dat een kwantiteit,
hoeveelheid van iets weergeeft. Ze wordt in een vaste eenheid uitgedrukt. Deze
variabelen zijn het resultaat van een meting of een telling.
Bij kwantitatieve variabelen worden er nog 2 niveaus onderscheiden:
Variabele met intervalschaal: als de variabele een vaste eenheid heeft
maar de schaal waarop gemeten wordt geen vast nulpunt bezit. (zie vb
p.17)
Variabele met ratioschaal: als de variabele een vaste eenheid heeft en
de schaal waarop ze gemeten wordt een vast nulpunt bezit.
Er wordt van een discrete of discontinue variabele gesproken als de
waarnemingen van de variabele het resultaat zijn van een telling. Wordt
uitgedrukt in gehele getallen. (zie vb p.18)
3
Inleiding:
1. Wat is statistiek?
Statistiek is de wetenschap van het verzamelen, verwerken en
interpreteren van (numerieke) gegevens over een bepaald onderwerp.
Het toepassen van statistische methodes leidt tot conclusies met bekende
risico’s. Statistiek is de ‘wetenschap van gegevens’.
Een statistiek is ook een steekproefwaarde of een steekproefgrootheid.
2. Waarom worden er statistische methodes toegepast?
De statistische methodes bij het beschrijven en analyseren van gegevens en
verschijnselen worden dagelijks gebruikt. Kranten, tijdschriften en
nieuwszenders publiceren regelmatig resultaten van enquêtes en onderzoeken,
hetzij op papier, hetzij digitaal. Ze maken daarbij gebruik van tabellen, grafieken
en statistische grootheden.
Door statistiek leer je nadenken over gegevens en krijg je inzicht in de
methodes die worden gebruikt om die gegevens te interpreteren. Dit is
noodzakelijk want statistiek en statistieken worden gebruikt om beslissingen te
nemen.
Vandaar de uitspraak: STATISTIEK IS EEN SLEUTEL TOT MANAGEMENT
3. Hoe wordt er in een statistisch onderzoek te werk gegaan?
1. Gegevens observeren en verzamelen, daarna de verzameling
kritisch bekijken. (hoofdstuk 1)
2. De gegevens ordenen in tabellen volgens bepaalde kenmerken.
(hoofdstuk 2)
3. De geordende gegevens voorstellen in grafieken.
(hoofdstuk 3)
4. De gegevens analyseren op basis van de grafiek (hoofdstuk 3) en
ze samenvatten in typische cijfers om het centrum en de spreiding
(hoofdstuk 4) te beschrijven. Bij de analyse wordt er soms overgestapt
op indexcijfers (hoofdstuk 5) in plaats van absolute cijfers. Een andere
mogelijkheid is verbanden onderzoeken en beschrijven.
5. De resultaten interpreteren en veralgemenen, een regelmaat
ontdekken, een hypothese verifiëren.
Alle fasen van het verzamelen tot en met de analyse behoren tot de
beschrijvende statistiek.
Een kengetal in de beschrijvende statistiek is een getal dat een kenmerk /
eigenschap / variabele van een gegevensverzameling (= steekproef =
dataset) samenvat.
Data-onderzoek = gebruikelijke grafieken en kentallen bespreken die het
mogelijk maken om een dataset te verkennen.
Het interpreteren en veralgemenen is de verklarende of inductieve
statistiek.
1
,H1: Verzamelen van gegevens
De steekproef moet zorgvuldig gekozen
worden om een getrouw miniatuurbeeld van
de populatie te geven.
De getallen die gebruikt worden om de verschillende mogelijkheden voor een
variabele weer te geven, hebben niet altijd evenveel betekenis. Dit wil zeggen
dat de statistische variabelen verschillen in meetschaal of meetniveau.
2
, Een kwalitatieve of niet-numerieke variabele is een variabele waarbij de
getalwaarde weinig betekenis heeft. Je kan ze evengoed in letters uitdrukken. Je
kan met deze getallen geen rekensom maken. (symbolisch)
Bij kwalitatieve variabelen worden er nog 2 niveaus onderscheiden:
Nominale variabele: als de getallen die gebruikt worden louter een code
zijn.
Ordinale variabelen: als de getallen die gebruikt worden een natuurlijke
volgorde van de variabelen weergeven ondanks dat ze symbolisch zijn.
Een kwantitatieve of numerieke variabele is een variabele die wordt
voorgesteld door een getal dat een reële betekenis heeft, dat een kwantiteit,
hoeveelheid van iets weergeeft. Ze wordt in een vaste eenheid uitgedrukt. Deze
variabelen zijn het resultaat van een meting of een telling.
Bij kwantitatieve variabelen worden er nog 2 niveaus onderscheiden:
Variabele met intervalschaal: als de variabele een vaste eenheid heeft
maar de schaal waarop gemeten wordt geen vast nulpunt bezit. (zie vb
p.17)
Variabele met ratioschaal: als de variabele een vaste eenheid heeft en
de schaal waarop ze gemeten wordt een vast nulpunt bezit.
Er wordt van een discrete of discontinue variabele gesproken als de
waarnemingen van de variabele het resultaat zijn van een telling. Wordt
uitgedrukt in gehele getallen. (zie vb p.18)
3