Vragen + antwoorden van alle tutorials
Vraag 1.1.1: Waar zou je ruimtelijke data van goede datakwaliteit kunnen vinden?
E. CBS Statline, RIVM, Gemeentelijke instanties en Andere commerciële partijen
Omdat CBS Statline, RIVM en gemeentelijke instanties betrouwbare bronnen zijn voor
ruimtelijke data van goede kwaliteit in Nederland. Bij commerciële partijen moet je altijd
opletten met welk doel en hoe de data verzameld zijn, er kan een bias in de data zitten,
maar dit is zeker niet altijd zo.
Vraag 1.1.2: Wat zijn de onderzoekseenheden in deze data?
D. De buurten en wijken van Utrecht. "De buurten en wijken van Utrecht" is correct; dit
verwijst naar de geografische eenheden waarop de data beschikbaar zijn en het onderzoek
betrekking heeft.
Vraag 1.1.3: Wat zijn de variabelen in deze data?
A. De geselecteerde onderwerpen. De variabelen zijn de gegevensvelden die in de dataset
worden bestudeerd, zoals inkomen, opleidingsniveau, leeftijd, enzovoort. In dit geval zijn dat
de geselecteerde onderwerpen.
Vraag 1.1.4: Wat voor data zou je kunnen vinden op de website van het RIVM?
C. Data over de fysieke en mentale gezondheid van Nederlanders en factoren die daar
invloed op kunnen hebben.
Het RIVM houdt zich bezig met het verzamelen en analyseren van gegevens met betrekking
tot de gezondheidssituatie in Nederland. Deze gegevens omvatten zowel fysieke als
mentale aspecten van gezondheid.
Vraag 1.1.5: CSV staat voor ‘comma seperated values’; wat houdt dat in in deze
context?
B. CSV is een open data format waarin elke kolom wordt gescheiden door een bepaald
scheidingsteken (bijvoorbeeld komma of puntkomma) of door een lege ruimte (bijvoorbeeld
een spatie). = Correct! CSV (Comma Separated Values) is een tekstgebaseerd
gegevensformaat waarin gegevens in een tabel worden opgeslagen, waarbij elke kolom
wordt gescheiden door een specifiek scheidingsteken, zoals een komma, puntkomma of een
ander aangepast teken. Hierdoor kunnen de gegevens eenvoudig worden gelezen en
verwerkt door softwaretoepassingen en databases (zoals Excel).
Vraag 1.1.6: Hoeveel rijen met data (dus exclusief de ‘header’ rijen met info over de
bron en namen van de onderwerpen/attributen) heb je nu in het werkblad RIVM
Statline?
122.In totaal zijn er 111 buurten en 10 wijken in Utrecht. Deze buurten en wijken worden
samen met de gemeente Utrecht als geheel weergeven in de rijen van onze dataset. Met
één rij per buurt en wijk, en één rij voor Utrecht zelf, bedraagt totaal van het aantal rijen 122.
Vraag 1.1.7: Hoeveel kolommen hebben beide werkbladen nu?
17.De kolommen laten over het algemeen de verschillende variabelen of kenmerken zien die
worden gemeten of waargenomen voor die onderzoekseenheden. In onze dataset heb je als
het goed is 17 kolommen indien je dubbele headers hebt verwijderd.
, Vraag 1.1.8: Wat is de Leefbaarometer?
A. De Leefbaarometer is een concept dat wordt gebruikt om de algemene kwaliteit van leven
te evalueren aan de hand van sociale, economische, milieu- en gezondheidsindicatoren. =
De Leefbarometer evalueert de levenskwaliteit in bepaalde gebieden door een breed scala
aan indicatoren te gebruiken. Hieronder vallen indicatoren zoals sociale, economische,
milieu- en gezondheidsfactoren, om inzicht te krijgen in de algehele leefbaarheid en de
kwaliteit van leven van de bewoners in die gebieden.
Vraag 1.1.9: Wat zijn metadata?
D. Is in essentie ‘data over de data’, het zijn gegevens die de data beschrijven. = Metadata
fungeren als 'achtergrondinformatie' voor gegevens. Ze vertellen ons wat gegevens zijn,
waar ze vandaan komen, hoe ze zijn gestructureerd en wat ze betekenen. Hierdoor kunnen
wij deze data beter begrijpen, beheren en gebruiken.
Vraag 1.1.10: Waarom heeft dit Excel bestand zoveel meer rijen dan de eerdere
bestanden waar je mee gewerkt hebt?
A. Het bevat data van alle wijken van heel Nederland in plaats van alleen van Utrecht. =
Correct! De rijen beschrijven de onderzoekseenheden, in dit geval de verschillende wijken
van Nederland. Doordat er in deze Excel file naar alle wijken van Nederland wordt gekeken
zijn hier veel meer rijen.
Vraag 1.1.11: Wat is de modus van een dataset?
B. De modus van een dataset is het getal (of de getallen) dat het vaakst voorkomt in de
dataset.
Vraag 1.1.12: We zagen eerder al dat er buurten met de score ‘0’ voor leefbaarheid in
2018 in onze dataset zitten. Wat betekent die nul?
C. Dit zijn buurten met zeer weinig data/inwoners, waardoor geen zinvol gemiddelde kan
worden berekend en ze dus geen score hebben gekregen.
Vraag 1.1.13: Wat is de modus van de leefbaarheidsscore over alle buurten in Utrecht
in 2018?
9
Vraag 1.1.14: Wat is het gemiddelde van een dataset?
A. Het gemiddelde van een dataset is de som van alle waarden in de dataset gedeeld door
het aantal waarden in de dataset.
Vraag 1.1.15: Wat is het gemiddelde van de leefbaarheidsscore in 2018 over alle
buurten van Utrecht? Rond af op één decimaal en gebruik een punt als decimaal
scheidingsteken (omdat BB Engels is).
6.5
Vraag 1.1.16: Wat is de mediaan van een dataset?
D. De mediaan van een dataset is het middelste getal als je alle getallen in de dataset op
volgorde plaatst.
Vraag 1.1.1: Waar zou je ruimtelijke data van goede datakwaliteit kunnen vinden?
E. CBS Statline, RIVM, Gemeentelijke instanties en Andere commerciële partijen
Omdat CBS Statline, RIVM en gemeentelijke instanties betrouwbare bronnen zijn voor
ruimtelijke data van goede kwaliteit in Nederland. Bij commerciële partijen moet je altijd
opletten met welk doel en hoe de data verzameld zijn, er kan een bias in de data zitten,
maar dit is zeker niet altijd zo.
Vraag 1.1.2: Wat zijn de onderzoekseenheden in deze data?
D. De buurten en wijken van Utrecht. "De buurten en wijken van Utrecht" is correct; dit
verwijst naar de geografische eenheden waarop de data beschikbaar zijn en het onderzoek
betrekking heeft.
Vraag 1.1.3: Wat zijn de variabelen in deze data?
A. De geselecteerde onderwerpen. De variabelen zijn de gegevensvelden die in de dataset
worden bestudeerd, zoals inkomen, opleidingsniveau, leeftijd, enzovoort. In dit geval zijn dat
de geselecteerde onderwerpen.
Vraag 1.1.4: Wat voor data zou je kunnen vinden op de website van het RIVM?
C. Data over de fysieke en mentale gezondheid van Nederlanders en factoren die daar
invloed op kunnen hebben.
Het RIVM houdt zich bezig met het verzamelen en analyseren van gegevens met betrekking
tot de gezondheidssituatie in Nederland. Deze gegevens omvatten zowel fysieke als
mentale aspecten van gezondheid.
Vraag 1.1.5: CSV staat voor ‘comma seperated values’; wat houdt dat in in deze
context?
B. CSV is een open data format waarin elke kolom wordt gescheiden door een bepaald
scheidingsteken (bijvoorbeeld komma of puntkomma) of door een lege ruimte (bijvoorbeeld
een spatie). = Correct! CSV (Comma Separated Values) is een tekstgebaseerd
gegevensformaat waarin gegevens in een tabel worden opgeslagen, waarbij elke kolom
wordt gescheiden door een specifiek scheidingsteken, zoals een komma, puntkomma of een
ander aangepast teken. Hierdoor kunnen de gegevens eenvoudig worden gelezen en
verwerkt door softwaretoepassingen en databases (zoals Excel).
Vraag 1.1.6: Hoeveel rijen met data (dus exclusief de ‘header’ rijen met info over de
bron en namen van de onderwerpen/attributen) heb je nu in het werkblad RIVM
Statline?
122.In totaal zijn er 111 buurten en 10 wijken in Utrecht. Deze buurten en wijken worden
samen met de gemeente Utrecht als geheel weergeven in de rijen van onze dataset. Met
één rij per buurt en wijk, en één rij voor Utrecht zelf, bedraagt totaal van het aantal rijen 122.
Vraag 1.1.7: Hoeveel kolommen hebben beide werkbladen nu?
17.De kolommen laten over het algemeen de verschillende variabelen of kenmerken zien die
worden gemeten of waargenomen voor die onderzoekseenheden. In onze dataset heb je als
het goed is 17 kolommen indien je dubbele headers hebt verwijderd.
, Vraag 1.1.8: Wat is de Leefbaarometer?
A. De Leefbaarometer is een concept dat wordt gebruikt om de algemene kwaliteit van leven
te evalueren aan de hand van sociale, economische, milieu- en gezondheidsindicatoren. =
De Leefbarometer evalueert de levenskwaliteit in bepaalde gebieden door een breed scala
aan indicatoren te gebruiken. Hieronder vallen indicatoren zoals sociale, economische,
milieu- en gezondheidsfactoren, om inzicht te krijgen in de algehele leefbaarheid en de
kwaliteit van leven van de bewoners in die gebieden.
Vraag 1.1.9: Wat zijn metadata?
D. Is in essentie ‘data over de data’, het zijn gegevens die de data beschrijven. = Metadata
fungeren als 'achtergrondinformatie' voor gegevens. Ze vertellen ons wat gegevens zijn,
waar ze vandaan komen, hoe ze zijn gestructureerd en wat ze betekenen. Hierdoor kunnen
wij deze data beter begrijpen, beheren en gebruiken.
Vraag 1.1.10: Waarom heeft dit Excel bestand zoveel meer rijen dan de eerdere
bestanden waar je mee gewerkt hebt?
A. Het bevat data van alle wijken van heel Nederland in plaats van alleen van Utrecht. =
Correct! De rijen beschrijven de onderzoekseenheden, in dit geval de verschillende wijken
van Nederland. Doordat er in deze Excel file naar alle wijken van Nederland wordt gekeken
zijn hier veel meer rijen.
Vraag 1.1.11: Wat is de modus van een dataset?
B. De modus van een dataset is het getal (of de getallen) dat het vaakst voorkomt in de
dataset.
Vraag 1.1.12: We zagen eerder al dat er buurten met de score ‘0’ voor leefbaarheid in
2018 in onze dataset zitten. Wat betekent die nul?
C. Dit zijn buurten met zeer weinig data/inwoners, waardoor geen zinvol gemiddelde kan
worden berekend en ze dus geen score hebben gekregen.
Vraag 1.1.13: Wat is de modus van de leefbaarheidsscore over alle buurten in Utrecht
in 2018?
9
Vraag 1.1.14: Wat is het gemiddelde van een dataset?
A. Het gemiddelde van een dataset is de som van alle waarden in de dataset gedeeld door
het aantal waarden in de dataset.
Vraag 1.1.15: Wat is het gemiddelde van de leefbaarheidsscore in 2018 over alle
buurten van Utrecht? Rond af op één decimaal en gebruik een punt als decimaal
scheidingsteken (omdat BB Engels is).
6.5
Vraag 1.1.16: Wat is de mediaan van een dataset?
D. De mediaan van een dataset is het middelste getal als je alle getallen in de dataset op
volgorde plaatst.