Samenvatting BIG DATA
1. HC 1: Focus op volksgezondheid
Big data = passieve dataverzameling en opslag, resulterend in de analyse van datasets die te groot en
te complex zijn om standaardmethoden te gebruiken.
- 3V’s: Volume, variety, velocity
- Methoden data verzameling
o Statussen/medische dossiers
o Registraties
o Mobiele applicaties (apps)
o Versnellingsmeter in smartphones en/of wearables
o Diverse databases, bv luchtverontreiniging, weersomstandigheden, internet
zoekgegevens.
Je hebt meer data waardoor je niet een normale statistiek over heen kan doen. Keuzes maken welke
bron van data het meest betrouwbaar is, maar je kunt ook data gaan koppelen.
Hierdoor kun je complexe interacties onderzoeken, maar is natuurlijk ook complex welke dat je dus
gaat kiezen.
Aanleiding: zoektocht naar nieuwe manieren voor verzamelen individuele en macro-level data.
- De bereidheid van mensen om mee te doen aan wetenschappelijk onderzoek neemt sterk af
per jaar → minder mensen maakt het moeilijker om wetenschappelijke vragen te
beantwoorden.
- Soms niet haalbaar om benodigde gegevens betrouwbaar te verzamelen met traditionele
methoden (denk daarbij aan voeding, lichamelijke activiteit)
o Voeding makkelijker bij te houden met apps
- Noodzaak voor (bijna) real-time data verzameling (“now-casting”)
o Onderzoek ziekte uitbraken
Traditionele methoden dataverzameling:
- Interviews:
o Face-to-face
o Telefonisch
- Vragenlijst
o Papier
o Digitaal
- Statussen/medische dossiers
- Registraties
, Big data methoden data verzameling
- Medische sociale netwerk sites
o PatientsLikeMe.com (wordt in de praktijk al gebruik)
▪ Status updates: ziektestatus, symptomen en klachten, behandeling, kwaliteit
van leven, gewicht.
▪ Gekoppeld met ClinicalTrails.gov
- Twitter: risicogedrag, symptomen, medicatiegebruik
- Profielen sociale netwerken: risicogedrag, relaties, houdingen
- Blogs: gedetailleerde informatie over allerlei onderwerpen
- Mobiele applicaties (apps)
- Registraties
- Geografische informatie in posts of speciale apps: mobiliteit, activiteiten, ziekteuitbraken.
- ResearchKit
o Tool waarmee data kan worden verzameld bij iPhone gebruikers
o Frequentere data verzameling
o Accuratere representatie van de populatie
o Mensen monitoren op grote schaal
o Informed consent
- Medische dossiers
o Systematische documentatie van de medische geschiedenis van individuele patiënt
en zorg over de tijd gezien vanuit een enkele zorgverlener
o Zowel systematische geregistreerde gegevens en open tekst.
o Vaak gedigitaliseerd, soms met specifieke modules voor onderzoek
o Ontwikkeling van persoonlijke gezondheidsdossiers (PGDs)
- Wearables: apparaatjes die je kan dragen die lichaamsparameters meten.
o worden getest in een ziekenhuis of op die manier de metingen van 6 vitale functies
beter zijn dan dat alles 4x per dag gemeten wordt.
o Uitdagingen van wearables
▪ Beschikbaarheid van goedgekeurde wearables
▪ Batterijduur wearables
▪ Selectiebias
▪ Statistische analyses
- Diverse databases, bijv.: luchtverontreiniging, weersomstandigheden, internet
zoekgegevens.
In de figuur is zichtbaar dat de zwarte lijnen de mensen zijn die griep hebben gekregen en het rode
lijntje is trend waarin mensen gegoogled hebben over griepsymptomen. Hierdoor is er sneller inzicht
1. HC 1: Focus op volksgezondheid
Big data = passieve dataverzameling en opslag, resulterend in de analyse van datasets die te groot en
te complex zijn om standaardmethoden te gebruiken.
- 3V’s: Volume, variety, velocity
- Methoden data verzameling
o Statussen/medische dossiers
o Registraties
o Mobiele applicaties (apps)
o Versnellingsmeter in smartphones en/of wearables
o Diverse databases, bv luchtverontreiniging, weersomstandigheden, internet
zoekgegevens.
Je hebt meer data waardoor je niet een normale statistiek over heen kan doen. Keuzes maken welke
bron van data het meest betrouwbaar is, maar je kunt ook data gaan koppelen.
Hierdoor kun je complexe interacties onderzoeken, maar is natuurlijk ook complex welke dat je dus
gaat kiezen.
Aanleiding: zoektocht naar nieuwe manieren voor verzamelen individuele en macro-level data.
- De bereidheid van mensen om mee te doen aan wetenschappelijk onderzoek neemt sterk af
per jaar → minder mensen maakt het moeilijker om wetenschappelijke vragen te
beantwoorden.
- Soms niet haalbaar om benodigde gegevens betrouwbaar te verzamelen met traditionele
methoden (denk daarbij aan voeding, lichamelijke activiteit)
o Voeding makkelijker bij te houden met apps
- Noodzaak voor (bijna) real-time data verzameling (“now-casting”)
o Onderzoek ziekte uitbraken
Traditionele methoden dataverzameling:
- Interviews:
o Face-to-face
o Telefonisch
- Vragenlijst
o Papier
o Digitaal
- Statussen/medische dossiers
- Registraties
, Big data methoden data verzameling
- Medische sociale netwerk sites
o PatientsLikeMe.com (wordt in de praktijk al gebruik)
▪ Status updates: ziektestatus, symptomen en klachten, behandeling, kwaliteit
van leven, gewicht.
▪ Gekoppeld met ClinicalTrails.gov
- Twitter: risicogedrag, symptomen, medicatiegebruik
- Profielen sociale netwerken: risicogedrag, relaties, houdingen
- Blogs: gedetailleerde informatie over allerlei onderwerpen
- Mobiele applicaties (apps)
- Registraties
- Geografische informatie in posts of speciale apps: mobiliteit, activiteiten, ziekteuitbraken.
- ResearchKit
o Tool waarmee data kan worden verzameld bij iPhone gebruikers
o Frequentere data verzameling
o Accuratere representatie van de populatie
o Mensen monitoren op grote schaal
o Informed consent
- Medische dossiers
o Systematische documentatie van de medische geschiedenis van individuele patiënt
en zorg over de tijd gezien vanuit een enkele zorgverlener
o Zowel systematische geregistreerde gegevens en open tekst.
o Vaak gedigitaliseerd, soms met specifieke modules voor onderzoek
o Ontwikkeling van persoonlijke gezondheidsdossiers (PGDs)
- Wearables: apparaatjes die je kan dragen die lichaamsparameters meten.
o worden getest in een ziekenhuis of op die manier de metingen van 6 vitale functies
beter zijn dan dat alles 4x per dag gemeten wordt.
o Uitdagingen van wearables
▪ Beschikbaarheid van goedgekeurde wearables
▪ Batterijduur wearables
▪ Selectiebias
▪ Statistische analyses
- Diverse databases, bijv.: luchtverontreiniging, weersomstandigheden, internet
zoekgegevens.
In de figuur is zichtbaar dat de zwarte lijnen de mensen zijn die griep hebben gekregen en het rode
lijntje is trend waarin mensen gegoogled hebben over griepsymptomen. Hierdoor is er sneller inzicht