100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Overig

Eindtaak data-analyse

Beoordeling
-
Verkocht
2
Pagina's
20
Geüpload op
23-05-2025
Geschreven in
2024/2025

Dit document is mijn eindtaak voor farmaceutische data-analyse. Hiermee heb ik een 4,5/5 behaald.

Instelling
Vak










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
23 mei 2025
Aantal pagina's
20
Geschreven in
2024/2025
Type
Overig
Persoon
Onbekend

Onderwerpen

Voorbeeld van de inhoud

Assistent: Tiana Poffé




Aurélie Saussus, assistent: Tiana Poffé




FARMACEUTISCHE DATA-ANALYSE


Farmaceutische Wetenschappen




1

, Assistent: Tiana Poffé



Vraag 1

Er zijn 113 observaties (dus 113 verschillende participanten). Om de dataset te kunnen visualiseren
zijn grafieken nuttig, maar daarvoor moet men eerst de variabele “geslacht” labelen voor mannen en
vrouwen
Om een overzicht te geven van de verdeling van geslacht in deze studie heb ik gekozen voor een
taartdiagram.

Deze getallen verkrijgt men op volgende wijze: variable
views > values > sex > values > tabel met value en label >
plusteken > value = 0 en label = vrouw, value = 1 en label
= man > ok. Ik vond het overzichtelijk om hiervoor een
taartdiagram te maken. Dit heb ik gedaan op volgende
wijze: graphs > pie > summaries of groups of cases >
define slices by sex.


Figuur 1: taartdiagram geslacht
Uit figuur 1 kan men afleiden dat er meer mannen dan vrouwen meedoen aan deze studie. Echter,
om dit met zekerheid te besluiten en het exacte aantal mannen en vrouwen in de studie te kennen,
kan men een frequentietabel opstellen:
Deze tabel verkrijgt men op volgende
wijze: analyze > descriptive statistics >
frequencies > variable: sex > display
frequency tables > ok.
Tabel 1: frequentietabel geslacht
Uit tabel 1 kan men aflezen dat er 51 vrouwen (45,1%) en 62 mannen (54,9%) meedoen aan deze
studie, resulterend in een totaal aantal van 113 proefpersonen. De schatting die men gemaakt had
op basis van het taartdiagram dat er meer mannen dan vrouwen meedoen aan de studie klopt dus
wel degelijk.

Vervolgens wil men nagaan hoe de participanten verdeeld zijn qua leeftijd. Hiervoor vond ik het
interessant om eerst de leeftijdscategorieën te visualiseren via een Bar Plot en om dan de
uitschieters te bekijken via een histogram.
Deze figuur krijgt men op volgende
wijze: transform > recode into
different variables > variable: age >
old and new values: young = 0-63y,
average = 64-82y, old = 83-120y.
Dan graphs > chart builder > bar >
simple bar > x-as: agecategory, y-
as: count > ok.

Figuur 2: Bar Plot ‘Agecategory’
De variabele leeftijd is een continue variabele, maar door deze te transformeren wordt dit een
categorische variabele.
Deze leeftijdscategorieën heb ik zo gekozen, omdat uit de gegevens opviel dat er veel participanten
tussen 64 en 82 jaar oud waren.

2

, Assistent: Tiana Poffé




Deze figuur krijgt men op
volgende wijze: graphs >
histogram > variable: age >
display normal curve > ok.




Figuur 3: histogram leeftijd
Uit dit histogram kan men afleiden dat er geen opvallende uitschieters zijn, maar als men dit precies
wil weten, kan men een boxplot uitvoeren, zodat potentiële uitschieters duidelijk worden (zie figuur
4 op volgende bladzijde). Outliers zijn waarnemingen die aanzienlijk verschillen van de rest van de
dataset.
Uit deze histogram kan men ook enkele beschrijvende statistische waarden halen, namelijk het
gemiddelde (mean = 72,36 jaar) en de standaarddeviatie (Std. Dev. = 7,363 jaar). De
standaarddeviatie geeft ons een idee over de afstand van de waarden ten opzichte van het
gemiddelde. Dus kan men concluderen dat de groep vrij oud is en dat de leeftijden redelijk
geconcentreerd zijn rond het gemiddelde.




Een boxplot stelt men op op volgende wijze:
graphs > boxplot > summaries of seperate
variables > box represent = age.




Figuur 4: boxplot leeftijd
Hieruit kan men concluderen dat er drie outliers zijn, namelijk: 54, 84, en 91. Deze waarden liggen
buiten de interkwartielafstand (= IQR = Q3 – Q1), want onze interkwartielafstand heeft 50 als
ondergrens (= Q1 – 1,5 x IQR) en 90 als bovengrens (= Q3 + 1,5 x IQR), waardoor ze als uitschieters
beschouwd kunnen worden. Wel zijn het geen extreme uitschieters.

Ten slotte wil men de variabelen geslacht en leeftijd vergelijken met opleidingsniveau.
Om geslacht te vergelijken met het opleidingsniveau heb ik gekozen voor een Clustered Bar Chart,
omdat dit beide categorische variabelen zijn. Men zou eventueel kunnen kiezen voor een
taartdiagram, maar door het verschil tussen het aantal mannen en vrouwen, is het overzichtelijker
om te kiezen voor Clustered Bar Chart, omdat er dan percentages per geslacht getoond worden in
plaats van absolute aantallen.




3
$37.16
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper
Seller avatar
aureliesaussus

Maak kennis met de verkoper

Seller avatar
aureliesaussus Katholieke Universiteit Leuven
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
4
Lid sinds
3 jaar
Aantal volgers
0
Documenten
4
Laatst verkocht
1 week geleden

0.0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen