100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting Data Sience (python + statistiek)

Beoordeling
2,0
(1)
Verkocht
1
Pagina's
60
Geüpload op
04-01-2023
Geschreven in
2021/2022

Dit is een nette en ordelijke samenvatting van een uitgebreide cursus, voornamelijk theorie. In deze samenvatting zit zowel statistiek als python verwerkt. Wat Data Science nu net is lees je hieronder! Datawetenschap, vaak ook onvertaald in het Engels: data science, is een interdisciplinair onderzoeksveld met betrekking tot wetenschappelijke methoden, processen en systemen om kennis en inzichten te onttrekken uit data. Datawetenschap is een concept om statistieken, data-analyse en aanverwante methoden te verenigen.

Meer zien Lees minder











Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
4 januari 2023
Aantal pagina's
60
Geschreven in
2021/2022
Type
Samenvatting

Voorbeeld van de inhoud

THEORI DATA SIENCE
E



Deel 1




INLEIDING
 Data Sience draait rond het werken met en het analyseren van “data” = gegevens

Waarom?
 Data scientist als carrière
 Als IT-er ondersteun je de business
o Veel data zit in databanken
o Meer en meer real-time data
o Noodzaak om trends, verbanden, .. te zoeken in data om aan de beslissingsnemers business
relevante informatie op te leveren
 Als IT-er heb je zelf behoefte aan informatie
 Als IT-er bied je services aan, aan je interne en externe klanten of gebruikers
 Als IT-er dien je de IT services geleverd door jou IT-leveranciers op te volgen



SITUERING

WAT IS DATA?
 Data type
o Transactionele data
 veranderd voortdurend en betreft dagdagelijkse businessactiviteiten
 beschrijft gebeurtenissen
o Master data
 data die niet vaak verandert en wordt door de business steeds op dezelfde manier
gebruikt
o Analytische data
 date over de performantie van de business




[NAAM VAN AUTEUR] 1

, Soort data
o Structured data
 Georganiseerd
 vooraf gedefinieerd data model
 Informatie in rijen en kolommen
 makkelijke tocumegang en gebruik
 Efficiënt om te analyseren
 naam of adres van een klant

o Unstructured data
 ongeorganiseerd – onsamenhangend en verspreid
 niet vooraf gedefinieerd data model
 moeilijke toegang en gebruik
 preprocessing vooraleer het kan gebruikt worden in de analyse

 Nieuwe opdelingen van data
o ‘schema-then-capture’-data
 hierbij wordt eerst bepaald welke data men nodig heeft voor een analyse om
vervolgens deze data te gaan verzamelen

o ‘capture-first-ask-question-later’-date
 hierbij wordt data verzameld om achteraf te kijken welke vragen/analyses men met
deze data zou kunnen beantwoorden

o streaming data
o static data

o attitudinal data
 weerspiegelen het belang dat een klant hecht aan bepaalde eigenschappen van
aangeboden producten en diensten
 Hoe voelt een klant zich?

o behavioural data
 omvat onder andere het koopgedrag en merkvoorkeur van consumenten en wordt
gebruikt om promotiecampagne uit te werken
 Wat doet een klant?

o demographic data
 data die sociaaleconomisch van aard is, zoals de populatie, ras, inkomen onderwijs
en werkgelegenheid, die specifieke geografische locaties vertegenwoordigen en vaak
geassocieerd is met de tijd
 Wie is de klant?




[NAAM VAN AUTEUR] 2

,  Big data
o datasets met een omvang ie buiten het vermogen vallen
o 3V-model
 het dient aan 2 van de 3 eigenschappen te voldoen
 een hoge data velocity
o de snelheid waaraan data gegenereerd, gecapteerd en/of afgeleverd
wordt
 een groot volume
 een grote variëteit
o diversiteit, data komt van vele verschillende bronnen en zit in
meerdere databanken in niet uniforme vormen
o De essentie van wat ‘big data’ is, komt neer op het feit dat
gewone of gebruikelijke dataverwerking er niet op
toegepast kan worden

 Smart data
o niet altijd valide
o kan onvolledig zijn
o kan inconsistenties bevatten
o data enrichment/management
 de selectie (capteren, verzamelen), opkuisen / zuiveren (verifiëren, valideren
corrigeren), verwerking (classificeren, transformeren) en voorbereiding (in juiste
formaat zetten) van data om te komen tot smart data is arbeids- en tijdsintensief
o de selectie zorgt voor relevante data
o opkuisen / zuiveren zorgt voor correcte data
o het verwerken en voorbereiden zorgt voor computer verwerkbare data


WAT ZIJN MEETSCHALEN? / WAT ZIJN MEETNIVEAUS?
 Verschillende soorten ruwe data
 De soort bepaald wat je al dan niet wiskundig met de data kan doen
 Deze soorten zijn meetniveaus, maar worden ook wel meetschalen genoemd

 Meetniveaus
o kwalitatieve
 kan niet worden uitgedrukt in getallen
 bepaald meestal een categorie
o kwantitatieve
 wordt voorgesteld door getallen

 Kwalitatieve gegevens
o nominaal
 iedere waarde is een omschrijving (String)
 onderscheidingsvermogen
 man-vrouw




[NAAM VAN AUTEUR] 3

,  afstudeerrichting
 groenten


o ordinaal
 iedere waarde is een omschrijving (String)
 onderscheidingsvermogen
 er bestaat een grootte orde
 natuurlijke ordening
o rangen in het leger
o tevredenheidsscores

 Kwantitatieve gegevens
o interval
 iedere waarde is een getal
 onderscheidingsvermogen
 er bestaat een grootte orde
 er is een meeteenheid
 je kan enkel over verschillen spreken
 negatieve getallen zijn ook mogelijk
 ofwel bestaat er een meetinstrument (thermometer) ofwel is er een “fysieke” eenheid
dat geteld kan worden (euro’s)
o ratio
 iedere waarde is een getal
 onderscheidingsvermogen
 er bestaat een grootte orde
 er is een meeteenheid
 er is een absoluut nulpunt
 je kan ook over verhoudingen spreken
 negatieve getallen zijn niet mogelijk
 temperatuur in Kelvin
 aantal liter geproduceerde wijn

 Verschillende meetschalen
o een eigenschap kan op vier verschillende meetniveaus, ook wel meetschalen genoemd,
gemeten worden
o een meetniveau of meetschaal wordt gedefinieerd aan de hand van de aanwezigheid of
afwezigheid van vier karakteristieken
 onderscheidingsvermogen
 indien het verschillende getallen aan verschillende waarden van de
eigenschap toekent
 grootteorde
 indien grotere getallen een grotere aanwezigheid van de eigenschap
weergeven
 meeteenheid
 aanwezig indien gelijke verschillen tussen getallen eenzelfde verschil in de
eigenschap weergeven
 absoluut nulpunt
 wanneer het getal 0 de afwezigheid van de eigenschap weergeeft




[NAAM VAN AUTEUR] 4

Beoordelingen van geverifieerde kopers

Alle reviews worden weergegeven
2 jaar geleden

2,0

1 beoordelingen

5
0
4
0
3
0
2
1
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
anouckcelis Thomas More Hogeschool
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
15
Lid sinds
2 jaar
Aantal volgers
6
Documenten
22
Laatst verkocht
2 maanden geleden

2,5

2 beoordelingen

5
0
4
0
3
1
2
1
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen