- Vragen over confusion matrix: accuracy, recall, specificiteit?
- Dendrogram tekenen
- Wanneer zou je een ward methode met k-means verkiezen boven hierachial clustering
- Wanneer zou je ene PCA verkiezen boven t-SNN
- Verband out of bag performance en K-fold cross validation
--> een is hoger dan andere of zoiets
- Vragen over ROC curve: hoe ziet deze eruit bij random assignment, waneer alles fout wordt
geclassificeerd?
- Vraag over type II fout, als je positief en negatief samples hebt (negatief = true statement,
positief = false statement) waarbij de false statements worden verwijdert, wat gebeurdt er dan
bij een type II error
à ik heb aangeduid dat een false statement als true wordt gezien
- Practicum: PCA, niet zo moeilijk hebben we gedaan in de les
- Hoe komt het dat neural networks moeilijkere classificaties kunnen oplossen
à door hidden layers (heb ik aangeduid)
à door regognition of complex patterns (misschien)
- Wat bepaald de treshold in een logistic regression classifier
--> y-value
à beta weights
à de e macht
à ..
- Welk voorbeeld zal niet neigen naar overfitting (5 keuze’s)
Exam questions advanced data analysis 2021-2022 open boek
1. Berekenen van accuracy, recall, specificiteit, alle positieve gevallen dmv een confusion
matrix.
Pg 12/16 gescaned doc & kijk doc zelf gemaakte confusion matrix & berekeningen!!
2. Wanneer zou je een ward methode met k-means verkiezen boven hierarchical
clustering? (misschien niet goed onthouden)
FOUT ONTHOUDEN KIJK HELEMAAL ONDERAAN DIT DOCUMENT VOOR
JUIST VRAAG + JUISTE ANTWOORD!!
,3. Wanneer zou je een PCA verkiezen boven t-SNE?
a. Als je de analyse nadien op een independent dataset moet doen fout denk
antwoord:
Pg 31/66 niet-stuvia doc & pg 51/109 stuvia doc & pp 4, slide 31/36
,