100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Summary Data Mining endterm

Beoordeling
-
Verkocht
3
Pagina's
27
Geüpload op
14-04-2017
Geschreven in
2016/2017

Samenvatting voor het tweede deel van Data Mining. Deels uit het boek Introduction to Data Mining.









Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
Onbekend
Geüpload op
14 april 2017
Aantal pagina's
27
Geschreven in
2016/2017
Type
Samenvatting

Voorbeeld van de inhoud

Data Mining
Clustering
Cluster analysis:
Finding groups of objects such that the objects in a group will be similar (or related) to one
another and different from (or unrelated to) the objects in other groups.
 Intra-cluster (binnen de cluster) distances are minimized
 Inter-cluster (tussen de clusters) distances are maximized

Applications of Cluster Analysis:
Understanding: group related documents for browsing, group genes and proteins that have
similar functionality, or group stocks with similar price fluctuations.
Summarization: reduce the size of large data sets

What is not Cluster Analysis?
 Supervised classification: have class label information
 Simple segmentation: dividing students into different registration groups
alphabetically, by last name
 Results of a query: groupings are a result of an external specification
 Graph partitioning: some mutual relevance and synergy, but areas are not identical

Types of Clusterings:
- A clustering is a set of clusters
- Important distinction between hierarchical and
partitional sets of clusters
- Partitional clustering:
A division data objects into non-overlapping subsets
(clusters) such that each data object is in exactly one
subset.
- Hierarchical clustering
A set of nested clusters organized as a hierarchical tree
Other distinctions between Sets of Clusters:
Exclusive vs. non-exclusive:
 In non-exclusive clusterings, points may belong to
multiple clusters.
 Can represent multiple classes or ‘border’ points
Fuzzy vs. non-fuzzy:
 In fuzzy clustering, a point belongs to every cluster with
some weight between 0 and 1
 Weights must sum to 1
 Probabilistic clustering has similar characteristics
Partial vs. complete:
 In some cases, we only want to cluster some of the data
Heterogeneous vs. homogeneous:
 Cluster of widely different sizes, shapes and densities
€5,49
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper
Seller avatar
veronners

Maak kennis met de verkoper

Seller avatar
veronners Radboud Universiteit Nijmegen
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
6
Lid sinds
8 jaar
Aantal volgers
5
Documenten
6
Laatst verkocht
1 jaar geleden

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen