100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Tentamen (uitwerkingen)

Data Mining Exam #1 Questions with Latest Update

Beoordeling
-
Verkocht
-
Pagina's
10
Cijfer
A+
Geüpload op
23-02-2025
Geschreven in
2024/2025

Data Mining Exam #1 Questions with Latest Update

Instelling
Data Mining
Vak
Data Mining









Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Geschreven voor

Instelling
Data Mining
Vak
Data Mining

Documentinformatie

Geüpload op
23 februari 2025
Aantal pagina's
10
Geschreven in
2024/2025
Type
Tentamen (uitwerkingen)
Bevat
Vragen en antwoorden

Onderwerpen

Voorbeeld van de inhoud

Data Mining Exam #1 Questions with
Latest Update
co-occurence grouping - Answer-Also known as frequent items mining, association
rule discovery, and market-basket analysis. To find associations between entities
based on transactions involving them.

Examples: Product display, product recommendation, Amazon, etc

Data reduction - Answer-To replace a large data set with a smaller set of data that
contains much of the important information in the large data set. Usually involves
loss of information; trade-off.

Goal of classification: - Answer-find a decision boundary (represented by a model)
that separates one class from the other.

Use of training data - Answer-to find out a model that optimizes a pre-defined
objective

Supervised learning - Answer-training data includes both the input (X) and the target
variable (Y)

Unsupervised learning - Answer-the model is NOT provided with the target variable
(Y) during training

-Classification
-Regression
-Data Reduction - Answer-Supervised Learning Examples:

-Clustering
-Co-occurence Grouping
-Data Reduction - Answer-Unsupervised learning examples

Why CRISP-DM? - Answer-Cross Industry Standard Process for Data Mining

The data mining process must be consistent, reliable and repeatable.

Provides a uniform framework for guidelines, and experience documentation

CRISP-DM process - Answer-Business Understanding
Data Understanding
Data Preparation
Modeling
Evaluation
Deployment

Phase I Business Understanding: - Answer--Understanding the project objectives
and requirements from a business perspective

, -casting the business problem as one or more DM problems and creating a
preliminary plan to achieve the objectives

Phase 2: Data Collection - Answer--Initial Data Collection
-Data are often collected for purposes unrelated to the current business problem.
This is very common in most companies.

-Proceeds with activities aimed at:
Understand the data: relevance, cost and reliability
-Identifying data quality problems

Phases 1 & 2 - Answer-The initial formulation may not be complete or optimal or
feasible, so multiple iterations may be necessary for an acceptable solution
formulation to appear. The goal is a successful data mining formulation to appear.

The goal is a successful data mining formulation that can be solved later by available
data.

Phase 3: Data preparation - Answer-Can take over 90% of the time!

-Covers all activities to construct the final dataset (data that will be fed into the
modeling tool(s) from the initial raw data

Phase 4: Modeling - Answer-Selecting modeling techniques and calibrating their
paramaters

Typically, there are several techniques for the same data mining problem type.

-Generate the test design, and test the model's quality and validity.

Phase 5: Evaluation - Answer--Review process
-Evaluate performance
-choose the right evaluation metric

Phase 6: Deployment - Answer-Determine how the results need to be utilized

-Who needs to use them?
-How often do they need to be utilized?

Data Preparation Steps on Rattle: - Answer-Step 1: Load data and partition data
Step 2: Recognize the correct type of feature
Step 3: Deal with the missing value
Step 4: Transform feature into the correct form
Step 5: Recognize the correct input, target

Validation set: - Answer-used to tune parameters in models. Not all modeling
algorithms need a validation set

Test Set: - Answer-To assess the likely future performance of a model (test data
does not participate in the training or parameter tuning steps)
€13,55
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten


Ook beschikbaar in voordeelbundel

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
lectknancy Boston University
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
283
Lid sinds
2 jaar
Aantal volgers
28
Documenten
25966
Laatst verkocht
1 week geleden

3,6

57 beoordelingen

5
23
4
10
3
11
2
3
1
10

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen