100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4.2 TrustPilot
logo-home
Notas de lectura

Alle lectures content Data Mining for Businnes & Governance

Puntuación
-
Vendido
1
Páginas
51
Subido en
20-03-2024
Escrito en
2023/2024

Document containing all the information for the Data Mining for Business & Governance course. This course is given in spring 2024.

Institución
Grado











Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
20 de marzo de 2024
Número de páginas
51
Escrito en
2023/2024
Tipo
Notas de lectura
Profesor(es)
Dr gonzalo nápoles
Contiene
Todas las clases

Temas

Vista previa del contenido

Module 1: Introductory Concepts
Missing values:
- Sometimes, we have instances that have missing values for some features.
- It is of paramount importance to deal with this situation before building any machine
learning or data mining model.
- Missing values might result from fields that are not always applicable, incomplete
measurements, lost values.

Imputation strategies for missing values
- The simplest strategy would be to remove the feature containing missing values. This
strategy is recommended when the majority of the instances have missing values for
that feature.
o However: There are situations in which we have a few features or the feature
we want to remove is deemed relevant.
- If we have scattered missing values and few features, we might want to remove the
instances having missing values.
o However: There are situations in which we have a limited number of
instances.
- The third strategy is the most popular. It consists of replacing the missing values for a
given feature with a representative value such as the mean, the median or the mode
of that feature.
o However: We need to be aware that we are introducing noise.
- Fancier strategies include estimating the missing values with a machine learning
model trained on the non-missing information.
o Remark: More about missing values will be covered in Statistics course.


Normalization




Between 0-1

,Standardization




With boundaries


Normalization vs Standardization




Correlation (question part of exam)

,X2 association measure




Symbolic feature = categorical feature like eye color

, Encoding categorical features
Some machine learning, data mining algorithms or platforms cannot operate with categorical
features → therefore we need to encode these features as numerical quantities.

1 Label encoding
- Assigning integer numbers to each category. It only makes sense if there is an ordinal
relationship among the categories.
o For example: Weekdays, months, rating etc.
2 One-hot encoding




Class imbalance
More accurate if you predict with the blue feature because of the more frequency.
$7.18
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada

Conoce al vendedor
Seller avatar
matsvandersteen

Conoce al vendedor

Seller avatar
matsvandersteen Tilburg University
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
1
Miembro desde
1 año
Número de seguidores
0
Documentos
1
Última venta
5 meses hace

0.0

0 reseñas

5
0
4
0
3
0
2
0
1
0

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes