100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4.2 TrustPilot
logo-home
Notas de lectura

Data Mining summary Master Data Science & Society

Puntuación
-
Vendido
-
Páginas
53
Subido en
25-03-2025
Escrito en
2024/2025

Summary Data Mining from the Master Data Science & Society

Institución
Grado











Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
25 de marzo de 2025
Archivo actualizado en
27 de marzo de 2025
Número de páginas
53
Escrito en
2024/2025
Tipo
Notas de lectura
Profesor(es)
Dr. gonzalo nápoles
Contiene
Todas las clases

Temas

Vista previa del contenido

Contents
Week 1.........................................................................................................2
Week 2.......................................................................................................10
Week 3.......................................................................................................16
Week 4.......................................................................................................25
Week 5.......................................................................................................32
Week 6.......................................................................................................43
Week 7.......................................................................................................51

,Week 1
Goal lecture 1: We will discuss how to deal with missing values, how to
compute the correlation/association between two features, methods to
encode categorical features and handle class imbalance.

Feature = numerical variable (column)

Instances = rows

There are 3 ways to handle missing values:

1. Remove the problem feature containing missing values.
Recommended when there are many missing values for that feature
(not advised)
2. Remove the instances containing missing values. Recommended
when there are many missing values for that feature (not advised)
3. The most popular: replacing the missing values for a given feature
with a representative value such as the mean, the median or the
mode of that feature

But there are also machine learning models that are trained on the non-
missing information!

Autoencoders are deep neural networks that involve two neural blocks
named encoder and decoder.

- The encoder reduces the problem dimensionality
- The decoder completes the pattern.




Feature scaling (so that each feature is In the same
scale)

Normalization

,It allows encoding all numeric features in the [0,1] scale.




Standardization

Similar to the normalization, but the transformed
values might not be in the [0,1] interval.




Correlation between two numerical values

Pearson’s correlation is used when we want to determine the
correlation between two numerical variables given k observations. Only
when the value lies between [-1,1]




Example:

Mean x: 20.67

Mean y: 234,44

Do for each x – xmean and for each y –
ymean. sum all x and y differences and
multiply.

, Association between two categorical (ordinal or nominal) variables

X2 assocation measure is used when we want to measure the
association between two categorical variables given k observations.

Step 1 to make a contingency table:




Step 2:

The expected value is the multiplication of the
individual frequencies divided by the number of
observations.

Example:
$7.87
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada

Conoce al vendedor

Seller avatar
Los indicadores de reputación están sujetos a la cantidad de artículos vendidos por una tarifa y las reseñas que ha recibido por esos documentos. Hay tres niveles: Bronce, Plata y Oro. Cuanto mayor reputación, más podrás confiar en la calidad del trabajo del vendedor.
Lisette17 Hogeschool InHolland
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
38
Miembro desde
4 año
Número de seguidores
21
Documentos
30
Última venta
1 mes hace

3.8

5 reseñas

5
2
4
1
3
1
2
1
1
0

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes