100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4.2 TrustPilot
logo-home
Resumen

Summary Data Mining classification (1+2) + solutions exercises

Puntuación
-
Vendido
-
Páginas
10
Subido en
04-08-2023
Escrito en
2022/2023

Dit document bevat een samenvatting van de theorie die doorlopen werd tijdens deze labsessie. Daarnaast staan er op het einde van het document oplossingen van de labsessies.

Institución
Grado









Ups! No podemos cargar tu documento ahora. Inténtalo de nuevo o contacta con soporte.

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
4 de agosto de 2023
Número de páginas
10
Escrito en
2022/2023
Tipo
Resumen

Temas

Vista previa del contenido

Classification 1
lag1, lag2,…,lag5: percentage return for each of the five previous trading days

volume: number of shares traded on previous day

today: percentage return on data in question

direction: whether the market was Up or Down on this data

cor(): produces matrix containing all of correlations among the predictors




Here error because “direction” variable is qualitative

Correlations between the lags and today’s returns close to zero => little correlation

Year and volume: substantial correlation

glm(): fits linear models that includes logistic regression (similar to lm() except: family = binomial)

Lag1

 smallest p-value
 negative coefficient: if
market had positive return
yesterday, then less likely to
go up today
 0.15: no clear evidence of
association between Lag1
and direction

, coef(): access coefficients

summary(): access specific aspects of fitted model




predict(): can be used for the probability that the market will go up, given values of predictors

type = “response”: tells R to output probabilities of the form P(Y=1|X)

contrasts(): indicates that R has created a dummy variable




Vector of class predictions based on whether predicted probability of a market increase is greater
than or less than 0.5:




First command: creates vector of 1,250 Down elements

Second command: transforms to Up all of elements for which predicted probability of

market increase exceeds 0.5

table(): produces a confusion matrix



Diagonal elements: correct predictions

Off-diagonal elements: incorrect

Training error rate: 100 – 52.2 = 47.8%
$4.18
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada

Conoce al vendedor
Seller avatar
Worstje2021
5.0
(1)

Documento también disponible en un lote

Conoce al vendedor

Seller avatar
Worstje2021 Universiteit Gent
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
7
Miembro desde
2 año
Número de seguidores
5
Documentos
13
Última venta
1 año hace

5.0

1 reseñas

5
1
4
0
3
0
2
0
1
0

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes