Escrito por estudiantes que aprobaron Inmediatamente disponible después del pago Leer en línea o como PDF ¿Documento equivocado? Cámbialo gratis 4,6 TrustPilot
logo-home
Examen

CS-7643 Quiz 4 Exam – Deep Learning Optimization & Regularization Study Guide

Puntuación
5.0
(1)
Vendido
4
Páginas
9
Grado
A+
Subido en
06-11-2025
Escrito en
2025/2026

CS-7643 Quiz 4 Exam – Deep Learning Optimization & Regularization Study Guide

Institución
CS-7643
Grado
CS-7643

Vista previa del contenido

CS-7643 Quiz 4 Exam – Deep Learning Optimization & Regularization Study Guide




Embedding - (ANSWER)A learned map from entities to vectors that encodes similarity



Graph Embedding - (ANSWER)Optimize the objective that connected nodes have more similar
embeddings than unconnected nodes.



Task: convert nodes to vectors



- effectively unsupervised learning where nearest neighbors are similar

- these learned vectors are useful for downstream tasks



Multi-layer Perceptron (MLP) pain points for NLP - (ANSWER)- Cannot easily support variable-sized
sequences as inputs or outputs

- No inherent temporal structure

- No practical way of holding state

- The size of the network grows with the maximum allowed size of the input or output sequences



Truncated Backpropagation through time - (ANSWER)- Only backpropagate a RNN through T time steps



Recurrent Neural Networks (RNN) - (ANSWER)h(t) = activation(U*input + V*h(t-1) + bias)

y(t) = activation(W*h(t) + bias)



- activation is typically the logistic function or tanh

- outputs can also simply be h(t)

- family of NN architectures for modeling sequences



Training Vanilla RNN's difficulties - (ANSWER)- Vanishing gradients

- Since dx(t)/dx(t-1) = w^t

- if w > 1: exploding gradients

, CS-7643 Quiz 4 Exam – Deep Learning Optimization & Regularization Study Guide




- if w < 1: vanishing gradients



Long Short-Term Memory Network Gates and States - (ANSWER)- f(t) = forget gate

- i(t) = input gate

- u(t) = candidate update gate

- o(t) = output gate



- c(t) = cell state

- c(t) = f(t) * c(t - 1) + i(t) * u(t)



- h(t) = hidden state

- h(t) = o(t) * tanh(c(t))



Perplexity(s) - (ANSWER)= product( 1 / P(w(i) | w(i-1), ...) ) ^ (1 / N)

= b ^ (-1/N sum( log(b) (P(w(i) | w(i-1), ...) ) )

- note exponent of b is per word CE loss

- perplexity of a discrete uniform distribution over k events is k



Language Model Goal - (ANSWER)- estimate the probability of sequences of words

- p(s) = p(w1, w2, ..., wn)



Masked Language Modeling - (ANSWER)- pre-training task - an auxiliary task different from the final task
we're really interested in, but which can help us achieve better performance finding good initial
parameters for the model



- By pre-training on masked language modeling before training on our final task, it is usually possible to
obtain higher performance than by simply training on the final task



Knowledge Distillation to Reduce Model Sizes - (ANSWER)- Have fully parameterized teacher model

Escuela, estudio y materia

Institución
CS-7643
Grado
CS-7643

Información del documento

Subido en
6 de noviembre de 2025
Número de páginas
9
Escrito en
2025/2026
Tipo
Examen
Contiene
Preguntas y respuestas

Temas

$21.49
Accede al documento completo:

¿Documento equivocado? Cámbialo gratis Dentro de los 14 días posteriores a la compra y antes de descargarlo, puedes elegir otro documento. Puedes gastar el importe de nuevo.
Escrito por estudiantes que aprobaron
Inmediatamente disponible después del pago
Leer en línea o como PDF


Documento también disponible en un lote

Reseñas de compradores verificados

Se muestran los comentarios
2 meses hace

5.0

1 reseñas

5
1
4
0
3
0
2
0
1
0
Reseñas confiables sobre Stuvia

Todas las reseñas las realizan usuarios reales de Stuvia después de compras verificadas.

Conoce al vendedor

Seller avatar
Los indicadores de reputación están sujetos a la cantidad de artículos vendidos por una tarifa y las reseñas que ha recibido por esos documentos. Hay tres niveles: Bronce, Plata y Oro. Cuanto mayor reputación, más podrás confiar en la calidad del trabajo del vendedor.
Belaire Teachme2-tutor
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
2779
Miembro desde
1 año
Número de seguidores
1
Documentos
1353
Última venta
1 día hace

5.0

502 reseñas

5
487
4
12
3
3
2
0
1
0

Documentos populares

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes