100% de satisfacción garantizada Inmediatamente disponible después del pago Tanto en línea como en PDF No estas atado a nada 4,6 TrustPilot
logo-home
Resumen

Data Science and Society End Term Summary

Puntuación
-
Vendido
1
Páginas
64
Subido en
02-11-2019
Escrito en
2019/2020

This summary provides an in-depth summary of the lectures, literature, & assignments in the course Data Science and Society.

Institución
Grado

Vista previa del contenido

Data Science & Society
End Term Summary


End Term Design 2

Example Questions 2

Week 5 4
Assignment: Statistics in R (part 2) 4

Week 6 6
Lecture: Natural Language Processing 6
Lecture: NLP Embeddings 11
Assignment: NLP part 1 24
Literature: Computational Linguistics and NLP (Clark et al., 2013) 27

Week 7 40
Lecture: Automated Machine Learning 40
Lecture: Cloud Computing & Spot Pricing 51
ADD MONDAY Assignment: NLP Part 2 56
Literature: AutoML (Hutter et al., 2019) 58

Week 9 62
Lecture: Trends in Data Science & Society 62

,End Term Design
50 questions workshop assignments
Mostly NLP
R/Spark
AutoML
50 questions on literature and lectures
25 questions on NLP
15 questions on AutoML
10 questions on cloud computing



Example Questions
Complete this script by selecting the appropriate command at ____
A. Match
B. Fit (correct)
C. Solve
D. Map

How do contemporary neutral networks generally implement language models?
A. They treat each different word (or at least each different lemma) as a distinct atomic category
B. They use a single hidden layer at each position in a sequence
C. They exploit similarities between words by training feature-based representations of them (correct)
D. They consist of two components, one which models the similarities between words and one which
models the individual probabilities

What does this figure visualise?
A. Linguistic Regression Model
B. Projective Dependency Grammar
C. Social Network Analysis
D. Multi-layered Perception (correct)




A. CFG
B. PCFG (correct)
C. CNF
D. PPDG

Which of the following phrase structure statements (between quotes) is correct?
A. “They” is an NP (noun phrase) (correct)
B. “The garden with flowers” is a PP (prepositional phrase)
C. “Below sea level fish thrive.” is a VP (verb phrase)
2

, D. “Come on!” is a GP (GP is not a thing)

What is Parsing in NLP?
A. The algorithms to automatically...
B. The process of automatically analyzing a given sentence to determine underlying syntactic structures
(correct)
C. ..
D. ..

What is k-means?
A. Clustering Algorithm (correct)
B. Meaning Abstraction Algorithm
C. Document embedding algorithm
D. …

Which Python package did we use to retrieve PubMed abstracts?
A. ..
B. ..
C. Biopython (correct)
D. ..




3

, Week 5
Assignment: Statistics in R (part 2)
In this tutorial, you will learn several things about the popular statistical program R http://www.r-project.com
and about how to perform some of the machine learning possibilities of R and Spark.

Code


install.packages("tidyverse")



Explanation

There are many ways to do data analysis in R. An especially easy way to do your “data
wrangling” is by using the so-called Tidyverse. Since dplyr is not only a function, but a
grammar of data manipulation, the same grammar can work regardless of whether you are
using R directly, or use R to provide Spark with commands.


Code


library(sparklyr)

spark_install(version = "2.1.0")

sc <- spark_connect(master = "local")




Explanation

To use R and Spark, we will make use of a package called sparklyr. If Spark is running, it is
possible to connect to the Spark instance using the function spark_connect(). However, if you
use a local installation, you can install Spark through R, and connect to it immediately


Code


library(nycflights13)

flights = na.omit(flights)

flights_tbl <- copy_to(sc, flights, "flights", overwrite = TRUE)



Explanation


4

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
2 de noviembre de 2019
Número de páginas
64
Escrito en
2019/2020
Tipo
RESUMEN

Temas

$11.17
Accede al documento completo:

100% de satisfacción garantizada
Inmediatamente disponible después del pago
Tanto en línea como en PDF
No estas atado a nada


Documento también disponible en un lote

Conoce al vendedor

Seller avatar
Los indicadores de reputación están sujetos a la cantidad de artículos vendidos por una tarifa y las reseñas que ha recibido por esos documentos. Hay tres niveles: Bronce, Plata y Oro. Cuanto mayor reputación, más podrás confiar en la calidad del trabajo del vendedor.
samoyediran4 Universiteit Utrecht
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
35
Miembro desde
7 año
Número de seguidores
20
Documentos
3
Última venta
1 mes hace

1.0

2 reseñas

5
0
4
0
3
0
2
0
1
2

Documentos populares

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes