Escrito por estudiantes que aprobaron Inmediatamente disponible después del pago Leer en línea o como PDF ¿Documento equivocado? Cámbialo gratis 4,6 TrustPilot
logo-home
Resumen

Summary - Interactive Data Transformation (IDT - Master Information Management

Puntuación
-
Vendido
1
Páginas
33
Subido en
09-11-2023
Escrito en
2021/2022

This summary contains notes from all lectures. Passed my exam thanks to this summary.

Institución
Grado

Vista previa del contenido

Summary - Interactive Data
Transformation - Master Information
Management
Sven van Alem

, Table of contents
1. Lecture 1: DBMS & Relational & SQL............................................................................................... 3
1.1 Database Management Systems ............................................................................................. 3
1.2 Relational Data Model ............................................................................................................. 4
1.3 Single table queries using SQL ................................................................................................. 5
2. Lecture 2: Entity Relationship, and translating from natural .......................................................... 6
2.1 Entity-Relationship Model ....................................................................................................... 6
2.2 Business concepts.................................................................................................................... 6
2.3 Relationships, degrees, and cardinalities ................................................................................ 8
2.4 Generalization and Specialization ........................................................................................... 9
3. Lecture 3: Translating ERD to DB schema & Database Normalization .......................................... 11
3.1 Relational schema ................................................................................................................. 11
3.2 Transforming ERD to Relational schema ............................................................................... 11
3.3 Data Normalization ............................................................................................................... 14
4. Lecture 4: Evolution of data management, big data, and data intensive systems ....................... 16
4.1 Evolution of Data management ............................................................................................ 16
4.2 Big Data Analytics .................................................................................................................. 16
4.3 Reasons for going beyond traditional RDBMS ...................................................................... 17
4.4 Big data .................................................................................................................................. 18
4.5 Storage layer (HDFS) .............................................................................................................. 19
4.6 Computation layer (MapReduce) .......................................................................................... 20
5. Lecture 5: The Spark ecosystem, RDDs, Programming model, and PySpark ................................ 23
5.1 Data flow models................................................................................................................... 23
5.2 Lambda expressions: preliminary material ........................................................................... 23
5.3 Apache spark architecture .................................................................................................... 24
5.4 The programming model: why spark?................................................................................... 25
Lecture 6: Data transformations with SQL, entity recognition, data cleaning tools, etc. ..................... 28
6.1 Processing multiple tables ..................................................................................................... 28
6.2 Views ..................................................................................................................................... 29
6.3 Functions ............................................................................................................................... 29
6.4 Creating & Populating ........................................................................................................... 30
6.5 Data from Websites, Integration & Cleaning, Entity Extraction & resolution....................... 31




2

Escuela, estudio y materia

Institución
Estudio
Grado

Información del documento

Subido en
9 de noviembre de 2023
Número de páginas
33
Escrito en
2021/2022
Tipo
RESUMEN

Temas

$7.65
Accede al documento completo:

¿Documento equivocado? Cámbialo gratis Dentro de los 14 días posteriores a la compra y antes de descargarlo, puedes elegir otro documento. Puedes gastar el importe de nuevo.
Escrito por estudiantes que aprobaron
Inmediatamente disponible después del pago
Leer en línea o como PDF

Conoce al vendedor
Seller avatar
svenvanalem

Conoce al vendedor

Seller avatar
svenvanalem Tilburg University
Seguir Necesitas iniciar sesión para seguir a otros usuarios o asignaturas
Vendido
8
Miembro desde
2 año
Número de seguidores
6
Documentos
9
Última venta
1 año hace

0.0

0 reseñas

5
0
4
0
3
0
2
0
1
0

Documentos populares

Recientemente visto por ti

Por qué los estudiantes eligen Stuvia

Creado por compañeros estudiantes, verificado por reseñas

Calidad en la que puedes confiar: escrito por estudiantes que aprobaron y evaluado por otros que han usado estos resúmenes.

¿No estás satisfecho? Elige otro documento

¡No te preocupes! Puedes elegir directamente otro documento que se ajuste mejor a lo que buscas.

Paga como quieras, empieza a estudiar al instante

Sin suscripción, sin compromisos. Paga como estés acostumbrado con tarjeta de crédito y descarga tu documento PDF inmediatamente.

Student with book image

“Comprado, descargado y aprobado. Así de fácil puede ser.”

Alisha Student

Preguntas frecuentes