Tipología y ciclo de vida de los datos Código:  M2.851    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los materiales de los que dispone la asignatura   Materiales y herramientas de apoyo   Consulta del modelo de evaluación  
ATENCIÓN: Esta información recoge los apartados del plan docente de la asignatura durante el último semestre con docencia. Al iniciar el periodo de matrícula, podrás consultar el calendario y modelo de evaluación para el siguiente semestre en Secretaría/ Matrícula / Horarios pruebas de evaluación final.
Esta asignatura se centra en distintas visiones y dimensiones de los datos. Veremos las principales características de los datos, como por ejemplo los principales tipos y formatos de datos. Veremos también los estándares de metadatos y su uso en el caso de la ciencia de datos.

A continuación hablaremos de las distintas fuentes de datos que podemos encontrar, y que por tanto serán (potencialmente) parte de nuestras fuentes en los procesos de análisis de datos.

Seguidamente veremos los principales métodos para la adquisición y captura de datos, como por ejemplo el web scrapping, el acceso a datos mediante API o SPARQL.

Finalizaremos esta asignatura revisando los procesos relacionados con los datos, tales como la integración, validación, agregación, limpieza de datos, enriquecimiento y procesos ETL.

Amunt

Esta asignatura forma parte del conjunto de asignaturas obligatorias del máster, y se recomienda que sea cursada durante el primer o segundo semestre de estudios.

Amunt

No hacen falta conocimientos previos.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

  • Conocer los distintos tipos de datos con que nos podemos encontrar y saber sus peculiaridades.
  • Ser capaz de identificar las restricciones de privacidad que puedan tener los datos.
  • Conocer qué son los metadatos y los estándares de metadatos más relevantes.
  • Conocer los repositorios de datos más representativos.
  • Ser capaz de extraer datos de distintos orígenes de datos de forma eficiente, mayoritariamente en el contexto web y empresarial.
  • Ser capaz de procesar los datos (validarlos, integrar datos de distintas fuentes, mejorar su calidad, etc.) para su posterior análisis.
  • Ser capaz de definir procesos de Extracción, Transformación y Carga para automatizar el pre-procesamiento de los datos.

Amunt

1. Características de los datos
a. Tipos
b. Formatos
c. Abiertos vs propietarios
d. Metadatos
e. Estándares de metadatos

2. Orígenes de los datos
a. Sistemas de información de empresa
b. Master Data Management
c. Web de datos
d. Internet of Things

3. Adquisición de los datos
a. Web Scrapping
b. API
c. SPARQL

4. Procesamiento de datos
a. Integración
b. Validación
c. Agregación
d. Data cleansing
e. Enriquecimiento mediante metadatos
f. Procesos ETL
g. Análisis

Amunt

  • Minguillon, J. (2016). Fundamentos de Data Science. Editorial UOC.
  • Casas, J and Conesa, J (2016). Datos abiertos y enlazados. Editorial UOC.
  • Moolayil, Jojo (2016). Smarter Decisions - The Intersection of Internet of Things and Decision Science. Packt Publishing Ltd
  • Kristin H. Jarman. The art of data analysis: how to answer almost any question using basic statistics. John Wiley & Sons, Inc.
  • Jason W. Best Practices in Data Cleaning: A Complete Guide to Everything You Need to Do Before and After Collecting Your Data. Osborne. SAGE Publications, Inc.
  • Lawson, Richard (2015). Web Scraping with Python. Packt Publishing Ltd.
  • Mitchell, Ryan (2015). Web Scraping with Python: Collecting Data from the Modern Web. O'Reilly Media, Inc.
  • Simon Munzert, Christian Rubba, Peter Meissner, Dominic Nyhuis. Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining.

!!Pendent revisar!!

Amunt

Esta asignatura sólo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt