Tipología y ciclo de vida de los datos Código:  M2.851    Créditos:  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los materiales que dispone la asignatura   Materiales y herramientas de apoyo   Metodología   Consulta del modelo de evaluación   Evaluación Contínua   Evaluación final   Feedback  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Esta asignatura se centra en distintas visiones y dimensiones de los datos. Veremos las principales características de los datos, como por ejemplo los principales tipos y formatos de datos. Veremos también los estándares de metadatos y su uso en el caso de la ciencia de datos.

A continuación hablaremos de las distintas fuentes de datos que podemos encontrar, y que por tanto serán (potencialmente) parte de nuestras fuentes en los procesos de análisis de datos.

Seguidamente veremos los principales métodos para la adquisición y captura de datos, como por ejemplo el web scrapping, el acceso a datos mediante API o SPARQL.

Finalizaremos esta asignatura revisando los procesos relacionados con los datos, tales como la integración, validación, agregación, limpieza de datos, enriquecimiento y procesos ETL.

 

Amunt

Esta asignatura forma parte del conjunto de asignaturas obligatorias del máster, y se recomienda que sea cursada durante el primer o segundo semestre de estudios.

Amunt

No hacen falta conocimientos previos.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

Competencias básicas

  • Saber aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • Adquirir las habilidades de aprendizaje que permitan continuar estudiando de manera auto-dirigida o autónoma.
  • Adquirir la capacidad para extraer, interpretar y analizar los datos de distintos entornos.
  • Adquirir la capacidad de búsqueda, gestión y uso de la información y los recursos en el ámbito de la ciencia de datos.

Competencias transversales

  • Adquirir la capacidad de iniciativa, automotivación y trabajo de forma independiente.
  • Adquirir la capacidad de comunicación oral y escrita para la vida académica y profesional.
  • Adquirir la capacidad para proponer soluciones innovadores y tomar decisiones.
  • Adquirir la capacidad para trabajar en equipos multidisciplinares.

Competencias específicas

  • Adquirir la destreza necesaria para la manipulación de datos, conversión de formatos y almancenamiento de los mismos.
  • Aprender el uso avanzado de las herramientas de software estadístico adecuadas para los distintos problemas de modelización, análisis y visualización de datos.
  • Aprender a capturar datos de distintas fuentes de datos (tales como redes sociales, web de datos o repositorios) y mediante diferentes mecanismos (tales como queries, API y scraping).
  • Saber actuar con los principios éticos y legales relacionados con la manipulación de datos en función del ámbito de aplicación.

Objetivos específicos

  • Conocer los distintos tipos de datos con que nos podemos encontrar y saber sus peculiaridades.
  • Ser capaz de identificar las restricciones de privacidad que puedan tener los datos.
  • Conocer qué son los metadatos y los estándares de metadatos más relevantes.
  • Conocer los repositorios de datos más representativos.
  • Ser capaz de extraer datos de distintos orígenes de datos de forma eficiente, mayoritariamente en el contexto web y empresarial.
  • Ser capaz de procesar los datos (validarlos, integrar datos de distintas fuentes, mejorar su calidad, etc.) para su posterior análisis.
  • Ser capaz de definir procesos de Extracción, Transformación y Carga para automatizar el pre-procesamiento de los datos.

Amunt

1. Características de los datos
a. Tipos
b. Formatos
c. Abiertos vs propietarios
d. Metadatos
e. Estándares de metadatos

2. Orígenes de los datos
a. Sistemas de información de empresa
b. Master Data Management
c. Web de datos
d. Internet of Things

3. Adquisición de los datos
a. Web Scrapping
b. API
c. SPARQL

4. Procesamiento de datos
a. Integración
b. Validación
c. Agregación
d. Data cleansing
e. Enriquecimiento mediante metadatos
f. Procesos ETL
g. Análisis

Amunt

Material Soporte
Espacio de recursos de ciencia de datos Web

Amunt

Los recursos de aprendizaje se agrupan en los siguientes bloques:

Bloque 1: Preliminares

  • Minguillon, J. (2016). Fundamentos de Data Science. Editorial UOC.
  • Casas, J and Conesa, J (2016). Datos abiertos y enlazados. Editorial UOC.

Bloque 2: Web Scraping

  • Lawson, Richard (2015). Web Scraping with Python. Packt Publishing Ltd.
  • Mitchell, Ryan (2015). Web Scraping with Python: Collecting Data from the Modern Web. O'Reilly Media, Inc.
  • Simon Munzert, Christian Rubba, Peter Meissner, Dominic Nyhuis. Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining. ISBN: 978-1-118-83481-7, 474 pages, December 2014.

Bloque 3: Limpieza y validación de datos

  • Guitart, I (2017). Sistemes d'informació d'empresa. Material UOC.
  • Moolayil, Jojo (2016). Smarter Decisions - The Intersection of Internet of Things and Decision Science. Packt Publishing Ltd
  • Jarman, Kristin H (2013) The art of data analysis: how to answer almost any question using basic statistics. John Wiley & Sons. 
  • Squire, Megan (2015). Clean Data. Packt Publishing Ltd.
  • Osborne, Jason W (2012). Best practices in data cleaning: A complete guide to everything you need to do before and after collecting your data. Sage Publications.

Amunt

La metodología de aprendizaje consistirá en el estudio de los recursos de aprendizaje de la asignatura, formado por capítulos de libros y módulos didácticos.

Se recomienda seguir las pautas de estudio de los contenidos dado que esta es la vía habitual de asegurar el éxito para superar la asignatura. En este sentido, os proponemos la distribución temporal de aprendizajes incluidas al calendario de este documento y la realización de las actividades de evaluación al inicio del periode indicado para poder plantear las dudas al profesorado colaborador.

El seguimiento activo de los espacios del aula (tablón y foro) es de primordial interés, dado que habitualmente se plantean dudas, se dan respuestas y se tratan temas relacionados con la materia de estudio.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

La evaluación continuada está formada por tres tipos de actividades: Pruebas de evaluación continuada (PEC), prácticas y debate virtual. Todas las actividades son obligatorias y tienen que realizarse en el plazo indicado en el calendario del aula.

Pruebas de Evaluación Continuada (PEC)

Está formada por 2 PEC en las cuales se trabajan los contenidos aprendidos en los recursos de aprendizaje de la asignatura a partir de ejercicios teórico-prácticos.

Prácticas

Está formada por dos prácticas en las cuales se trabajan los contenidos aprendidos en los recursos de aprendizaje de la asignatura desde una visón práctica.

Debate virtual

Está formada por un único debate virtual como cierre de la asignatura, en la cual se compartirán y debatiran las opiniones entre los estudiantes a partir de un enunciado propuesto por el profesorado colaborador.

Actividad Bloque temático Peso en la nota final
PEC 1 Bloque 1 10%
Práctica 1 Bloque 1 y 2 35%
PEC 2 Bloque 3 10%
Práctica 2 Bloque 3 35%
Debate Cierre 10%


Cada actividad (PEC, práctica y debate) tendrá una nota individual cualitativa:

A    Calificación muy buena
B    Calificación buena
C+  Calificación suficiente
C-   Calificación baja
D    Calificación muy baja

Así, esta asignatura se evalua exclusivamente a través de la evaluación continuada, y no existe ninguna otra prueba final.

El seguimiento correcto de la asignatura os compromete a realizar las actividades propuestas de manera individual y según las indicaciones que pauta este Plan Docente. En caso de que no sea así, la nota final de evaluación continuada se os evaluará con una D. Por otro lado, y siempre a criterio de los Estudios, el incumplimiento de este compromiso, puede suponer que no se os permita superar ninguna otra asignatura mediante evaluación continuada ni en el semestre en curso ni en los siguientes.

Amunt

Esta asignatura no tiene prueba de evaluación final, sólo se podrá superar mediante la evaluación continuada. La calificación final de la asignatura es la nota final de la evaluación continuada.

La nota final de evaluación continuada tendrá, además de una calificación cualitativa, un valor numérico asociado a esta escalera cualitativa:

A    Qualificació numèrica: 10/9
  Qualificació numèrica: 8/7
C+  Qualificació numèrica: 6/5
C-   Qualificació numèrica: 4/3
D    Qualificació numèrica: 2/1/0

NP  No Presentat: 0 

Amunt

A lo largo del semestre, el consultor os proporcionará retorno de vuestro progreso a través de diferentes medios:

  • Publicación de las soluciones de las actividades teóricas y prácticas en las fechas indicadas en el calendario del aula virtual. Cuando una prueba teórica no tenga una solución única, se publicará y se comentará aquellas soluciones que puedan ser correctas.
  • Publicación de las actividades destacadas de algunos alumnos, en parte o en su totalidad.
  • Comunicación individual a aquellos estudiantes en riesgo de no superar el curso, según su evolución.

En todo caso, podéis solicitar al consultor un retorno individual, tanto de vuestra evolución dentro del semestre, como de cada prueba individual. Por el hecho de ser una evaluación individual y continuada, se recomienda hacer esta petición después de cada prueba sobre la que tengáis dudas o necesidades de aclaración y no esperar a las calificaciones medias o finales. También podéis poneros en contacto con el profesor responsable del curso académico, si los comentarios y sugerencias recibidos no son satisfactorios o no se está de acuerdo con ellos.

 

Amunt