Estadística avanzada Código:  M2.854    Créditos:  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los materiales que dispone la asignatura   Materiales y herramientas de apoyo   Metodología   Consulta del modelo de evaluación   Evaluación Contínua   Evaluación final   Feedback  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.
En esta asignatura se verá el análisis estadístico aplicado en la ciencia de los datos. Se verán en profundidad los modelos de la ciencia de datos y la estadística, así como técnicas de extracción de preprocesado de datos y modelos de regresión. Finalmente, se verán los conceptos relacionados con el diseño experimental y la comparación de distintos métodos.

Amunt

Esta asignatura forma parte del conjunto de asignaturas obligatorias del máster.

Amunt

En esta asignatura se suponen adquiridos los contenidos propios de un curso de estadística básica: Estadística descriptiva, introducción al análisis de datos y muestreo, probabilidad y variables aleatorias, inferencia y modelización estadística, regresión lineal múltiple y análisis de la varianza.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

  • Comprender la extensión de los conceptos básicos de estadística para ciencia de datos y del diseño de una investigación mediante el método científico.
  • Identificar los distintos tipos de problemas que surgen en el ámbito de la ciencia de datos y saber qué modelos y métodos se aplican en cada caso.
  • Conocer los principios básicos de las técnicas de diseño en ciencia de datos.
  • Saber cuándo utilizar el muestreo y cuándo particionar un juego de datos en conjunto de entrenamiento y de test.
  • Familiarizarse con la importancia de la reproducibilidad, la evaluación y la validación de un experimento o modelo.
  • Conocer las distintas técnicas de Regresión: lineal, no lineal y logística. Entender sus aplicaciones en ciencia de datos: predicción o clasificación de clases.
  • Saber cuándo utilizar técnicas de extracción de características para reducir la dimensionalidad de un conjunto de datos y mejorar la eficacia de los algoritmos de minería de datos.
  • Comprender la importancia de la resolución sistemática de ejercicios con feedback automático para la resolución de problemas complejos en los que debe plantearse una estrategia, deben conocerse las técnicas estadísticas más adecuadas y se deben aplicar de forma correcta.
  • Ser capaz de llevar a cabo los análisis de datos requeridos, usando software estadístico apropiado como el lenguaje R.

Amunt

Tema 1. Introducción a los modelos de Ciencia de Datos y a la Estadística 
 
Tema 2. Preprocesado de los datos
 
Tema 3. Modelización predictiva
 
Tema 4. Diseño Experimental y Comparación de métodos

Amunt

Material Soporte
Muestreo PDF
Variables aleatorias PDF
Regresión lineal múltiple PDF
Ou aglutinador: Estadística básica Web
Contraste de varianzas PDF
Ou aglutinador: Regresión lineal Web
Ou aglutinador: Regresión logística Web
Álgebra lineal y cálculo con R PDF
Distribuciones de probabilidad e inferencia estadística con R-Commander PDF
Ou aglutinador: Estadística con R Web
Modelos de regresión y análisis multivariante con R-Commander PDF
Estadística. Módulo introductorio PDF
Matemáticas y estadística con R: capítulo introductorio del conjunto de módulos del curso de R PDF
Espacio de recursos de ciencia de datos Web
Probabilidad y variables aleatorias PDF
El entorno estadístico R. Estructura, lenguaje y sintaxis PDF
Análisis de datos y estadística descriptiva con R PDF
Contraste de dos muestras Reaprovechamiento
Contraste de hipótesis Reaprovechamiento
Estadística descriptiva. Introducción al análisis de datos Reaprovechamiento
Intervalos de confianza Reaprovechamiento
Teorema del límite central Reaprovechamiento
Regresión lineal simple Reaprovechamiento

Amunt

El conjunto de materiales de que dispone la asignatura es el siguiente:

  • Documentos de referencia de cada bloque del curso. Estos son cuatro documentos en formato PDF que sirven como introducción a la temática de cada bloque del curso:
    1. Introducción a la estadística
    2. Preproceso de los datos
    3. Modelización predictiva: introducción a los modelos lineales generalizados
    4. Diseño experimental en analítica de datos
  • Curso de estadística básica: Estos materiales pertenecen a un curso de estadística básica y su conocimiento es esencial para poder desarrollar las actividades del curso. Los materiales disponibles para cada bloque del curso son:
    1. Estadística básica:
      1. Módulo 0. Estadística
      2. Módulo 1. Estadística descriptiva
      3. Módulo 2. Muestreo
      4. Módulo 3. Probabilidad
      5. Módulo 4. Variables aleatorias
      6. Módulo 5. Teorema del límite central
      7. Módulo 6. Intervalos de confianza
      8. Módulo 7. Contraste de hipótesis
      9. Módulo 8. Contraste de dos muestras
      10. Módulo 9. Contraste de varianzas
    2. Modelización predictiva:
      1. Módulo 10. Regresión lineal simple
      2. Módulo 11. Regresión lineal múltiple
    3. Diseño experimental en analítica de datos:
      1. Módulo 12. Análisis de la varianza (ANOVA)
  • Módulos de introducción al lenguaje y entorno R:
    • Módulo 0. Matemáticas y estadística con R
    • Módulo 1. El entorno estadístico R. Estructura, lenguaje y sintaxis
    • Módulo 2. Álgebra lineal y cálculo con R.
    • Módulo 3. Análisis de datos y estadística descriptiva con R y R-Commander
    • Módulo 4. Distribuciones de probabilidad e inferencia estadística con R-Commander
    • Módulo 5. Modelos de regresión y análisis multivariante con R-Commander
  • Enlaces a páginas externas, con información complementaria: Esta información se suministrará para cada actividad específica.

Amunt

La asignatura está orientada a la realización de las actividades de evaluación continua que garantizan que el estudiante adquiera los conocimientos, habilidades y competencias en la disciplina de Estadística Avanzada. Os recomendamos seguir las pautas de aprendizaje basadas en las lecturas recomendadas, los materiales complementarios (lecturas, vídeos, ejercicios), la participación en los fórums y debates, y las actividades de evaluación. Todo ello, siguiendo la temporalización de la asignatura.

La asignatura está estructurada en cinco actividades, siendo la primera de ellas una actividad introductoria no evaluable, y el resto evaluables. A continuación, se describen brevemente estas actividades.

  • Actividad 0 - Actividad introductoria: en esta actividad, el alumno entra en contacto con el aula, los profesores, y el resto de alumnos, y se familiariza con el entorno. Es una actividad de presentación y de discusión sobre el ámbito de la estadística a través del foro/debate. El alumno deberá instalarse el software necesario, realizar la lectura del bloque introductorio, y empezar a "repasar" conceptos básicos de la estadística, a partir de los cuales se construirá el aprendizaje de la asignatura. Esta actividad es no evaluable, aunque requiere un tiempo de dedicación que es necesario para llevar a cabo el resto de actividades del curso.
  • Actividad 1 - Preprocesado de datos: esta es la primera actividad evaluable. El estudiante usará el software R para cargar datos y realizar un preproceso de datos siguiendo las pautas de la actividad. Habrá una lectura obligatoria para la realización del módulo y otros materiales complementarios.
  • Actividad 2 - Análisis estadístico I: en esta actividad, también evaluable, el estudiante deberá aplicar conceptos básicos de estadística descriptiva e inferencial, a partir de un caso práctico. En esta actividad se aplican conceptos básicos y esenciales como son la estimación de parámetros poblacionales, distribuciones de probabilidad, contrastes de hipótesis y visualización. 
  • Actividad 3 - Modelización predictiva: en esta actividad, el estudiante deberá realizar un análisis predictivo utilizando modelos lineales generalizados. Al igual que en las actividades anteriores, hay un documento en formato PDF que sirve como introducción al tema y otras lecturas complementarias.
  • Actividad 4 - Análisis estadístico avanzado: la última actividad tiene un carácter global y para su realización se necesitan conocimientos de todo el curso. En ella, se realiza un análisis estadístico completo de unos datos reales o casi reales. El objetivo es que el estudiante adquiera una visión integradora de todo el curso y sepa aplicar los conocimientos y competencias adquiridos al análisis de un caso real relativamente complejo.

 Se recomienda que para la adquisión de los conocimientos y competencias, el alumno realice un trabajo continuo y que entregue todas las actividades.

Las actividades de evaluación se deben realizar de forma individual y la nota será individualizada. Sin embargo, se recomienda que el estudiante participe en el foro y realice sus dudas a través del mismo para construir el aprendizaje de manera colaborativa.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

La asignatura se evalúa a partir de las actividades descritas de evaluación continua. La ponderación de cada actividad es:

  • A1: Actividad 1 - Preproceso de datos (20%)
  • A2: Actividad 2 - Análisis estadístico I (20%)
  • A3: Actividad 3 - Modelización predictiva (20%)
  • A4: Actividad 4 - Análisis estadístico avanzado (40%)

Entre estas actividades, es obligatorio entregar la actividad 4 (A4), puesto que es la actividad global, y como mínimo dos de las tres actividades iniciales (A1, A2, A3). Lo más recomendable es entregar todas las actividades para consolidar el aprendizaje y porque, además, si no se entrega una de las actividades, los conocimientos que contiene son necesarios para desarrollar de forma completa la actividad 4. La situación ideal es que el estudiante entregue todas las actividades.

Veamos una simulación de cálculo de nota.

1. Supongamos que un estudiante entrega todas las actividades. Su nota final es:

Nota final = A1 * 0,2 + A2 * 0,2 + A3 *0,2 + A4 *0,4

2. Si un estudiante entrega la actividad 1, 3 y 4 entonces su cómputo final será:

Nota final = A1 * 0,2 + A3 *0,2 + A4 *0,4

3. Si un estudiante entrega la actividad 1, 2 y 3, suspende la asignatura, puesto que no ha entregado la actividad 4 que es de carácter obligatorio.

4. Si un estudiante entrega la actividad 1 y 4, suspende la asignatura, puesto que no ha entregado dos de las tres actividades A1-A3.

Para aprobar la asignatura es obligatorio entregar como mínimo tres de las cuatro actividades, siendo una de ellas la actividad global. Las actividades se deben entregar en los plazos establecidos. Si una actividad se entrega fuera de plazo, contará como no entregada y por tanto, no se podrá evaluar.

Se recomienda que el estudiante chequee si la actividad que entrega a través del registro es la correcta. Sucede a veces que existen errores que no pueden ser subsanados si pasa la fecha límite de entrega.

Amunt

La evaluación final de la asignatura es la nota final de la evaluación continua. No hay examen final y por tanto, se evalúa únicamente a través de las actividades de evaluación continua.

Amunt

Al acabar cada actividad, el estudiante tendrá acceso a la solución de la misma. Por este motivo, no se permiten entregas de actividades fuera de plazo, puesto que la solución se publica en un plazo breve después de finalizar el periodo de entrega.

Amunt