Análisis multivariante Código:  M0.165    :  5
Consulta de los datos generales   Descripción   Campos profesionales en el que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura. Os servirá para planificar la matrícula (consultad si la asignatura se ofrece este semestre en el espacio del Campus Más UOC / La Universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. (El plan docente puede estar sujeto a cambios).

El Análisis Multivariante es un conjunto de métodos estadísticos y matemáticos para analizar, describir e interpretar las observaciones multidimensionales, es decir, el material estadístico que proviene de la observación de más de una variable. Debido a las numerosas aplicaciones que tiene en la práctica totalidad de las ciencias experimentales, el Análisis Multivariante ha tenido un desarrollo creciente en los últimos años y su utilización se ha convertido poco más o menos en imprescindible. Las espectaculares posibilidades que actualmente ofrece la informática, tanto en software como en hardware, han influido de forma decisiva en este desarrollo.

El número actual de métodos de Análisis Multivariante es demasiado elevado para poderlos tratar dentro de los límites de una asignatura. Por lo tanto, se han seleccionado aquellos más consolidados y de mayor aplicación.

Amunt

Todas las ciencias experimentales.

Amunt

Aunque haremos un repaso de algunos temas, es conveniente que el alumnado revise el cálculo matricial, la geometría lineal y las principales distribuciones y contrastes univariantes.

Amunt

Por lo que se refiere a conocimientos:

El objetivo principal de esta asignatura es que el alumnado se familiarice con algunas de las técnicas más comunes del análisis multivariante. Básicamente, tendremos en cuenta tres grandes bloques de técnicas:

1) técnicas de representación y de reducción de la dimensión,
2) inferencia multivariante,
3) técnicas de clasificación: análisis de conglomerados y análisis discriminante.

La asignatura tiene un planteamiento aplicado. Esencialmente se espera que el alumnado aprenda:
- Cuáles son las técnicas oportunas para cada situación (saber "qué se puede hacer").
- Cuáles son las restricciones que se aplican en cada caso, es decir, cuando se puede aplicar y cuando no se puede aplicar una técnica determinada (saber "si se puede hacer").
- Como se debe aplicar cada técnica (saber "como se tiene que hacer").

Dada la orientación práctica de la asignatura, se concederá mucha importancia a la utilización del ordenador mediante el software adecuado para aplicar técnicas ya implementadas o para programar algunos algoritmos sencillos. En concreto utilizaremos el lenguaje estadístico R y sus paquetes en este campo.

Otro objetivo es generalizar algunos conceptos, que seguramente el alumnado ya conoce en el caso univariante o uniparamétrico, en una formulación más general. Esto hace que sea muy recomendable tener un buen bagaje de conocimientos de Inferencia Estadística, como la proporcionada por la asignatura del mismo nombre, así como de Álgebra Matricial, que se revisará al comienzo de la asignatura.

Amunt

Módulo 1. Introducción al análisis multivariante.

  • Descripción de datos multivariantes
    • La matriz de datos: objetos y variables. Análisis univariante.
    • Medidas de centralización.
    • La matriz de varianzas y covarianzas.
    • Medidas globales de variabilidad.
  • Análisis gráfico y datos atípicos.
    • Representaciones gráficas. Histogramas. Diagramas de dispersión.
    • Diagramas de cajas múltiples y otros gráficos multidimensionales.
    • Datos atípicos. Sus efectos. Identificación.
  • Elementos de álgebra matricial y cálculo matricial.
    • Cálculo matricial.
    • Diagonalización.
    • Descomposición en valores singulares.
  • Aplicación: Estudio exploratorio de una base de datos.
  • Aplicación: Análisis de correspondencias múltiple: cálculo matricial.

Módulo 2. Análisis de componentes principales.

  • Planteamiento del problema. Objetivos.
  • Cálculo de las componentes.
  • Propiedades de las componentes.
  • Representación gráfica de los objetos.
  • Interpretación de las componentes.
  • Elección del número de componentes.
  • Utilización de las componentes principales en regresión.
  • Aplicación: Detección de efectos "batch" en datos de microarrays

Módulo 3. Análisis de proximidades (multidimensional scaling)

  • Definición, propiedades y relaciones entre similitudes y disimilitudes.
  • Distancias para variables binarias, categóricas, ordinales y mixtas.
  • Distancias euclídeas.
  • Análisis de coordenadas principales.
  • Introducción al MDS no métrico.

Módulo 4. Análisis de correspondencias.

  • Planteamiento del problema.
  • El lenguaje: perfiles, masas, centroide, distancia ji-cuadrado.
  • Proyección de las filas.
  • Proyección de las columnas.
  • Tipos de representación simultánea.

Módulo 5. Estadística matemática multivariante.

  • Vectores aleatorios y distribuciones multivariantes.
  • Función de distribución y función de densidad. Funciones marginales y condicionadas.
  • Vector de esperanzas, matriz de covarianzas y matriz de correlaciones.
  • La distribución multinomial. (opcional)
  • La distribución normal multivariante.
  • Estimación e inferencia estadística multivariante.
    • Estimaciones de máxima verosimilitud.
    • Distribuciones para la inferencia en poblaciones normales multivariantes.
  • Contraste de hipótesis sobre la media en una y dos poblaciones normales.
  • Contraste de hipótesis en k poblaciones normales: MANOVA de un factor.
  • Contrastes sobre la homogeneidad de la variabilidad.
  • Pruebas de normalidad multivariante
  • Transformaciones normalizantes. (opcional)
  • Aplicación: Comparación multivariante de dos poblaciones.

Módulo 6. Análisis de conglomerados (cluster analysis)

  • Objetivos.
  • Análisis jerárquico de conglomerados. Dendogramas.
  • Métodos no jerárquicos: k-medias y PAM.
  • Número de clases. La silueta.
  • Aplicación: Análisis y visualización de patrones de expresión génica

Módulo 7. Análisis discriminante

  • Entre dos poblaciones. Caso normal: discriminador lineal y cuadrático.
  • Caso multinomial. El criterio de la dispersión: el discriminador de Fisher.
  • Criterio de la mínima distancia.
  • Tablas de clasificación. Validación cruzada. Probabilidades a posteriori.
  • Un método de clasificación no paramétrico: k-nearest neighbors.
  • Regresión logística.
  • Aplicación: Clasificación molecular con datos de microarrays.

Amunt

Análisis multivariante: introducción Audiovisual
Anàlisi multivariant: introducció Audiovisual
Inferencia multivariante Audiovisual
Inferència multivariant Audiovisual
Análisis de componentes principales Audiovisual
Anàlisi de components principals Audiovisual
Análisis de proximidades Audiovisual
Anàlisi de proximitats Audiovisual
Análisis de correspondencias Audiovisual
Anàlisi de correspondències Audiovisual
Análisis de conglomerados Audiovisual
Anàlisi de conglomerats Audiovisual
Análisis discriminante Audiovisual
Anàlisi discriminant Audiovisual
Teoría del análisis de correspondencias Audiovisual
Teoria de l'anàlisi de correspondències Audiovisual
Teoría del análisis de correspondencia: ejemplo Audiovisual
Teoria de l'anàlisi de correspondències: exemple Audiovisual
Inferencia en poblaciones normales multivariantes. Contraste de dos medias Audiovisual
Inferència en poblacions normals multivariants. MANOVA Audiovisual
Inferencia en poblaciones normales multivariantes. MANOVA Audiovisual
Inferència en poblacions normals multivariants. Comparació de variàncies i testos de normalitat Audiovisual
Inferencia en poblaciones normales multivariantes. Comparación de varianzas y test de normalidad Audiovisual
Inferència en poblacions normals multivariants. Contrast de dues mitjanes Audiovisual

Amunt

El equipo docente aportará un video de presentación de cada módulo.

Además de la bibliografía, entre los recursos de cada módulo existen tutoriales específicos en formato PDF, scripts con instrucciones de R y vídeos.

Cada módulo tendrá un buen conjunto de ejercicios, algunos opcionales y con diferentes niveles de dificultad.

Los marcados con (*) seran opcionales.

Los marcados con (**), además de opcionales, son de mayor dificultad.

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente –incluidas las pruebas finales– o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

Amunt

Esta asignatura solo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt