|
Análisis multivariante
|
Código:
M0.165 :
5
|
|
Consulta de los datos generales
Descripción
Campos profesionales en el que se proyecta
Conocimientos previos
Objetivos y competencias
Contenidos
Consulta de los recursos de aprendizaje de los que dispone la asignatura
Recursos de aprendizaje y herramientas de apoyo
Informaciones sobre la evaluación en la UOC
Consulta del modelo de evaluación
|
Este es el plan docente de la asignatura para el segundo semestre del curso 2022-2023. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios. |
El Análisis Multivariante es un conjunto de métodos estadísticos y matemáticos para analizar, describir e interpretar las observaciones multidimensionales, es decir, el material estadístico que proviene de la observación de más de una variable. Debido a las numerosas aplicaciones que tiene en la práctica totalidad de las ciencias experimentales, el Análisis Multivariante ha tenido un desarrollo creciente en los últimos años y su utilización se ha convertido poco más o menos en imprescindible. Las espectaculares posibilidades que actualmente ofrece la informática, tanto en software como en hardware, han influido de forma decisiva en este desarrollo.
El número actual de métodos de Análisis Multivariante es demasiado elevado para poderlos tratar dentro de los límites de una asignatura. Por lo tanto, se han seleccionado aquellos más consolidados y de mayor aplicación.
|
Todas las ciencias experimentales.
|
Aunque haremos un repaso de algunos temas, es conveniente que el alumnado revise el cálculo matricial, la geometría lineal y las principales distribuciones y contrastes univariantes.
|
Por lo que se refiere a conocimientos:
El objetivo principal de esta asignatura es que el alumnado se familiarice con algunas de las técnicas más comunes del análisis multivariante. Básicamente, tendremos en cuenta tres grandes bloques de técnicas:
1) técnicas de representación y de reducción de la dimensión,
2) inferencia multivariante,
3) técnicas de clasificación: análisis de conglomerados y análisis discriminante.
La asignatura tiene un planteamiento aplicado. Esencialmente se espera que el alumnado aprenda:
- Cuáles son las técnicas oportunas para cada situación (saber "qué se puede hacer").
- Cuáles son las restricciones que se aplican en cada caso, es decir, cuando se puede aplicar y cuando no se puede aplicar una técnica determinada (saber "si se puede hacer").
- Como se debe aplicar cada técnica (saber "como se tiene que hacer").
Dada la orientación práctica de la asignatura, se concederá mucha importancia a la utilización del ordenador mediante el software adecuado para aplicar técnicas ya implementadas o para programar algunos algoritmos sencillos. En concreto utilizaremos el lenguaje estadístico R y sus paquetes en este campo.
Otro objetivo es generalizar algunos conceptos, que seguramente el alumnado ya conoce en el caso univariante o uniparamétrico, en una formulación más general. Esto hace que sea muy recomendable tener un buen bagaje de conocimientos de Inferencia Estadística, como la proporcionada por la asignatura del mismo nombre, así como de Álgebra Matricial, que se revisará al comienzo de la asignatura.
|
Módulo 1. Introducción al análisis multivariante.
- Descripción de datos multivariantes
- La matriz de datos: objetos y variables. Análisis univariante.
- Medidas de centralización.
- La matriz de varianzas y covarianzas.
- Medidas globales de variabilidad.
- Análisis gráfico y datos atípicos.
- Representaciones gráficas. Histogramas. Diagramas de dispersión.
- Diagramas de cajas múltiples y otros gráficos multidimensionales.
- Datos atípicos. Sus efectos. Identificación.
- Elementos de álgebra matricial y cálculo matricial.
- Cálculo matricial.
- Diagonalización.
- Descomposición en valores singulares.
- Aplicación: Estudio exploratorio de una base de datos.
- Aplicación: Análisis de correspondencias múltiple: cálculo matricial.
Módulo 2. Análisis de componentes principales.
- Planteamiento del problema. Objetivos.
- Cálculo de las componentes.
- Propiedades de las componentes.
- Representación gráfica de los objetos.
- Interpretación de las componentes.
- Elección del número de componentes.
- Utilización de las componentes principales en regresión.
- Aplicación: Detección de efectos "batch" en datos de microarrays
Módulo 3. Análisis de proximidades (multidimensional scaling)
- Definición, propiedades y relaciones entre similitudes y disimilitudes.
- Distancias para variables binarias, categóricas, ordinales y mixtas.
- Distancias euclídeas.
- Análisis de coordenadas principales.
- Introducción al MDS no métrico.
Módulo 4. Análisis de correspondencias.
- Planteamiento del problema.
- El lenguaje: perfiles, masas, centroide, distancia ji-cuadrado.
- Proyección de las filas.
- Proyección de las columnas.
- Tipos de representación simultánea.
Módulo 5. Estadística matemática multivariante.
- Vectores aleatorios y distribuciones multivariantes.
- Función de distribución y función de densidad. Funciones marginales y condicionadas.
- Vector de esperanzas, matriz de covarianzas y matriz de correlaciones.
- La distribución multinomial. (opcional)
- La distribución normal multivariante.
- Estimación e inferencia estadística multivariante.
- Estimaciones de máxima verosimilitud.
- Distribuciones para la inferencia en poblaciones normales multivariantes.
- Contraste de hipótesis sobre la media en una y dos poblaciones normales.
- Contraste de hipótesis en k poblaciones normales: MANOVA de un factor.
- Contrastes sobre la homogeneidad de la variabilidad.
- Pruebas de normalidad multivariante
- Transformaciones normalizantes. (opcional)
- Aplicación: Comparación multivariante de dos poblaciones.
Módulo 6. Análisis de conglomerados (cluster analysis)
- Objetivos.
- Análisis jerárquico de conglomerados. Dendogramas.
- Métodos no jerárquicos: k-medias y PAM.
- Número de clases. La silueta.
- Aplicación: Análisis y visualización de patrones de expresión génica
Módulo 7. Análisis discriminante
- Entre dos poblaciones. Caso normal: discriminador lineal y cuadrático.
- Caso multinomial. El criterio de la dispersión: el discriminador de Fisher.
- Criterio de la mínima distancia.
- Tablas de clasificación. Validación cruzada. Probabilidades a posteriori.
- Un método de clasificación no paramétrico: k-nearest neighbors.
- Regresión logística.
- Aplicación: Clasificación molecular con datos de microarrays.
|
|
|
|
Análisis multivariante: introducción |
Audiovisual |
Anàlisi multivariant: introducció |
Audiovisual |
Inferencia multivariante |
Audiovisual |
Inferència multivariant |
Audiovisual |
Análisis de componentes principales |
Audiovisual |
Anàlisi de components principals |
Audiovisual |
Análisis de proximidades |
Audiovisual |
Anàlisi de proximitats |
Audiovisual |
Análisis de correspondencias |
Audiovisual |
Anàlisi de correspondències |
Audiovisual |
Análisis de conglomerados |
Audiovisual |
Anàlisi de conglomerats |
Audiovisual |
Análisis discriminante |
Audiovisual |
Anàlisi discriminant |
Audiovisual |
Teoría del análisis de correspondencias |
Audiovisual |
Teoria de l'anàlisi de correspondències |
Audiovisual |
Teoría del análisis de correspondencia: ejemplo |
Audiovisual |
Teoria de l'anàlisi de correspondències: exemple |
Audiovisual |
Inferencia en poblaciones normales multivariantes. Contraste de dos medias |
Audiovisual |
Inferència en poblacions normals multivariants. MANOVA |
Audiovisual |
Inferencia en poblaciones normales multivariantes. MANOVA |
Audiovisual |
Inferència en poblacions normals multivariants. Comparació de variàncies i testos de normalitat |
Audiovisual |
Inferencia en poblaciones normales multivariantes. Comparación de varianzas y test de normalidad |
Audiovisual |
Inferència en poblacions normals multivariants. Contrast de dues mitjanes |
Audiovisual |
|
El equipo docente aportará un video de presentación de cada módulo.
Además de la bibliografía, entre los recursos de cada módulo existen tutoriales específicos en formato PDF, scripts con instrucciones de R y vídeos.
Cada módulo tendrá un buen conjunto de ejercicios, algunos opcionales y con diferentes niveles de dificultad.
Los marcados con (*) seran opcionales.
Los marcados con (**), además de opcionales, son de mayor dificultad.
|
El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados. La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves. Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente incluidas las pruebas finales o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular. Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.
|
Esta asignatura solo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura.
La fórmula de acreditación de la asignatura es la siguiente: EC.
|
|