Inferencia estadística Código:  M0.155    :  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

 

La bioestadística trata de la aplicación de la estadística a problemas de ciencias de la vida (denominada habitualmente biometría) o de la salud (comúnmente descrita en este caso como bioestadística). Como todas las ciencias aplicadas, consta de una o más disciplinas básicas, aquí la estadística, cuya aplicación se centra o especializa en un determinado ámbito, aquí la biología, la bioinformática o la medicina.
Los fundamentos de inferencia estadística que se presentan en esta asignatura discurren a lo largo de las dos ideas que se acaban de mencionar. Por un lado se busca establecer los conceptos y métodos básicos acerca de probabilidad y estadística que todo practicante de dicha disciplina debe conocer. Al mismo tiempo, dado que a ésta la siguen otras asignaturas, es preciso que sirva para fundamentarlas. En resumen una parte de la asignatura debe de servir para presentar ideas básicas y la otra servir de base sobre la que construir desarrollos posteriores, en este curso u otros que le puedan seguir.
Para ello la asignatura se organizará en tres bloques que se describen con detalle más adelante: Modelos probabilísticos, Conceptos de inferencia estadística y Aplicaciones.
Para acabar esta descripción general vale la pena decir dos cosas sobre que "no es" la bioestadística. La bioestadística no es estadística "diluída" para que puedan entenderla profesionales sin formación matemática. Es estadística de cualquier tipo o nivel que se aplica a problemas de ciencias de la vida. La bioestadística no es tampoco epidemiología, psicometría o genética estadística: Estas disciplinas se apoyan, como la bioestadística, en la estadística, a la vez que se aplican a ciencias de la vida, pero su trayectoria ha sido ya lo suficientemente larga como para que pueda considerárselas independientes de la que aquí nos ocupa

 

Amunt

Esta asignatura se encuentra al principio del plan de estudios por dos motivos: Por un lado, porque presenta los conceptos básicos que todo usuario de la (bio)estadística debe de conocer, sirviendo de puente entre un eventual formación previa y este posgrado. Por el otro, porque establece las bases sobre las que construir las demás asignaturas, siendo por tanto ésta la única posición razonable: antes de las otras materias.

Amunt

La bioestadística ha tenido siempre una gran aplicación en las ciencias de la vida. Se la encuentra en multitud de ámbitos, que van desde la investigación agrícola, contribuyendo a estudios de mejora vegetal (transgénica o no), hasta la "Salud pública" -por ejemplo ayudando a diseñar encuestas de calidad de vida. Pasando naturalmente por la investigación médica de pequeña escala (análisis de datos en estudios sencillos) o de grandes dimensiones (por ejemplo ensayos clínicos multicéntricos, por ejemplo para evaluar la eficacia de la vacuna de la malaria en múltiples países africanos).

Las competencias y habilidades concretas que de ésta asignatura se derivan deberían preparar para la realización de análisis estadísticos básicos, por lo que se proyecta en cualquier campo profesional en que deban de realizarse tratamientos de datos, desde el control de calidad en el laboratorio, las ciencias ambientales o la investigación biomédica básica.

Ejemplos de perfiles profesionales que hacen un uso importante de los conceptos y técnicas desarrollados en esta asignatura son los siguientes:

         Investigadores de cualquier ámbito de ciencias de la vida que deban diseñar experimentos, organizar su información o analizar los datos obtenidos.

         Personal de soporte en hospitales, laboratorios o centros de investigación que pueda necesitar tratar la información generada por la actividad propia del centro.

         Analistas de datos, bioestadística@s o «data scientists», término de reciente aparición que se refiere a profesionales con conocimiento de análisis de datos pero también de informática y gestión de datos en la web entre otras habilidades.

         Bioinformático. No se trata de una confusión del plan docente sino generalizada: muchos científicos creen que necesitan un bioinformático pero las tareas en las que piensan son propias de un Bioestadístico

Amunt

Esta asignatura puede afrontarse con dos tipos de conocimientos previos.

  •  Sería ideal cierta formación matemática -un curso de álgebra y cálculo y alguno de estadística básica- para poder avanzar rápidamente y fundamentar los conceptos que quizás se hayan adquirido desde una perspectiva práctica.
  • En ausencia de dicha base, los requerimientos serán algo más amplios, dado que será preciso trabajar a la vez los aspectos técnicos, conceptuales y la aplicación.
  • Conocimientos básicos de R. En caso de no tenerlos estos se iran adquiriendo a la vez en la asignatura de software para el análisis de datos

Ahora bien, es un hecho harto sabido que la formación estadística y matemática es de lo más heterogénea por lo que, en vez de asumir que se conoce todo lo que se debería conocer, se dispondrán de "apuntadores" adecuados a material de refuerzo, con el fin de disponer de informaciones básicas sobre las técnicas que se utilizaran en la asignatura. 

Amunt

Esta asignatura pretende establecer las bases probabilísticas y estadísticas para el estudio de temas más avanzados a la vez que presentar las herramientas básicas de todo análisis de datos.

Las capacidades a adquirir serán:

         Conocimiento de los fundamentos de probabilidad adecuados para modelizar situaciones de interés en problemas biológicos a la vez que para fundamentar los métodos estadísticos presentados en la segunda parte de la asignatura y resto del posgrado.

         Conocimiento de los métodos estadísticos básicos para el análisis de datos cuantitativos o cualitativos en un contexto paramétrico o no paramétrico.

         Conocimiento a nivel conceptual y/o operativo -según el caso- de conceptos y técnicas más avanzados con el fin de tener, a la vez que unas herramientas básicas, una perspectiva amplia de la bioestadística.

Amunt

Los contenidos se organizan por unidades que se presentan al alumno con una duración de 2 semanas para su lectura y estudio. Intercaladas entre las semanas de dos unidades se proponen debates no evaluables para discutir sobre cuestiones teóricas , ejercicios y prácticas por parte del alumnado. En el siguiente temario estan los principales puntos que se van a tratar, que seran detallados en cada una de las unidades.

Unidad I. Probabilidad y variables aleatorias

1.1. Introducción: Modelos probabilísticos en Biología.

1.2. Probabilidad y reglas de cálculo de probabilidades.

1.3 Independencia y Probabilidad condicionada. Ley de Probabilidad Total. Teorema de Bayes

1.4. La modelización de la variabilidad biológica: Variables aleatorias

1.5. Características de las variables aleatorias: Esperanza y varianza

1.6. Distribuciones de probabilidad univariantes.

 

Unidad II: Probabilidad y variables aleatorias (II)

2.1. Variables aleatorias multidimensionales.

2.2 Distribuciones conjuntas, marginales y condicionales,.

2.3 Valores esperados, covariancia y correlación.

2.4 Distribuciones multivariantes: Multinomial y Normal bivariante.

2.5 Leyes de los grandes números y teorema central del límite

 

Unidad III: Introducción a la  inferencia estadística: muestreo y estimación

3.1. Los problemas de la inferencia estadística.

3.2. Muestreo y distribuciones en el muestreo.

3.3. La verosimilitud y su papel en la inferencia estadística

3.4. El problema de la estimación. Tipos de estimadores.

3.5. Métodos de obtención de estimadores. Estimadores máximo verosímiles  y estimadores bayesianos.

3.6. Propiedades de los estimadores.

3.7. Aplicaciones: Estimación del error estándar y cálculo del tamaño muestral

 

Unidad IV Estimación mediante intervalos de confianza.

4.1. Estimadores por intervalo: intervalos de confianza

4.2. Intervalos de confianza para características de una población normal (media, varianza),

4.3. Los métodos bootstrap. Estimación del error estándar e intervalos de confianza bootstrap.

4.4. Intervalos de confianza para proporciones binomiales

4.5. Intervalos de confianza para parámetros en muestra grandes y para casos generales (tasas, OR, ...)

4.6  Aplicaciones: Cálculo del tamaño muestral

Unidad V: Pruebas de hipótesis

5.1. Conceptos básicos: pruebas de hipótesis y de significación, pruebas unilaterales y bilaterales, tipos de error, valores críticos de test y p-valores

5.2. Potencia de un test. Cálculos de potencia y de tamaño de la muestra. Tamaño del efecto.

5.3. Métodos de construcción de tests.

5.4. Pruebas de normalidad.Pruebas gráficas.  El test de Shapiro-Wilks

5.5. Pruebas de hipótesis para constrastar variables cuantitativas: Pruebas Paramètricas t-test y Anova

5.6 Pruebas de hipótesis para constrastar variables cuantitativas: Pruebas de hipótesis no paramètricas de Wilcoxon y Kruskal-Wallis

 

Unidad VI: Aplicaciones de los tests estadísticos

6.1. Contrastes para datos categóricos. Pruebas binomiales, ji cuadrado y test de Fisher.

6.2. Riesgo relativo y razón de «odds»

6.3. Test exacto de Fisher.

6.4. Tests ji cuadrado. Pruebas de independencia, de homogeneidad y de bondad de ajuste

 

Unidad VII: Métodos de computación intensiva y comparaciones múltiples

7.1. Tests de permutaciones; ¿Qué?, ¿Cuando?, ¿Cómo?

7.2. El bootstrap en contraste de hipótesis

7.3 El problema de las comparaciones múltiples

7.4. Métodos de control de error: FWER y FDR

 

 

Amunt

Vídeo de presentación de la asignatura Audiovisual
Vídeo de presentació de l'assignatura Audiovisual
Estadística PDF
Estadística PDF
Inferencia estadística. Introducción y plan docente Audiovisual
Inferència estadística. Introducció i pla docent Audiovisual
2. Probabilitat i variables aleatòries II Audiovisual
4. Introducció a la inferència estadística. Intervals de confiança Audiovisual
Inferencia estadística. Probabilidad y variables aleatorias I Audiovisual
3. Introducción a la inferencia estadística. Muestreo y estimación Audiovisual
Inferència estadística. Probabilitat i variables aleatòries I Audiovisual
Inferencia estadística. Aplicación de pruebas de hipótesis Audiovisual
3. Introducció a la inferència estadística. Mostreig i estimació Audiovisual
Inferència estadística. Aplicació de proves d'hipòtesis Audiovisual
5. Contrasts d'hipòtesis Audiovisual
2. Probabilidad y variables aleatorias II Audiovisual
4. Introducción a la inferencia estadística. Intervalos de confianza Audiovisual
5. Contrastes de hipótesis Audiovisual

Amunt

Dado que la bioestadística es una ciencia que tiene un cuerpo de conocimento bien consolidado y que el nivel  procedencia del alumando es diferente, se ha considerado no incluir unos apuntes que sean mero plagio de los libros existentes y  se ha planteado utilizar cuatro  libros de diferente nivel y enfoque para que cada uno encuentre el màs adecuado a sus necesidades. Hay que recordar que el objetivo del master es que el alumnado adquiera  un nivel de especialización que le permita aplicar los conocimientos adquiridos en la práctica profesional. En un entorno tan dinámico como el de les materies del master, es útil que el alumnado sea capaz de encontrar en los diversos recursos disponibles la información que necesita.

. En cada unidad se indicara´los capítulos del los diferentes libros que más se adecúan a los conceptos requeridos de la unidad.

Además en la presentación de la unidad se incluiran los principales puntos que hay que  retener, añadiendo pequeños resumenes.  A modo experimental se incluiran pequeños videos explicativos de los contenidos del curso así de como de cada unidad para facilitar la compresinsión de los temas 

Ademàs se proporcionaran debates de caracter voluntario que trataran los principales puntos del tema desde un punto de vista práctico y conceptual. De la discusión entre el alumando y la presentación final de los ejercicios resueltos se pretende fijar los contenidos del tema. 

La descripción general de los libros es la siguiente:

Es un texto de bioestadística en castellano de la Universidad de Málaga , cuyo contenido  se adapta bastante bien  a la materia del curso y que dispone de ejercicios y preguntas test para autoevaluación, tiene una versión en papel: Rius F, Wärnberg J (2014): Bioestadística 2ª Edición. Ed. Paranimfo. Para aquellos que entráis en el mundo de la bioestadística  o tengáis dificultades con el inglés , este libro es de fácil compresión, pero tiene algunas lagunas  y errores en algunas formulas  de algún punto  concreto del temario que os comentaremos. 

Si tuvieramos que indicar algún libro como de texto único este sería el indicado, aunque la última unidad del curso de remuestreo no esté incluida. Los contenidos del curso comienzan a partir del  tema 4, pero es recomendable que os leáis los anteriores ya que  incluyen los conceptos de estadística descriptiva que habéis visto en vuestros estudios anteriores con aplicación en R que es el lenguaje que utilizaremos como usuarios a lo largo del curso.  Lo mejor del libro es que combina la explicación teórica con la práctica en R , lo que ayuda a comprender los contenidos.  El libro lo tenéis a disposición en la biblioteca de la UOC siguiendo el enlace. 

Combina un enfoque tradicional, y no elemental, de la estadística con un planteamiento a partir de problemas generados por la bioinformática, especialmente el análisis de datos de microarrays. La característica más notable de este libro es que se apoya constantemente en el lenguaje R con el fin de ilustrar los conceptos mediante cálculos, gráficos o simulaciones por lo que una vez más se puede seguir de diversas formas. A veces se vuelve complejo con la forma como trata la resolución práctica de las diferentes cuestiones en R , sobretodo si no se esta muy introducido en el mundo bioinformatico. Este libro lo podeis encontrar en la biblioteca siguiendo el enlace y se podría considerar el libro de texto  avanzado de la asignatura.

Este libro que tenéis disponible en la biblioteca  de la UOC y esta desarrollado por los autores a partir de la experienccia de los cursos de Coursera elaborados desde la Universidad Johns Hopkins. El libro esta bien estructurado y  contempla todos los aspectos de una forma resumida para el análisis de datos  El libro es sencillo de seguir y además podéis acceder a los videos desarrollados por los autores, que acompañan  las sesiones que os pueden ayudar a entender algunos aspectos. Algunos de los puntos estan desarrollados de una forma muy esquemática. Para la comprensión de la última unidad es el mejor libro . 

Otros materiales de apoyo

Además de los libros mencionados se  incluyen otros materiales que pueden ser útiles a lo largo del curso. También en las diferentes unidades, además del video de presentación de los diferentes materiales, se incluirán algunos enlaces a recursos web , applets y resúmenes que pueden ayudar a mejorar la información 

Este texto se trata de un manual de uso transversal en diferentes asignaturas del master que  va desde la estadística bàsica a análisis màs sofísticados de bioinformàtica, utilizando R como software de soporte. El libro recoge los principales conceptos y muestra ejemplos de uso de la bioestadística , si bien no recoge toda la información necesaria.

Este material es el que se utiliza en la asignatura de estadística en varios grados de la UOC como Data Science o Informática. Esta bien explicado con numerosos ejemplos. Aunque su contenido no es exactamente el de la asignatura del Master puede ser de utilidad para afianzar algunos conceptos y temas. 

 

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente - incluidas las pruebas finales - o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

La UOC se reserva la potestad de solicitar al estudiante que se identifique o que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación por los medios que establezca la universidad (síncronos o asíncronos). A estos efectos, la UOC puede exigir al estudiante el uso de un micrófono, una cámara u otras herramientas durante la evaluación y que este se asegure de que funcionan correctamente.

La verificación de los conocimientos para garantizar la autoría de la prueba no implicará en ningún caso una segunda evaluación.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt