Inferencia estadística Código:  M0.155    :  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

 

La bioestadística trata de la aplicación de la estadística a problemas de ciencias de la vida (denominada habitualmente biometría) o de la salud (comúnmente descrita en este caso como bioestadística). Como todas las ciencias aplicadas, consta de una o más disciplinas básicas, aquí la estadística, cuya aplicación se centra o especializa en un determinado ámbito, aquí la biología, la bioinformática o la medicina.
Los fundamentos de inferencia estadística que se presentan en esta asignatura discurren a lo largo de las dos ideas que se acaban de mencionar. Por un lado se busca establecer los conceptos y métodos básicos acerca de probabilidad y estadística que todo practicante de dicha disciplina debe conocer. Al mismo tiempo, dado que a ésta la siguen otras asignaturas, es preciso que sirva para fundamentarlas. En resumen una parte de la asignatura debe de servir para presentar ideas básicas y la otra servir de base sobre la que construir desarrollos posteriores, en este curso u otros que le puedan seguir.
Para ello la asignatura se organizará en tres bloques que se describen con detalle más adelante:

  1.  Modelos probabilísticos, 
  2. Conceptos de inferencia estadística y
  3.  Aplicaciones.
Para acabar esta descripción general vale la pena decir dos cosas sobre que "no es" la bioestadística. La bioestadística no es estadística "diluida" para que puedan entenderla profesionales sin formación matemática. Es estadística de cualquier tipo o nivel que se aplica a problemas de ciencias de la vida. La bioestadística no es tampoco epidemiología, psicometría o genética estadística. Estas disciplinas se apoyan, como la bioestadística, en la estadística, a la vez que se aplican a ciencias de la vida, pero su trayectoria ha sido ya lo suficientemente larga como para que pueda considerárselas independientes de la que aquí nos ocupa

 

Amunt

Esta asignatura se encuentra al principio del plan de estudios por dos motivos: Por un lado, porque presenta los conceptos básicos que todo usuario de la (bio)estadística debe de conocer, sirviendo de puente entre un eventual formación previa y este posgrado. Por el otro, porque establece las bases sobre las que construir las demás asignaturas, siendo por tanto ésta la única posición razonable: antes de las otras materias.

Amunt

La bioestadística ha tenido siempre una gran aplicación en las ciencias de la vida. Se la encuentra en multitud de ámbitos, que van desde la investigación agrícola, contribuyendo a estudios de mejora vegetal (transgénica o no), hasta la "Salud pública" -por ejemplo, ayudando a diseñar encuestas de calidad de vida. Pasando naturalmente por la investigación médica de pequeña escala (análisis de datos en estudios sencillos) o de grandes dimensiones (por ejemplo, en ensayos clínicos multicéntricos,   en la evaluación de la eficacia de la vacuna de la malaria en múltiples países africanos).

Las competencias y habilidades concretas que de esta asignatura se derivan deberían preparar para la realización de análisis estadísticos básicos, por lo que se proyecta en cualquier campo profesional en que deban de realizarse tratamientos de datos, desde el control de calidad en el laboratorio, las ciencias ambientales o la investigación biomédica básica.

Ejemplos de perfiles profesionales que hacen un uso importante de los conceptos y técnicas desarrollados en esta asignatura son los siguientes:

         Investigadores de cualquier ámbito de ciencias de la vida que deban diseñar experimentos, organizar su información o analizar los datos obtenidos.

         Personal de soporte en hospitales, laboratorios o centros de investigación que pueda necesitar tratar la información generada por la actividad propia del centro.

         Analistas de datos, bioestadístic@s o «data scientists», término de reciente aparición que se refiere a profesionales con conocimiento de análisis de datos, pero también de informática y gestión de datos en la web entre otras habilidades.

         Bioinformátic@s. No se trata de una confusión del plan docente sino generalizada: muchos científicos creen que necesitan un bioinformático pero las tareas en las que piensan son propias de un bioestadístico

Amunt

Esta asignatura puede afrontarse con dos tipos de conocimientos previos.

  •  Sería ideal cierta formación matemática -un curso de álgebra y cálculo y alguno de estadística básica- para poder avanzar rápidamente y fundamentar los conceptos que quizás se hayan adquirido desde una perspectiva práctica.
  • En ausencia de dicha base, los requerimientos serán algo más amplios, dado que será preciso trabajar a la vez los aspectos técnicos, conceptuales y la aplicación.
  • Conocimientos básicos del lenguaje de programación R. En caso de no tenerlos éstos se irán adquiriendo a la vez en la asignatura de software para el análisis de datos

Ahora bien, es un hecho harto sabido que la formación estadística y matemática es de lo más heterogénea por lo que, en vez de asumir que se conoce todo lo que se debería conocer, se dispondrán de "apuntadores" adecuados a material de refuerzo, con el fin de disponer de informaciones básicas sobre las técnicas que se utilizaran en la asignatura. 

Amunt

Esta asignatura pretende establecer las bases probabilísticas y estadísticas para el estudio de temas más avanzados a la vez que presentar las herramientas básicas de todo análisis de datos.

Las capacidades a adquirir serán:

         Conocimiento de los fundamentos de probabilidad adecuados para modelizar situaciones de interés en problemas biológicos a la vez que para fundamentar los métodos estadísticos presentados en la segunda parte de la asignatura y resto del posgrado.

         Conocimiento de los métodos estadísticos básicos para el análisis de datos cuantitativos o cualitativos en un contexto paramétrico o no paramétrico.

         Conocimiento a nivel conceptual y/o operativo -según el caso- de conceptos y técnicas más avanzadas con el fin de tener, a la vez que unas herramientas básicas, una perspectiva amplia de la bioestadística.

Amunt

Los contenidos se organizan por unidades que se presentan al alumno con una duración de 2 semanas para su lectura y estudio. Intercaladas entre las semanas de dos unidades se proponen debates no evaluables para discutir sobre cuestiones teóricas , ejercicios y prácticas por parte del alumnado. En el siguiente temario están los principales puntos que se van a tratar, que serán detallados en cada una de las unidades.

Unidad I. Probabilidad y variables aleatorias

1.1. Introducción: modelos probabilísticos en Biología.

1.2. Probabilidad y reglas de cálculo de probabilidades.

1.3 Independencia y probabilidad condicionada. Ley de Probabilidad Total. Teorema de Bayes

1.4. La modelización de la variabilidad biológica: variables aleatorias

1.5. Características de las variables aleatorias: esperanza y varianza

1.6. Distribuciones de probabilidad univariantes.

 

Unidad II: Probabilidad y variables aleatorias (II)

2.1. Variables aleatorias multidimensionales.

2.2 Distribuciones conjuntas, marginales y condicionales,.

2.3 Valores esperados, covariancia y correlación.

2.4 Distribuciones multivariantes: multinomial y normal bivariante.

2.5 Leyes de los grandes números y teorema central del límite

 

Unidad III: Introducción a la  inferencia estadística: muestreo y estimación

3.1. Los problemas de la inferencia estadística.

3.2. Muestreo y distribuciones en el muestreo.

3.3. La verosimilitud y su papel en la inferencia estadística

3.4. El problema de la estimación. Tipos de estimadores.

3.5. Métodos de obtención de estimadores. Estimadores máximo verosímiles  y estimadores bayesianos.

3.6. Propiedades de los estimadores.

3.7. Aplicaciones: estimación del error estándar y cálculo del tamaño muestral

 

Unidad IV Estimación mediante intervalos de confianza.

4.1. Estimadores por intervalo: intervalos de confianza

4.2. Intervalos de confianza para características de una población normal (media, varianza),

4.3. Los métodos bootstrap. Estimación del error estándar e intervalos de confianza bootstrap.

4.4. Intervalos de confianza para proporciones binomiales

4.5. Intervalos de confianza para parámetros en muestra grandes y para casos generales (tasas, OR, ...)

4.6  Aplicaciones: cálculo del tamaño muestral

Unidad V: Pruebas de hipótesis

5.1. Conceptos básicos: pruebas de hipótesis y de significación, pruebas unilaterales y bilaterales, tipos de error, valores críticos de test y p-valores

5.2. Potencia de un test. Cálculos de potencia y de tamaño de la muestra. Tamaño del efecto.

5.3. Métodos de construcción de tests.

5.4. Pruebas de normalidad.Pruebas gráficas.  El test de Shapiro-Wilks

5.5. Pruebas de hipótesis para constrastar variables cuantitativas: pruebas paramètricas t-test y Anova

5.6 Pruebas de hipótesis para constrastar variables cuantitativas: pruebas de hipótesis no paramétricas de Wilcoxon y Kruskal-Wallis

 

Unidad VI: Aplicaciones de los tests estadísticos

6.1. Contrastes para datos categóricos. Pruebas binomiales, ji cuadrado y test de Fisher.

6.2. Riesgo relativo y razón de «odds»

6.3. Test exacto de Fisher.

6.4. Tests ji cuadrado. Pruebas de independencia, de homogeneidad y de bondad de ajuste

 

Unidad VII: Métodos de computación intensiva y comparaciones múltiples

7.1. Tests de permutaciones; ¿Qué?, ¿Cuándo?, ¿Cómo?

7.2. El bootstrap en contraste de hipótesis

7.3 El problema de las comparaciones múltiples

7.4. Métodos de control de error: FWER y FDR

 

 

Amunt

Vídeo de presentación de la asignatura Audiovisual
Vídeo de presentació de l'assignatura Audiovisual
Estadística PDF
Estadística PDF
Inferencia estadística. Introducción y plan docente Audiovisual
Inferència estadística. Introducció i pla docent Audiovisual
2. Probabilitat i variables aleatòries II Audiovisual
4. Introducció a la inferència estadística. Intervals de confiança Audiovisual
Inferencia estadística. Probabilidad y variables aleatorias I Audiovisual
3. Introducción a la inferencia estadística. Muestreo y estimación Audiovisual
Inferència estadística. Probabilitat i variables aleatòries I Audiovisual
Inferencia estadística. Aplicación de pruebas de hipótesis Audiovisual
3. Introducció a la inferència estadística. Mostreig i estimació Audiovisual
Inferència estadística. Aplicació de proves d'hipòtesis Audiovisual
5. Contrasts d'hipòtesis Audiovisual
2. Probabilidad y variables aleatorias II Audiovisual
4. Introducción a la inferencia estadística. Intervalos de confianza Audiovisual
5. Contrastes de hipótesis Audiovisual

Amunt

Dado que la bioestadística es una ciencia que tiene un cuerpo de conocimento bien consolidado y que el nivel  procedencia del alumnado es diferente, se ha considerado no incluir unos apuntes que sean mero plagio de los libros existentes y  se ha planteado utilizar cuatro  libros de diferente nivel y enfoque para que cada uno encuentre el más adecuado a sus necesidades. Hay que recordar que el objetivo del master es que el alumnado adquiera  un nivel de especialización que le permita aplicar los conocimientos adquiridos en la práctica profesional. En un entorno tan dinámico como el de las materias del máster, es útil que el alumnado sea capaz de encontrar en los diversos recursos disponibles la información que necesita.

. En cada unidad se indicaran los capítulos del los diferentes libros que más se adecúan a los conceptos requeridos de la unidad.

Además, en la presentación de la unidad se incluirán los principales puntos que hay que  retener, añadiendo pequeños resúmenes.  A modo experimental se incluirán pequeños videos explicativos de los contenidos del curso así de como de cada unidad para facilitar la comprensión de los temas 

Además, se proporcionaran debates de carácter voluntario que trataran los principales puntos del tema desde un punto de vista práctico y conceptual. De la discusión entre el alumnado y la presentación final de los ejercicios resueltos se pretende fijar los contenidos del tema. 

La descripción general de los libros es la siguiente:

  • Bioestadística Universitat de Málaga

Es un texto de bioestadística en castellano de la Universidad de Málaga , cuyo contenido  se adapta bastante bien  a la materia del curso y que dispone de ejercicios y preguntas test para autoevaluación, tiene una versión en papel: Rius F, Wärnberg J (2014): Bioestadística 2ª Edición. Ed. Paranimfo. Para aquellos que entráis en el mundo de la bioestadística  o tengáis dificultades con el inglés , este libro es de fácil compresión, pero tiene algunas lagunas  y errores en algunas formulas  de algún punto  concreto del temario que os comentaremos. 


  • Shahbaba, Babak (2011). Biostatistics in R. An Introduction to Statistics Through Biological Data

Si tuviéeramos que indicar algún libro como de texto único este sería el indicado, aunque la última unidad del curso de remuestreo no esté incluida. Los contenidos del curso comienzan a partir del  tema 4, pero es recomendable que os leáis los anteriores ya que  incluyen los conceptos de estadística descriptiva que habéis visto en vuestros estudios anteriores con aplicación en R que es el lenguaje de programación que utilizaremos como usuarios a lo largo del curso.  Lo mejor del libro es que combina la explicación teórica con la práctica en R , lo que ayuda a comprender los contenidos.  El libro lo tenéis a disposición en la biblioteca de la UOC siguiendo el enlace. 

  •  Mathur-SK (2010) Statistical Bioinformatics with R

Combina un enfoque tradicional, y no elemental, de la estadística con un planteamiento a partir de problemas generados por la bioinformática, especialmente el análisis de datos de microarrays. La característica más notable de este libro es que se apoya constantemente en el lenguaje de programación R con el fin de ilustrar los conceptos mediante cálculos, gráficos o simulaciones por lo que una vez más se puede seguir de diversas formas. A veces se vuelve complejo con la forma como trata la resolución práctica de las diferentes cuestiones en R , sobretodo si no se está muy introducido en el mundo bioinformático. Este libro lo podéis encontrar en la biblioteca de la UOC siguiendo el enlace y se podría considerar el libro de texto  avanzado de la asignatura.

  • Caffo B Statistical Inference for Data Science. (2016)

Este libro está diponible en la biblioteca  de la UOC y esta desarrollado por los autores a partir de la experiencia de los cursos de Coursera elaborados desde la Universidad Johns Hopkins. El libro está bien estructurado y  contempla todos los aspectos de una forma resumida para el análisis de datos  El libro es sencillo de seguir y además podéis acceder a los videos desarrollados por los autores, que acompañan  las sesiones que os pueden ayudar a entender algunos aspectos. Algunos de los puntos están desarrollados de una forma muy esquemática. Para la comprensión de la última unidad es el mejor libro . 

Otros materiales de apoyo

Además de los libros mencionados se  incluyen otros materiales que pueden ser útiles a lo largo del curso. También en las diferentes unidades, además del video de presentación de los diferentes materiales, se incluirán algunos enlaces a recursos web , applets y resúmenes que pueden ayudar a mejorar la información 

  •  Rafael A. Irizarry, Michael I. Love. Data Analysis for the Life Sciences with R(2015)

Este texto se trata de un manual de uso transversal en diferentes asignaturas del master que  va desde la estadística básica a análisis más sofisticados de bioinformática, utilizando R como software de soporte. El libro recoge los principales conceptos y muestra ejemplos de uso de la bioestadística , si bien no recoge toda la información necesaria.

  • Material de la asignatura de grado de la UOC. Estadística [Recurs electrònic] / Josep Gibergans Bàguena, Àngel J. Gil Estallo, Carles Rovira Escofet

Este material es el que se utiliza en la asignatura de estadística en varios grados de la UOC como Data Science o Informática. Está bien explicado con numerosos ejemplos. Aunque su contenido no es exactamente el de la asignatura del Master puede ser de utilidad para afianzar algunos conceptos y temas. 

 

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt