Inferencia estadística Código:  M0.155    Créditos:  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los materiales que dispone la asignatura   Bibliografía y fuentes de información   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

 

La bioestadística trata de la aplicación de la estadística a problemas de ciencias de la vida (denominada habitualmente biometría) o de la salud (comúnmente descrita en este caso como bioestadística). Como todas las ciencias aplicadas, consta de una o más disciplinas básicas, aquí la estadística, cuya aplicación se centra o especializa en un determinado ámbito, aquí la biología, la bioinformática o la medicina.
Los fundamentos de inferencia estadística que se presentan en esta asignatura discurren a lo largo de las dos ideas que se acaban de mencionar. Por un lado se busca establecer los conceptos y métodos básicos acerca de probabilidad y estadística que todo practicante de dicha disciplina debe conocer. Al mismo tiempo, dado que a ésta la siguen otras asignaturas, es preciso que sirva para fundamentarlas. En resumen una parte de la asignatura debe de servir para presentar ideas básicas y la otra servir de base sobre la que construir desarrollos posteriores, en este curso u otros que le puedan seguir.
Para ello la asignatura se organizará en tres bloques que se describen con detalle más adelante: Modelos probabilísticos, Conceptos de inferencia estadística y Aplicaciones.
Para acabar esta descripción general vale la pena decir dos cosas sobre que "no es" la bioestadística. La bioestadística no es estadística "diluída" para que puedan entenderla profesionales sin formación matemática. Es estadística de cualquier tipo o nivel que se aplica a problemas de ciencias de la vida. La bioestadística no es tampoco epidemiología, psicometría o genética estadística: Estas disciplinas se apoyan, como la bioestadística, en la estadística, a la vez que se aplican a ciencias de la vida, pero su trayectoria ha sido ya lo suficientemente larga como para que pueda considerárselas independientes de la que aquí nos ocupa

 

Amunt

Esta asignatura se encuentra al principio del plan de estudios por dos motivos: Por un lado, porque presenta los conceptos básicos que todo usuario de la (bio)estadística debe de conocer, sirviendo de puente entre un eventual formación previa y este posgrado. Por el otro, porque establece las bases sobre las que construir las demás asignaturas, siendo por tanto ésta la única posición razonable: antes de las otras materias.

Amunt

La bioestadística ha tenido siempre una gran aplicación en las ciencias de la vida. Se la encuentra en multitud de ámbitos, que van desde la investigación agrícola, contribuyendo a estudios de mejora vegetal (transgénica o no), hasta la "Salud pública" -por ejemplo ayudando a diseñar encuestas de calidad de vida. Pasando naturalmente por la investigación médica de pequeña escala (análisis de datos en estudios sencillos) o de grandes dimensiones (por ejemplo ensayos clínicos multicéntricos, por ejemplo para evaluar la eficacia de la vacuna de la malaria en múltiples países africanos).

Las competencias y habilidades concretas que de ésta asignatura se derivan deberían preparar para la realización de análisis estadísticos básicos, por lo que se proyecta en cualquier campo profesional en que deban de realizarse tratamientos de datos, desde el control de calidad en el laboratorio, las ciencias ambientales o la investigación biomédica básica.

Ejemplos de perfiles profesionales que hacen un uso importante de los conceptos y técnicas desarrollados en esta asignatura son los siguientes:

         Investigadores de cualquier ámbito de ciencias de la vida que deban diseñar experimentos, organizar su información o analizar los datos obtenidos.

         Personal de soporte en hospitales, laboratorios o centros de investigación que pueda necesitar tratar la información generada por la actividad propia del centro.

         Analistas de datos, bioestadística@s o «data scientists», término de reciente aparición que se refiere a profesionales con conocimiento de análisis de datos pero también de informática y gestión de datos en la web entre otras habilidades.

         Bioinformático. No se trata de una confusión del plan docente sino generalizada: muchos científicos creen que necesitan un bioinformático pero las tareas en las que piensan son propias de un Bioestadístico

Amunt

Esta asignatura puede afrontarse con dos tipos de conocimientos previos.

         Sería ideal cierta formación matemática -un curso de álgebra y cálculo y alguno de estadística básica- para poder avanzar rápidamente y fundamentar los conceptos que quizás se hayan adquirido desde una perspectiva práctica.

         En ausencia de dicha base, los requerimientos serán algo más amplios, dado que será preciso trabajar a la vez los aspectos técnicos, conceptuales y la aplicación.

Ahora bien, es un hecho harto sabido que la formación estadística y matemática es de lo más heterogénea por lo que, en vez de asumir que se conoce todo lo que se debería conocer, se dispondrán de "apuntadores" adecuados a material de refuerzo, con el fin de disponer de informaciones básicas sobre las técnicas que se utilizaran en la asignatura. 

Amunt

Esta asignatura pretende establecer las bases probabilísticas y estadísticas para el estudio de temas más avanzados a la vez que presentar las herramientas básicas de todo análisis de datos.

Las capacidades a adquirir serán:

         Conocimiento de los fundamentos de probabilidad adecuados para modelizar situaciones de interés en problemas biológicos a la vez que para fundamentar los métodos estadísticos presentados en la segunda parte de la asignatura y resto del posgrado.

         Conocimiento de los métodos estadísticos básicos para el análisis de datos cuantitativos o cualitativos en un contexto paramétrico o no paramétrico.

         Conocimiento a nivel conceptual y/o operativo -según el caso- de conceptos y técnicas más avanzados con el fin de tener, a la vez que unas herramientas básicas, una perspectiva amplia de la bioestadística.

Amunt

Los contenidos se organizan por temas, los cuales se agrupan en actividades no evaluables, que es el bloque de información tal como se ve en el aula. Al final de cada ejercicio habrà un par de actividades para debatir

Unidad I. Probabilidad y variables aleatorias

1.1. Introducción: Modelos probabilísticos en Biología.

1.2. Probabilidad y reglas de cálculo de probabilidades.

1.3 Independencia y Probabilidad condicionada. Teorema de Bayes

1.4. La modelización de la variabilidad biológica: Variables aleatorias

1.5. Características de las variables aleatorias: Esperanza y varianza

1.6. Distribuciones de probabilidad univariantes.

 

Unidad II: Probabilidad y variables aleatorias (II)

2.1. Variables aleatorias multidimensionales.

2.2 Distribuciones conjuntas, marginales y condicionales,.

2.3 Valores esperados, covariancia y correlación.

2.4 Distribuciones multivariantes: Multinomial y Normal bivariante.

2.5. Introducción a los Procesos estocásticos y cadenas de Markov

 

Unidad III: Introducción a la  inferencia estadística: muestreo y estimación

3.1. Los problemas de la inferencia estadística.

3.2. Muestreo y distribuciones en el muestreo.

3.3. La verosimilitud y su papel en la inferencia estadística

3.4. El problema de la estimación. Tipos de estimadores.

3.5. Métodos de obtención de estimadores. Estimadores máximo verosímiles  y estimadores bayesianos.

3.6. Propiedades de los estimadores.

3.7. Aplicaciones: Estimación del error estándar y cálculo del tamaño muestral

 

Unidad IV Estimación mediante intervalos de confianza.

4.1. Estimadores por intervalo: intervalos de confianza

4.2. Intervalos de confianza para características de una población normal (media, varianza),

4.3. Los métodos bootstrap. Estimación del error estándar e intervalos de confianza bootstrap.

4.4. Intervalos de confianza para proporciones binomiales

4.5. Intervalos de confianza para parámetros en muestra grandes y para casos generales (tasas, OR, ...)

 

Unidad V: Pruebas de hipótesis

5.1. Conceptos básicos: pruebas de hipótesis y de significación, pruebas unilaterales y bilaterales, tipos de error, valores críticos de test y p-valores

5.2. Potencia de un test. Cálculos de potencia y de tamaño de la muestra. Tamaño del efecto.

5.3. Métodos de construcción de tests.

5.4. Pruebas de normalidad. El test de Shapiro-Wilks

5.5. Pruebas de hipótesis para constrastar variables cuantitativas: Pruebas Paramètricas t-test y Anova

5.6 Pruebas de hipótesis para constrastar variables cuantitativas: Pruebas de hipótesis no paramètricas de Wilcoxon y Kruskal-Wallis

 

Unidad VI: Aplicaciones de los tests estadísticos

6.1. Contrastes para datos categóricos. Pruebas binomiales, ji cuadrado y test de Fisher.

6.2. Riesgo relativo y razón de «odds»

6.3. Test exacto de Fisher.

6.4. Tests ji cuadrado. Pruebas de independencia, de homogeneidad y de bondad de ajuste

 

Unidad VII: Métodos de computación intensiva y comparaciones múltiples

7.1. Tests de permutaciones; ¿Qué?, ¿Cuando?, ¿Cómo?

7.2. El bootstrap en contraste de hipótesis

7.3 El problema de las comparaciones múltiples

7.4. Métodos de control de error: FWER y FDR

 

 

Amunt

Material Soporte
Vídeo de presentación de la asignatura Audiovisual
Vídeo de presentació de l'assignatura Audiovisual
Estadística PDF
Estadística PDF
Inferencia estadística. Introducción y plan docente Audiovisual
Inferència estadística. Introducció i pla docent Audiovisual
2. Probabilitat i variables aleatòries II Audiovisual
4. Introducció a la inferència estadística. Intervals de confiança Audiovisual
Inferencia estadística. Probabilidad y variables aleatorias I Audiovisual
3. Introducción a la inferencia estadística. Muestreo y estimación Audiovisual
Inferència estadística. Probabilitat i variables aleatòries I Audiovisual
Inferencia estadística. Aplicación de pruebas de hipótesis Audiovisual
3. Introducció a la inferència estadística. Mostreig i estimació Audiovisual
Inferència estadística. Aplicació de proves d'hipòtesis Audiovisual
5. Contrasts d'hipòtesis Audiovisual
2. Probabilidad y variables aleatorias II Audiovisual
4. Introducción a la inferencia estadística. Intervalos de confianza Audiovisual
5. Contrastes de hipótesis Audiovisual

Amunt

En este curso se utilizara como material de apoyo el libro de Bioestadística Rius F y Wärnberg J que se os a enviado como guia para poder seguir todo el curso . Además seguiremos el libro electrónico de Caffo B (Statistical inference for data Science ) que acompaña a los Cursos de Coursera de especialización analisis de datos de la Universidad Johns Hopkins

Ademàs se proporcionaran artículos o capitulos que pueden complementar algunos apartados no cubiertos  por estos libro, sobre todo del libro de Marhur .

 

 

Bibliografía y fuentes de información

  • Rius F, Wärnberg J (2014): Bioestadística 2ª Edición. Ed. Paranimfo
  • Caffo B, Statistical Inference for Data Science. (2016) https://leanpub.com/LittleInferenceBook
  • K. Mathur, Sunil. (2010): Statistical Bioinformatics with R. Ed. Elsevier.


Bibliografía complementaria

  • Andrés, M. Luna del Castillo, J.D.,  (2008). Bioestadística, una metodología para las ciencias de la salud.
  • Forthofer, R., Sul Lee, E., Hernandez, M. (2007) Biostatistics, Second Edition: A Guide to Design, Analysis and Discovery. Academic Press.
  • Logan M. (2010). Biostatistical Design and Analysis Using R. Ed. Wiley Blackwell
  • Peña, D. (2008) Fundamentos de Estadística. Alianza Editorial,
  • Quinn, G.P., Keough, M. J.(2002) Experimental Design and Data Analysis for Biologists. Cambridge University Press.
  • Rius, J. (2009) Bioestadística, métodos y aplicaciones http://www.bioestadistica.uma.es/libro/
  • Seefeld, K. (2007)  Statistics Using R with biological exampleshttp://cran.r-project.org/doc/contrib/Seefeld_StatsRBio.pdf

 

Cursos en linea libres (MOOC)

 

 

 

Amunt

 Para cada unidad se suministrará una guía de estudio en donde se señalará los materiales de lectura correspondientes al tema con indicaciones sobre qué parte de los materialesl se corresponden con cada punto del tema y con qué detalle deben tratarse. Los materiales de lectura pueden consistir en capítulos o apartados del material docente de Bioinformática de la UOC o bien en tutoriales, manuales o artículos que se proporcionaran en formato .pdf o bien en forma de hiperenlaces.

La lectura del material didáctico siguiendo las orientaciones de la guía conforma la primera actividad de cada bloque y que deberá realizar el estudiante de forma individual. Con ello se pretende que el estudiante se familiarice con el contenido de la materia así como con el material en sí mismo, el cual se transformará en material de consulta para el estudiante durante el desarrollo del módulo. Lógicamente esta actividad se debe desarrollar en los primeros días del bloque, para poder abordar posteriormente el debate y la PEC.

Debates Esta segunda actividad que repetiremos a mitad o final de unoa o varias unidades en donde no se realice una de las dos PECs pervistas. Estos consistiran en   en un debate abierto sobre los aspectos fundamentales del tema. El debate debe ser el foro en donde se ponga de manifiesto la comprensión de los aspectos centrales del tema o las dificultades que éste conlleva. Para ello se trataran tanto aspectos conceptuales como prácticos a fin de trabajar conceptos y habilidades fundamentales como es la resolución de problemas o el análisis de datos utilizando las herramientas aprendidas en la parte de software estadístico.

PECs (Pruebas de Evaluación Contínua) A lo largo de la asignatura deberán resolverse dos PECs, una  tras las primeras cuatro unidades y otra hacia el final de la asignatura. Las PECs pueden combinar ambos objetivos, es decir, desarrollar conceptos y habilidades, e incluir resolución de problemas de modelización y de análisis de datos.

Evaluación


Para superar esta asignatura es condición necesaria (no suficiente):

  • Realizar y entregar en el plazo fijado las dos pruebas de evaluación continuada (PEC) propuestas.
  • Participar en los debates asociados a dichas PEC, siguiendo las orientaciones del consultor, y que servirán para complementar la nota de cada PEC.
  • En la calificación final cada una de las PEC tendrá el mismo peso.

 Se valorará especialmente:

  •  Comprensión y relación de los conceptos trabajados.
  • Capacidad de presentación y redacción de los conceptos y análisis contenidos en las pruebas de evaluación continuada.
  • Dominio de la argumentación on-line como mecanismo de confrontación y creación de conocimiento, demostrada a través de la participación en el foro de debates.

    Soluciones de las PEC:

 

  • Las soluciones a las PEC se harán públicas al mismo tiempo que las notas obtenidas. De este modo podréis contrastar vuestras respuestas con las soluciones correctas y así modificar ideas erróneas o incidir en el estudio de los puntos más flojos.
  • La idea es presentaros, como solución, una PEC mosaico con las respuestas más completas o con un mejor enfoque de vuestras propias PEC.

    La planificación propuesta se desarrolla a lo largo de quince (±1) semanas (5 créditos) a las que el estudiante debe ajustarse para un adecuado seguimiento de la asignatura. Dentro de estas semanas existen dos fechas clave que se comunicaran tras el inicio de la asignatura, correspondientes a las entregas de las PEC de la asignatura.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

La UOC habilitará los mecanismos que considere oportunos para velar por la calidad de sus titulaciones y garantizar la excelencia y la calidad de su modelo educativo.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

Para superar esta asignatura es condición necesaria (no suficiente):

  • Realizar y entregar en el plazo fijado las dos pruebas de evaluación continuada (PEC) propuestas.
  • Participar en los debates asociados a dichas PEC, siguiendo las orientaciones del consultor, y que servirán para complementar la nota de cada PEC.
  • En la calificación final cada una de las PEC tendrá el mismo peso.

 Se valorará especialmente:

  •  Comprensión y relación de los conceptos trabajados.
  • Capacidad de presentación y redacción de los conceptos y análisis contenidos en las pruebas de evaluación continuada.
  • Dominio de la argumentación on-line como mecanismo de confrontación y creación de conocimiento, demostrada a través de la participación en el foro de debates.

Amunt