Análisis de datos ómicos Código:  M0.157    Créditos:  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los materiales que dispone la asignatura   Materiales y herramientas de apoyo   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

La biología molecular ha generado a partir de la última década, ingentes cantidades de información provenientes tanto de los diversos proyectos de secuenciación (obtención de genomas) como de las tecnologías que utilizan la información producida.

Las tecnologías de análisis de la expresión génica -y otros aspectos biológicos- mediante microarrays han contribuido, aún más si cabe, al crecimiento casi exponencial de la información disponible.

De forma paralela a este aumento masivo de la información se ha desarrollado la bioinformática, ciencia que combina la tecnología computacional, la informática y el conocimiento biológico para recolectar, almacenar y analizar la información obtenida.

Uno de los pilares de la bioinformática es, la estadística. Esta incide en multitud de aspectos, desde la construcción de modelos para el análisis y la predicción de genes o la estructura o función de las proteínas hasta la aplicación y eventualmente el desarrollo de todo tipo de técnicas de análisis de datos, que tras un rápido inicio en el campo de la expresión génica (microarrays) está derivando hacia áreas próximas que también generan cantidades ingentes de datos como la proteómica, la metabolómica y, muy  especialmente, la ultrasecuenciación ("next generation sequencing").
 
Así pués esta asignatura llevará implícito tener un nivel de conocimiento de  tres disciplinas básicas como son la biología, la bioinformática y  la estadística.

Amunt


Esta materia encaja perfectamente a continuación de las materias de biología, informática y genómica computacional porque los conocimientos que de éstas se derivan permiten contextualizar los problemas que aquí se tratan.

Si bien es cierto, que sería posible cursar la asignatura centrándose tan sólo en sus aspectos cuantitativos de modelización y análisis de datos, no cabe duda que su presencia en el segundo semestre, facilita el disponer de una cierta base tanto de biología como de bioinformática que permite comprender mejor el procesado de los datos, en los diferentes aspectos que éste lleva implícito.

Amunt


Probablemente el análisis de microarrays ha sido -junto con las capacidades de desarrollo "web"- uno de los campos en que se ha generado mayor demanda, en el entorno de la bioinformática y la biomedicina, en los últimos años. Ello es debido a que la velocidad con que la que se ha estandarizado -y reducido de coste- estas técnicas no han venido acompañada de la formación adecuada de los investigadores. Sin embargo, en los últimos años, la tecnología de secuenciación de ARN (RNA-Seq) se ha convertido en una opción importante en los análisis de expresión diferencial en diferentes condiciones biológicas y si bien la tecnología de microarrays se utiliza para el mismo propósito, la metodología estadística no es fácilmente aplicable al análisis de los datos de RNA-Seq, por la propia especificidad de los datos.

En este contexto, cada vez más los centros y equipos de investigación biomédica necesitan de personal con esta preparación mixta -bioinformática, biología, estadística computacional generando esta intersección de conocimientos un perfil profesional atrayente y con expectativa de futuro

Amunt


Esta asignatura tiene una clara base en la estadística por lo que son necesarios unos conocimientos de esta disciplina específicamente de la parte inferencial de la misma. Así mismo va a ser necesario complementar este conocimiento con un mínimo manejo del paquete estadístico R. Sin embargo se dispondrán de "materiales complementarios" adecuados como material de refuerzo, con el fin de disponer de informaciones básicas sobre las técnicas que se utilizaran en la asignatura.

Amunt


El objetivo de esta asignatura es dar a conocer los problemas que aparezcan a raíz de la aparición de las técnicas de generación masiva de datos ("high throughput") y mostrar cómo se aplica la bioinformática-estadística para valorizar los resultados obtenidos. Esta aplicación se puede separar en dos aspectos:

  •  Por una parte está la utilización de métodos estadísticos convencionales (o su reformulación) a estos nuevos problemas.
  • Por otra parte aparece la necesidad de desarrollar nuevos métodos y nuevas herramientas para poder tratar esta nueva “tipología de datos”.
Las capacidades a adquirir  serán:

  • Conocimiento de los diferentes tipos de datos asociados a “next generation sequencing” y las técnicas utilizadas para generarlas.
  •  Conocimiento de los métodos para tratar (recoger, preprocesar, analizar, almacenar) los datos asociados a experimentación asociada a “next generation sequencing”, dando especial importancia a la posibilidad de llevar a cabo un proceso de análisis completo: desde el diseño experimental del análisis, hasta la obtención de los resultados.
  • Conocimiento de los métodos y dominio de algunas de las herramientas existentes para su tratamiento. Se dará especial importancia a la utilización de software libre y de código abierto, y en especial al lenguaje R.
  • Conocimiento y comprensión de los problemas biológicos que se estudian utilizando estas tecnologías.  A partir del diseño experimental asociado el problema biológico, se realizaran los análisis numéricos con el fin de valorizar en un informe final la “pregunta biológica” planteada de partida.
 

Amunt

 

  •  Introducción a las tecnologías de alto rendimiento "high throughput" (1,5 cr)
  •  Repaso de conceptos básicos de biología molecular
  •  Métodos de obtención de datos de alto rendimiento (HTS)
    • Perspectiva general
    •  Microarrays de expresión génica
    •  Otros tipos de datos (Ultrasecuenciación (NGS), Proteómica, Metabolómica,...)
  •  Análisis de datos de microarrays (2,5 cr)
  •  Perspectiva general del análisis de datos de microarraysde expresión
  •  Diseño de experimentos de microarrays
  •  Lectura y control de calidad de las imágenes
  •  Preprocesado: Normalización y filtraje
  •  Detección de genes diferencialmente expresados
  •  Busca de patrones de coexpresión mediante análisis de "clusters"
  •  Diagnósticos moleculares y métodos de clasificación
  •  La ontología génica y sus aplicaciones para la interpretación biológica.
  • NGS (Next Generation Sequencing) (1cr)
  • NGS objetivo y alcance de dichos estudios (RNA-seq)
  • Control de calidad asociado a datos de RNA-seq.
  • Preprocesado de datos de RNA-seq
  • Análisis de expression de datos de RNA-seq

Amunt

Material Soporte
Vídeo de presentació de l'assignatura Audiovisual
Vídeo de presentación de la asignatura Audiovisual
1. Presentación del curso. Análisis de datos ómicos y funcionamiento Audiovisual
2. Las ómicas: tecnologías, datos y análisis Audiovisual
5. Diseño de experimentos (II) Audiovisual
9. Análisis de listas de genes. Presentación de la actividad Audiovisual
4. Diseño de experimentos (I) Audiovisual
16. Secuenciación Sanger Audiovisual
3. El proceso de análisis de datos ómicos: presentación de la actividad Audiovisual
8. Análisis de datos de microarrays Audiovisual
12. Caso resuelto de análisis de microarrays (2b). Filtrado no específico Audiovisual
7. Análisis de datos de microarrays: presentación de la actividad Audiovisual
15. Introducción Audiovisual
17. Comparación de tecnologías Audiovisual
13. Caso resuelto de análisis de microarrays (3). Selección de genes y análisis de enriquecimientos Audiovisual
11. Caso resuelto de análisis de microarrays (1) (2a) Audiovisual
6. Diseño de experimentos (III) Audiovisual
10. Análisis de significación biológica Audiovisual
14. Introducción a la ultrasecuenciación: presentación de la actividad Audiovisual
3. El procés d'anàlisi de dades òmiques: presentació de l'activitat Audiovisual
7. Anàlisi de dades de microarrays: presentació de l'activitat Audiovisual
2. Les òmiques: tecnologies, dades i anàlisi Audiovisual
17. Comparació de tecnologies Audiovisual
14. Introducció a la ultraseqüenciació: presentació de l'activitat Audiovisual
6. Disseny d'experiments (III) Audiovisual
1. Presentació del curs. Anàlisi de dades òmiques i funcionament Audiovisual
10. Anàlisi de significació biològica Audiovisual
5. Disseny d'experiments (II) Audiovisual
16. Seqüenciació Sanger Audiovisual
13. Cas resolt d'anàlisi de microarrays (3). Selecció de gens i anàlisi d'enriquiment Audiovisual
11. Cas resolt d'anàlisi de microarrays (1) (2a) Audiovisual
9. Anàlisi de llistes de gens. Presentació de l'activitat Audiovisual
15. Introducció Audiovisual
4. Disseny d'experiments (I) Audiovisual
8. Anàlisi de dades de microarrays Audiovisual
12. Cas resolt d'anàlisi de microarrays (2b). Filtratge no específic Audiovisual
19. Análisis de datos de RNA-Seq. Introducción Audiovisual
21. Análisis de datos de RNA-Seq. Selección de genes diferencialmente expresados Audiovisual
26. Análisis de datos de exomas. Anotación y filtrado de variantes Audiovisual
18. Análisis de datos de secuenciación: presentación de la actividad Audiovisual
27. Cas resolt d'anàlisi de variants amb Galaxy Audiovisual
26. Anàlisi de dades d'exomes. Anotació i filtratge de variants Audiovisual
24. Análisis de datos de exomas. Aplicaciones Audiovisual
18. Anàlisis de dades de seqüenciació: presentació de l'activitat Audiovisual
20. Análisis de datos de RNA-Seq. Ensamblaje y aliniamiento Audiovisual
22. Caso resuelto de análisis de RNA-Seq con Bioconductor Audiovisual
20. Anàlisi de dades de RNA-Seq. Ensamblatge i aliniament Audiovisual
25. Análisis de datos de exomas. Selección de variantes Audiovisual
24. Anàlisi de dades d'exomes. Aplicacions Audiovisual
25. Anàlisi de dades d'exomes. Selecció de variants Audiovisual
23. Anàlisi de dades d'exomes. Introducció Audiovisual
22. Cas resolt d'anàlisi de RNA-Seq amb Bioconductor Audiovisual
19. Anàlisi de dades de RNA-Seq. Introducció Audiovisual
27. Caso resuelto de anàlisis de variantes con Galaxy Audiovisual
21. Anàlisi de dades de RNA-Seq. Selecció de gens diferencialment expressats Audiovisual
23. Análisis de datos de exomas. Introducción Audiovisual

Amunt

 

 

Amunt


Antes de empezar cada tema se suministrará una guía de estudio en donde se señalará los materiales de lectura correspondientes al tema con indicaciones sobre qué puntos del material se corresponden con cada punto del tema y con qué detalle deben tratarse.

Los materiales de lectura pueden consistir en capítulos o apartados del material docente de Bioinformática de la UOC o bien en tutoriales, manuales o artículos que se proporcionaran en formato .pdf o bien en forma de hiperenlaces.

La lectura del material didáctico siguiendo las orientaciones de la guía conforma la primera actividad de cada bloque y que deberá realizar el estudiante de forma individual. Con ello se pretende que el estudiante se familiarice con el contenido de la materia así como con el material en sí mismo, el cual se transformará en material de consulta para el estudiante durante el desarrollo del módulo. Lógicamente esta actividad se debe desarrollar en los primeros tres o cuatro días del bloque, para poder abordar posteriormente el debate y la  prueba de evaluación continua (PEC).

Debates: Esta segunda actividad que repetiremos en cada unidad en la que no haya que presentar una PEC, consistirá en un debate abierto sobre alguno de los aspectos fundamentales del tema. El debate debe ser el foro en donde se ponga de manifiesto la comprensión de los aspectos centrales del tema o las dificultades que éste conlleva. Para ello se trataran tanto aspectos conceptuales como prácticos a fin de trabajar conceptos y habilidades fundamentales como es el manejo de las herramientas de exploración y análisis de la información.

PEC. A lo largo de la asignatura deberán resolverse dos PECs, una tras los dos primeros temas y otra al final de la asignatura. Las PECs pueden combinar ambos objetivos, es decir, desarrollar conceptos y habilidades, y serán equivalentes a escala a pequeños proyectos bioinformático-estadístico computacionales.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

La UOC habilitará los mecanismos que considere oportunos para velar por la calidad de sus titulaciones y garantizar la excelencia y la calidad de su modelo educativo.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt


Para superar esta asignatura el estudiante debe:

  •  Realizar y entregar en el plazo fijado las dos pruebas de evaluación continuada (PEC) propuestas.
  •  Participar en los debates asociados a dichas PEC, siguiendo las orientaciones del profesor, y que servirán para complementar la nota de cada PEC.
En la calificación final cada una de las PEC tendrá el mismo peso. Se valorará especialmente:
  •  Comprensión y correcta utilización de los conceptos trabajados.
  •  Capacidad de presentación y redacción de los informes complementados con los análisis realizados en las pruebas de evaluación continuada.
  •  Dominio de la argumentación on-line como mecanismo de confrontación y creación de conocimiento, demostrada a través de la participación en el foro de debates.
Soluciones de las PEC:

  •  Las soluciones POSIBLES a las PEC se harán públicas al mismo tiempo que las notas obtenidas.
  •  El concepto de soluciones POSIBLES pretende reflejar, que la solución de una PEC contendra las respuestas más completas en diseño, análisis y argumentación final del informe asociado a las PEC.
La planificación propuesta se desarrolla a lo largo de nueve semanas (5 créditos) a las que el estudiante debe ajustarse para un adecuado seguimiento de la asignatura. Dentro de estas nueve semanas existen dos fechas clave que se comunicaran tras el inicio de la asignatura, correspondientes a las entregas de las PEC de la asignatura

Amunt