Análisis de datos ómicos Código:  M0.157    :  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

La investigación en biología molecular y biomedicina (entre otras) han generado a partir de principios del siglo XXI ingentes cantidades de información

Las tecnologías ómicas, popularizadas por los métodos de análisis de la expresión génica seguidas por la secuenciación masiva y extendidas hoy a multitud de otras (proteómica, metabolómica, metagenómica, etc.) han contribuido, aún más si cabe, al crecimiento casi exponencial de la información disponible.

Este aumento masivo de la información ha impulsado -de forma similar a como, en su momento, hizo el proyecto "Genoma Humano" nuevos desarrollos en la bioinformática, la ciencia que combina la tecnología computacional, las matemáticas, la informática y el conocimiento biológico para recolectar, almacenar y analizar la información obtenida.

La estadística, que siempre ha jugado un papel importante en la bioinformática ha adquirido en esta nueva etapa, mucha más relevancia. Ha pasado de utilizarse en aspectos como la construcción de modelos de predicción de genes o la estructura o función de las proteínas a la aplicación y eventualmente el desarrollo de todo tipo de técnicas de análisis de datos, que tras un rápido inicio en el campo de la expresión génica (microarrays) se ha ido infiltrando hacia el resto de tecnologías ómicas. . Una característica interesante de esta sinergia bioinformática-bioestadística es que, aunque, por un lado la estadística ha contribuido en muchos aspectos a facilitar el análisis de datos ómicos, por otro lado se ha visto beneficiada de un gran número de problemas metodológicos que han acabado redundando en nuevos métodos. Es decir, se puede afirmar sin lugar a dudas que estadística y bioinformática han contribuido mutuamente a su crecimiento y desarrollo.

Visto lo visto no resultará extraño si afirmamos que para avanzar en esta asignatura deberemos manejar tres disciplinas básicas como son la biología, la bioinformática y  la estadística.

Amunt

Esta materia encaja perfectamente a continuación de las materias de biología molecular, inferencia estadística y genómica computacional porque los conocimientos que de éstas se derivan permiten contextualizar los problemas que aquí se tratan.

Si bien es cierto, que sería posible cursar la asignatura centrándose tan sólo en sus aspectos cuantitativos de modelización y análisis de datos, no cabe duda que su presencia en la segunda parte del máster , facilita el disponer de una cierta base tanto de biología como de estadística y bioinformática que permite comprender mejor el procesado y la interpretación de los datos, en los diferentes aspectos que éste lleva implícito.

Amunt

Probablemente el análisis de datos ómicos ha sido -junto con las capacidades de desarrollo de aplicaciones- uno de los campos en que se ha generado mayor demanda, en el entorno de la bioinformática y la biomedicina, en los últimos años. Ello es debido a que la velocidad con que la que se ha estandarizado -y reducido de coste- estas técnicas no han venido acompañada de la formación adecuada de los investigadores. Cada vez más el uso de tecnologías ómicas se ha convertido en una opción habitual en estudios de biomedicina, nutrición o biología. A diferencia, o de forma similar, a lo que sucede en otras disciplinas estos análisis requieren de un buen nivel de preparación, sobre todo por lo que se ha comentado que necesitan de conocimientos interdisciplinares.

En este contexto, cada vez más, los centros y equipos de investigación biomédica necesitan de personal con esta preparación mixta -bioinformática, biología, estadística computacional generando esta intersección de conocimientos un perfil profesional atrayente y con expectativa de futuro.

Amunt

Esta asignatura es probablemente la más interdisciplinar del máster, por lo que puede beneficiarse de casi todas las asignaturas que en él se tratan.

No debería cursarse sin los conocimientos que se imparten en las asignaturas de Biología molecular, Inferencia estadística y Software para el análisis de datos. Si además ya se ha cursado, o se está cursando la asignatura obligatoria de Regresión Modelos y Métodos, se dispondrá de una base más sólida para comprender y utilizar la parte de análisis dedicada a los modelos lineales.

Amunt

Muchos de los contenidos de esta asignatura se han desarrollado en tiempos recientes. Muchos otros están en constante cambio y evolución. Por este motivo la asignatura se basará -además de en unos materiales que ya acusan el paso del tiempo- en artículos y otros materiales como vídeos disponibles en internet. Obviamente salvo los apuntes, la inmensa mayoría de los materiales estarán en ingles.

Amunt

El objetivo de esta asignatura es aprender a trabajar con datos ómicos desde la óptica bioinformática, es decir, partiendo de un problema para cuya estudio se utilizan las tecnologías ómicas, conocer y comprender las distintas etapas que van desde el pre-procesado de los datos crudos hasta el análisis y la interpretación de los resultados.

En la práctica esta aplicación se puede separar en dos aspectos:

  • Por una parte está la utilización de métodos estadísticos convencionales (o su reformulación) a estos nuevos problemas.

  • Por otra parte aparece la necesidad de desarrollar nuevos métodos y nuevas herramientas para poder tratar esta nueva "tipología de datos".

Las capacidades a adquirir  serán:

  • Conocimiento de los diferentes tipos de datos ómicos y las técnicas utilizadas para generarlas.

  •  Conocimiento de los métodos para tratar (recoger, preprocesar, analizar, almacenar) los distintos tipos de datos, dando especial importancia a la posibilidad de llevar a cabo un proceso de análisis completo: desde el diseño experimental del análisis, hasta la obtención de los resultados.

  • Conocimiento de los métodos y dominio de algunas de las herramientas existentes para su tratamiento. Se dará especial importancia a la utilización de software libre y de código abierto, y en especial al lenguaje R.

  • Conocimiento y comprensión de los problemas biológicos que se estudian utilizando estas tecnologías. A partir del diseño experimental asociado el problema biológico, se realizaran los análisis numéricos con el fin de valorizar en un informe final la "pregunta biológica" planteada de partida.

Amunt

I.  LAS ÓMICAS (30%)

1.1.  Introducción a las ómicas

Métodos de obtención de datos de alto rendimiento (HTS)

Herramientas bioinformáticas (I): Los repositorios de datos Ómicos. etc

Herramientas bioinformáticas (II): Bioconductor.

 

1.2.  Introducción a la ultrasecuenciación (High Throughput Sequencing)

Introducción a la ultrasecuenciación

Tipos de estudios que pueden realizarse usando NGS

Herramientas bioinformáticas (III): Galaxy.

 

1.3.  El proceso de análisis de datos ómicos

  • El proceso de análisis. Etapas y métodos
  • Métodos estadísticos (I) 
    • Exploración multivariante, 
    • Análisis de Componentes Principales (PCA) e 
    • introducción a los métodos de agrupación (Hierarchichal Clustering)

 

II.  ANALISIS DE LA EXPRESIÓN GÉNICA (40%)

2. 1 Los estudios de expresión génica

Tecnologías de análisis de la expresión génica

Métodos estadísticos (II): Diseño de experimentos

El preprocesado de los datos. Efecto batch y su ajuste

 

2.2.  Análisis de datos de microarrays

Lectura de datos control de calidad y normalización

Selección de genes diferencialmente expresados

Métodos Estadístico (III) Modelos lineales para datos omicos contínuos. Limma

Métodos Estadístico (IV) Ajuste de p-valores en contrastes múltiples

Pipelines de análisis de expresión con microarray con Bioconductor

 

2.3.  Análisis de expresión con RNA-seq

Lectura de datos control de calidad y normalización

Métodos bioinformáticos (III) Manejo de secuencias con bioconductor

Métodos estadísticos (V): Análisis de datos de contaje

Modelos estadísticos para datos de RNA-seq

Pipelines de análisis de expresión con RNA-seq con Bioconductor

 

2.4.  Análisis de listas de genes

Cuando acaba la selección: listas de genes y otras características.

Sistemas de anotación. Bases de datos, Ontolgías y la GO

Análisis de signi¿cación biològica: ORA y GSEA

Pipeline de análisis de significación biológica con Bioconductor

 

III.  OTRAS ANÁLISIS DE DATOS ÓMICOS (30%)

 

3.1.  Análisis de variantes con minoritarias con DNA-seq

 Selección de variantes, anotación y priorización usando datos de DNA-seq

Métodos bioinformáticos (III) Selección de variantes con Galaxy

Pipelines de análisis de variantes con Galaxy

 

3.2.  Las otras ómicas

Análisis de datos de Metabolómica y Proteómica,

Análisis de de metilación en estudios de epigenómica

Análisis de datos de estudios de metagenómica

 

3.3 Análisis de datos multiómicos

Análisis de datos multiómicos

Análisis de datos de una sola célula

Métodos Estadísticos (V): Métodos para la integración de datos


Amunt

Vídeo de presentació de l'assignatura Audiovisual
Vídeo de presentación de la asignatura Audiovisual
1. Presentación del curso. Análisis de datos ómicos y funcionamiento Audiovisual
2. Las ómicas: tecnologías, datos y análisis Audiovisual
5. Diseño de experimentos (II) Audiovisual
9. Análisis de listas de genes. Presentación de la actividad Audiovisual
4. Diseño de experimentos (I) Audiovisual
16. Secuenciación Sanger Audiovisual
3. El proceso de análisis de datos ómicos: presentación de la actividad Audiovisual
8. Análisis de datos de microarrays Audiovisual
12. Caso resuelto de análisis de microarrays (2b). Filtrado no específico Audiovisual
7. Análisis de datos de microarrays: presentación de la actividad Audiovisual
15. Introducción Audiovisual
17. Comparación de tecnologías Audiovisual
13. Caso resuelto de análisis de microarrays (3). Selección de genes y análisis de enriquecimientos Audiovisual
11. Caso resuelto de análisis de microarrays (1) (2a) Audiovisual
6. Diseño de experimentos (III) Audiovisual
10. Análisis de significación biológica Audiovisual
14. Introducción a la ultrasecuenciación: presentación de la actividad Audiovisual
3. El procés d'anàlisi de dades òmiques: presentació de l'activitat Audiovisual
7. Anàlisi de dades de microarrays: presentació de l'activitat Audiovisual
2. Les òmiques: tecnologies, dades i anàlisi Audiovisual
17. Comparació de tecnologies Audiovisual
14. Introducció a la ultraseqüenciació: presentació de l'activitat Audiovisual
6. Disseny d'experiments (III) Audiovisual
1. Presentació del curs. Anàlisi de dades òmiques i funcionament Audiovisual
10. Anàlisi de significació biològica Audiovisual
5. Disseny d'experiments (II) Audiovisual
16. Seqüenciació Sanger Audiovisual
13. Cas resolt d'anàlisi de microarrays (3). Selecció de gens i anàlisi d'enriquiment Audiovisual
11. Cas resolt d'anàlisi de microarrays (1) (2a) Audiovisual
9. Anàlisi de llistes de gens. Presentació de l'activitat Audiovisual
15. Introducció Audiovisual
4. Disseny d'experiments (I) Audiovisual
8. Anàlisi de dades de microarrays Audiovisual
12. Cas resolt d'anàlisi de microarrays (2b). Filtratge no específic Audiovisual
19. Análisis de datos de RNA-Seq. Introducción Audiovisual
21. Análisis de datos de RNA-Seq. Selección de genes diferencialmente expresados Audiovisual
26. Análisis de datos de exomas. Anotación y filtrado de variantes Audiovisual
18. Análisis de datos de secuenciación: presentación de la actividad Audiovisual
27. Cas resolt d'anàlisi de variants amb Galaxy Audiovisual
26. Anàlisi de dades d'exomes. Anotació i filtratge de variants Audiovisual
24. Análisis de datos de exomas. Aplicaciones Audiovisual
18. Anàlisis de dades de seqüenciació: presentació de l'activitat Audiovisual
20. Análisis de datos de RNA-Seq. Ensamblaje y aliniamiento Audiovisual
22. Caso resuelto de análisis de RNA-Seq con Bioconductor Audiovisual
20. Anàlisi de dades de RNA-Seq. Ensamblatge i aliniament Audiovisual
25. Análisis de datos de exomas. Selección de variantes Audiovisual
24. Anàlisi de dades d'exomes. Aplicacions Audiovisual
25. Anàlisi de dades d'exomes. Selecció de variants Audiovisual
23. Anàlisi de dades d'exomes. Introducció Audiovisual
22. Cas resolt d'anàlisi de RNA-Seq amb Bioconductor Audiovisual
19. Anàlisi de dades de RNA-Seq. Introducció Audiovisual
27. Caso resuelto de anàlisis de variantes con Galaxy Audiovisual
21. Anàlisi de dades de RNA-Seq. Selecció de gens diferencialment expressats Audiovisual
23. Análisis de datos de exomas. Introducción Audiovisual

Amunt

  • El análisis de datos ómicos evoluciona a gran velocidad lo que determina, la rápida aparición de nuevas tecnologías y nuevos métodos. Lamentablemente esto también comporta que algunos materiales o algunos contenidos de éstos, puedan pasar de ser actuales a estar, como mínimo desactualizados (resulta algo esnob tacharlos de obsoletos).
  • Por este motivo los materiales cion los que trabajaremos son una mezcla de los materiales "oficiales" de la asignatura, difíciles de cambiar de un año para otro, y complementos a los mismos pensados para facilitar esta necesidad de actualización.
  • Esto significa que los materiales constarámn de apuntes y vídeos, pero también casos resueltos en repositorios de código, y algunos documentos o vídeos externos a la UOC que solemos seleccionar porque representan un soporte de gran calidad que no tendría ningún sentido recrear "in-house" para que quedasen desactualizados mientras los acabamos.
  • Para facilitar el estudio y la navegación entre los materiales cada actividad dispone de un vídeo y un documento guía que indica los contenidos principales de la misma, los recursos a utilizar y en qué puntos es importante insistir.

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt