Herramientas informáticas para la bioinformática Código:  M0.151    :  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

La investigación en Bioinformática suele consistir la mayoría de las veces en el análisis a nivel genómico a gran escala de grandes cantidades de datos. Por ejemplo, la creación del catálogo de genes de una especie puede comportar la predicción computacional de diferentes señales génicas a lo largo de su genoma (normalmente, varios Gigabytes) combinado con el alineamiento entre su secuencia y el genoma de otras especies para localizar regiones funcionales comunes.

En la práctica, la gestión de todos estos procesos y su posterior análisis no pueden ser llevados a cabo eficientemente de forma manual. Así, mediante programas y scripts desarrollados para cada problema concreto se planifica automáticamente la ejecución de cada bloque del protocolo que lleva a una posible solución del problema.

En una típica infraestructura bioinformática, los genomas se encuentran almacenados localmente en disco para evitar esperas en el acceso por la red. Además, los programas de procesamiento y análisis de esas secuencias también son almacenados en el propio ordenador para automatizar el proceso.

Es por ello que esta asignatura se centra en introducir las nociones básicas que un estudiante de bioinformática debe poseer sobre el manejo del sistema operativo más popular en estas instalaciones (GNU/LINUX), uso de scripts en shell (pequeñas funciones de análisis basadas en herramientas básicas del sistema operativo), el formato de datos típico para la publicación de datos en la red (HTML, PHP) y la gestión de éstos en bases de datos locales (MySQL).

El conocimiento de estos sistemas no impide su combinación durante el resto del curso con resultados preliminares provenientes de aplicaciones ejecutadas en un servidor externo con cualquiera de los navegadores más populares, pues en la combinación de ambos paradigmas (protocolos locales + uso de servidores Web) descansa la mayor parte del éxito de la bioinformática en entornos de investigación en la Biología molecular moderna.

Amunt

Esta asignatura representa el paso introductorio necesario desde el punto de vista técnico para enfrentarse a los siguientes módulos dedicados a la genómica, el análisis de experimentos masivos y la biología estructural.

Amunt

La Bioinformática. Cualquier especialización posterior suele requerir del conocimiento de las técnicas generales mostradas en este curso.

En concreto, los resultados del aprendizaje de esta asignatura pueden resumirse en los siguientes puntos:

  • Conocer el entorno de trabajo del sistema operativo UNIX (Linux, MacOS, etc.)

  • Manejo del terminal de UNIX y de su sistema de ficheros en entornos bioinformáticos

  • Aprender a publicar datos en Internet: páginas HTML

  • Diseñar bases de datos relacionales para gestionar servicios bioinformáticos

Amunt

Formalmente no es necesario disponer de conocimientos previos específicos para cursar esta asignatura. No obstante, el correcto desarrollo de las pruebas de evaluación continua de esta asignatura puede necesitar un esfuerzo adicional para aquellas personas con ninguna o poca experiencia de trabajo en entornos Linux.

Para aquellos estudiantes sin nociones previas de programación es aconsejable cursar también "Programación para la Bioinformática". 

Amunt

No hay restricciones de acceso. Está especialmente aconsejada para perfiles biosanitarios, o para aquellos estudiantes que no tengan ninguna experiencia en el manejo de entornos Linux.

Para aquellos estudiantes sin nociones previas de programación es aconsejable cursar también "Programación para la Bioinformática", donde se ven los conceptos relativos a la programacion de scripts (Perl, Python) para automatizar protocolos de analisis de datos bioinformaticos a gran escala.

Los materiales docentes de esta asignatura se proporcionan únicamente en español. Las actividades docentes así como las intervenciones del Profesor Colaborador se realizarán en catalán y en español.

Amunt

Una vez finalizada esta asignatura, el estudiante debería estar familiarizado con la forma de trabajar en línea de comandos de entornos GNU/LINUX, en especial con aquellos orientados al análisis a gran escala de datos bioinformáticos, mediante la combinación de resultados generados por varios programas. A su vez, la publicación de estos protocolos en forma de servidor y de los resultados almacenados en una base de datos relacional en forma de página web serán también objetivos primarios de esta asignatura.

Más concretamente, son objetivos básicos:

1) Manejo básico del intérprete de comandos de GNU/LINUX

2) Descarga y manipulación de datos bioinformáticos

3) Publicación de datos y servidores en Internet (HTML, PHP y CGI)

4) Almacenamiento de resultados en bases de datos relacionales (MySQL)

Con estos conocimientos, el estudiante debería estar preparado para integrarse en un entorno laboral bioinformático, adaptándose progresivamente después a las particularidades de cada equipo de investigación.

Competencias básicas y generales:

  • Todas las competencias básicas
  • Todas las competencias generales

Competencias transversales:

  • CT2: Capacidad para la comunicación oral y escrita para la vida académica y profesional.
  • CT3: Capacidad para proponer soluciones innovadoras y toma de decisiones.
  • CT5: Capacidad para la comprensión, el análisis y la síntesis.
  • CT6: Capacidad para el diseño y la gesión de proyectos.

Competencias específicas:

  • CE3: Adquirir las habilidades técnicas apropiadas para la bioinformática, como programación, creación y gestión de bases de datos, creación de páginas web, análisis y diseño de algoritmos, y conocer su uso y aplicación en la bioinformática.

Amunt

Los contenidos de la asignatura están organizados en cinco bloques temáticos:

  1. Puesta en marcha de un sistema UNIX sobre una máquina virtual
  2. El terminal en entornos bioinformáticos: comandos básicos, gestión de ficheros y extracción de datos
  3. Creación de páginas web con el lenguaje HTML
  4. Diseño de bases de datos relacionales para la gesión de datos biológicos: tablas, claves y MySQL
  5. El lenguaje PHP para conectar páginas web y bases de datos (Introductorio a la asignatura "Programación para la Bioinformática")

Amunt

Instal·lació de la màquina virtual Audiovisual
Instalación de la máquina virtual Audiovisual
Introducció a la línia d'ordres (CLI) Audiovisual
Introducción a la línea de comandos (CLI) Audiovisual
Primers passos a MySQL Audiovisual
Primeros pasos en MySQL Audiovisual
Introducción al lenguaje HTML Audiovisual
Introducción a CCS Audiovisual
1. Introducción a los entornos de trabajo Gnu/Linux PDF
1. Introducció als entorns de treball UNIX PDF
2. Entornos y contenedores PDF
2. Environments i contenidors PDF
3. Workflows PDF
3. Workflows PDF
4. Gestión de datos PDF
4. Gestió de dades SQL i NoSQL PDF
Herramientas informáticas para la bioinformática Web
Eines informàtiques per a la bioinformàtica Web
MV (64 bits) Software en línea

Amunt

TEMA1: Introducción a los entornos de trabajo UNIX

1.1. Arquitectura de un ordenador
1.2. Funciones de un sistema operativo
1.3. La familia de sistemas operativos UNIX
1.4. Programas y procesos
1.5. El sistema de ficheros
1.6. Funcionamiento de las máquinas virtuales
1.7. Configuración de una máquina virtual con Ubuntu
1.8. El terminal como herramienta de trabajo
1.9. Gestión básica de ficheros
1.10. Acceder al contenido de los ficheros
1.11. Gestión básica de procesos
1.12. Buscar, ordenar y asociar ficheros
1.13. Combinación de comandos
1.14. El lenguaje de procesado de archivos GAWK
1.15. Expresiones regulares: aplicación en el terminal
1.16. Definición de nuevos comandos
1.17. Diseño de protocolos automáticos en el terminal
1.18. Transferencia de ficheros desde el terminal
1.19. Ejemplo práctico 1: Analizando el genoma humano

TEMA 2: Gestión de datos con MySQL 

2.1. Bases de datos relacionales
2.2. El modelo entidad-relación
2.3. SQL y MySQL
2.4. Empezar a trabajar con MySQL
2.5. Crear las primeras tablas
2.6. Poblar tablas con registros
2.7. Consultas básicas en las tablas
2.8. Consultas avanzadas en las tablas: condiciones
2.9. Consultas avanzadas en las tablas: grupos
2.10. Consultas avanzadas en las tablas: múltiples tablas
2.11. Consultas avanzadas en las tablas: subconsultas
2.12. Gestión de la base de datos
2.13. Otras utilidades de MySQL en línea de comandos
2.14. Copias de seguridad con el programa mysqldump
2.15. Ejemplo práctico 2: Manejo del catálogo de genes humanos

TEMA 3: Publicación de datos en Internet

3.1. Fundamentos de comunicación en la Red
3.2. El lenguaje HTML
3.3. Estructura de un documento HTML
3.4. Etiquetas de formato
3.5. Incluir imágenes en los documentos
3.6. Tablas de datos
3.7. Añadir enlaces en HTML
3.8. Formularios web
3.9. Hojas de estilo
3.10. Mapa de caracteres
3.12. Entornos de diseño web multiplataforma
3.13. Ejemplo práctico 3: El genoma humano (I)

TEMA 4: Implementación de servidores en Internet

 4.1. Protocolos bioinformáticos remotos
4.2. Programas pasarela implementados con PHP
4.3. Trabajar con el intérprete de PHP
4.4. El servicio Compare2Genes: formulario HTML
4.5. El servicio Compare2Genes: pasarela PHP
4.6. Conexión entre PHP y bases de datos MySQL
4.7. Ejemplo práctico 4: El genoma humano (II)

 

Es imprescindible para una correcta adquisición de estos conocimientos la práctica exhaustiva en una plataforma UNIX de todos los ejemplos introducidos en estos materiales. La ordenación establecida intenta seguir un orden lógico de forma que cada tema es necesario para profundizar en el tema siguiente de estos materiales.

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente –incluidas las pruebas finales– o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt