Software para el análisis de datos Código:  M0.153    Créditos:  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los materiales que dispone la asignatura   Materiales y herramientas de apoyo   Bibliografía y fuentes de información   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua   Feedback  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

La asignatura de Software para el Análisis de Datos se centra en el aprendizaje y manejo del paquete estadístico R.

- Paquete estadístico R: El paquete estadístico R es uno de los más flexibles y potentes para el tratamiento y análisis de los datos, desde los más elementales a los más avanzados. Este software está desarrollado y mantenido por la comunidad científica internacional. Es, además, un programa gratuito, libre y se descarga de forma fácil y segura.

- R-Commander: Es una Interfaz Gráfica de Usuario (GUI). 

- RStudio: Entorno de desarrollo (IDE) de R.

Amunt

La asignatura introduce al alumno al manejo y uso a nivel principiante/medio del paquete R.

Para ello se introducen tareas sencillas para el manejo de datos estadísticos, la simulación de variables aleatorias en los casos univariantes y multivariantes, el manejo de bases de datos, la representación gráfica y la programación de tareas estadísticas con el lenguaje de programación incluido en R.

Esta asignatura está incluida en el plan de estudios del Máster en Bioinformática y Bioestadística, por lo que los ejemplos y ejercicios se intentará que se enmarquen en el campo de las ciencias de la vida y la salud.

Amunt

Al final de l'assignatura, el alumno será capaz de manejar datos univariantes y multivariantes así como el almacenamiento de datos, recuperación y estructuras de datos y las representaciones gráficas de estos.

Además, estará capacitado para simular variables aleatorias, programar diferentes rutinas estadísticas y repasar algunas operaciones algebraicas de uso habitual.

Amunt

No son necesarios conocimientos previos específicos. Sólo los generales del curso: comprensión lectora en inglés y conocimientos básicos de Álgebra Lineal. 

Amunt

* Restricciones de acceso: No hay restricciones de acceso

* Recomendaciones de acceso: Idealmentese debería cursar el primer semestre del Máster.

Amunt

Esta asignatura pretende dar a conocer R a nivel intermedio. Com a resultado de este aprendizaje, se espera que el estudiantes adquiera las siguientes capacidades: 

  1.  Aprender a usar R como Software Estadístico Avanzado y Libre.
  2.  Aprendre a usar las principales interfícies y IDEs de R (i.g., R Commander, R Studio, etc.)
  3.  Aprender a usar R como lenguaje de programación.
  4.  Aprender a usar las librerias de R asociados a los contenidos Bio.

En el contexto general del Máster en Bioinformática i Bioestadística, se concreta con las siguientes competencias:

Competencias básicas generales:

  • Todas las competencias básicas del Máster.
  • Todas las competencias generales del Máster. 

Competencias transversales:

  • CT1- Capacidad de iniciativa, automotivación  y trabajo de forma independiente.
  • CT3- Capacidad para proponer soluciones innovadoras y ayuda a la toma de decisiones.
  • CT5- Capacidad para la comprensión, el análisi y la síntesi de conceptos.

 
Competencias especificas:

  • CE2- Adquirir las habilidades técnicas apropiadas para la bioinformáticas, como son la programación, la creación y la gestión de BD.
  • CE3- Conocer los principios básicos de la inferencia estadística y entender su papel fundamental.
  • CE4- Conocer los principales métodos de regresión que sean adecuados a las diferentes tipologías de datos.  
  • CE6- Adquirir la capacidad de manejar, gestionar, interpretar y analizar grandes volumenes de datos usando programario estadístico adecuado como el lenguaje estadístico R.
  • CE8- Conocer las herramientas del programa estadísico adecuados para los diferentes problemas de modelización y análisis de datos.
  • CE13- Conocer los aspectos éticos y legales relacionados con el desarrollo de productos en el ámbito de la Bioestadística.

Amunt

De forma genérica, los contenidos que trabajamos son los siguientes:

  • Instalación y configuración de R, RStudio y R-Commander.
  • Uso de R como herramienta para el análisis de datos en bioinformática y bioestadística.
  • Uso de R como lenguaje de programación en  bioinformàtica y bioestadística.
  • Principales paquetes (librerías) de R en bioinformática y bioestadística.

Contenidos detallados del curso:

0. Presentación de la asignatura.

1.1. Descarga, instalación y entorno de trabajo en R.
1.2. Entorno R-Commander.
1.3. Entorno de R-Studio.
 

1. El Lenguaje R.

1.1. Conceptos básicos con R.
1.2. Tipos de variables con R.
1.3. Funciones con R.
1.4. Vectores y operadores lógicos.
1.5. Data input & output.
1.6. Ejercicios relacionados con el tema y laboratorios.

2. Estadística Descriptiva y Gráficos con R.

2.1. Estadística Descriptiva con R y R-Commander.
2.2. Crear gráficos con R.
2.3. Tipos de gráficos con R.
2.4. Funciones gráficas.
2.5. Ejercicios relacionados con el tema y Laboratorios.

3. Programación con R

3.1. Manejo de ficheros más complejos. 
3.2. Creación de funciones con R.
3.3. Programación eficiente.
3.4. Funciones propias de R.
3.5. Ejercicios relacionados con el tema y Laboratorios. 

4. Simulación con R

  4.1. Simulación de Montecarlo.
  4.2. Generación de Números aleatorios y pseudoaleatorios.
  4.3. Muestras y simulación de distribuciones conocidas.
  4.4. Ejercicios relacionados con el tema y Laboratorios.

5. Modelización con R-Commander Regresión Lineal y Múltiple

5.1. Modelos.
5.2. Inferencia.
5.3. Diagnosis.
5.4. Intervalos de Confianza.
5.5. Ejercicios relacionados con el tema y Laboratorios.

6. Investigación Reproducible

          6.1. Estructurar y organizar los datos en investigaciones.
          6.2. Markdown y R Markdown.
          6.3. Knitr y RStudio.
          6.4. Ejercicios relacionados con el tema y Laboratorios.

Amunt

Material Soporte
Introducción al lenguaje R, Rstudio y R Markdown PDF
Introducció al llenguatge R, RStudio y R Markdown PDF
Estadística descriptiva y gráficos con R PDF
Estadística descriptiva i gràfics amb R PDF
Fundamentos de programación y acceso a base de datos en R PDF
Fonaments de programació i accés a base de dades en R PDF
Probabilidad y simulación con R PDF
Probabilitat i simulació amb R PDF
Introducción al machine learning con R PDF
Introducció al machine learning amb R PDF
Paquetes de R para la bioinformática PDF
Paquets de R per a la bioinformàtica PDF

Amunt

Materiales básicos:

A First Course in Statistical Programming with R (e-book).


Materiales complementarios:

Crawley, M (2009). The R Book.

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010): Biostatistical Design and Analysis Using R: A Practical Guide.

Amunt

  • The R Book. M, Crawley. Ed. Wiley.
  • The Comprehensive R Archive. The R Manuals: https://cran.r-project.org/
  • Applied Statistics for Bioinformatics using R. The R Manuals.
  • R para principiantes. The R Manuals.

 

Amunt

Para cada tema se suministrará una guía de estudio (GES) donde se señalarán los materiales de lectura correspondientes a la unidad en curso, con indicaciones sobre qué puntos del material se corresponden con cada punto del tema y con qué detalle deben tratarse. Los materiales de lectura pueden consistir en capítulos o apartados del material docente de Bioinformática o Bioestadística de la UOC o bien en tutoriales, manuales o artículos que se proporcionaran en formato PDF o bien en forma de hiperenlaces.  La lectura del material didáctico siguiendo las orientaciones de la guía conforma la primera actividad de cada bloque y que deberá realizar el estudiante de forma individual. Con ello se pretende que el estudiante se familiarice con el contenido de la materia así como con el material en sí mismo, el cual se transformará en material de consulta para el estudiante durante el desarrollo del módulo. Lógicamente esta actividad se debe desarrollar en los primeros días del bloque, para poder abordar posteriormente el debate y la PEC.

DEBATE: El debate debe ser el foro donde se ponga de manifiesto la comprensión de los aspectos centrales del tema o las dificultades que éste conlleva. Para ello se trataran tanto aspectos conceptuales como prácticos a fin de trabajar conceptos y habilidades fundamentales como es la resolución de problemas o el análisis de datos utilizando las herramientas aprendidas en la parte de software estadístico.

PEC: A lo largo de la asignatura deberán resolverse una serie de PECs. Las PECs pueden combinar ambos objetivos, es decir, desarrollar conceptos y habilidades, y serán equivalentes a escala a pequeños proyectos de análisis de datos.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

La UOC habilitará los mecanismos que considere oportunos para velar por la calidad de sus titulaciones y garantizar la excelencia y la calidad de su modelo educativo.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

Para superar esta asignatura el estudiantes deberá: 


Realizar en el plazo estipulado las PECs propuestas por el consultor.


En la califiación  final cada PEC tendrá el mismo peso. Se valorará:

- Solución de los problemas planteados.

- Comprensión y relación de los conceptos aprendidos.

- Capacidad de presentación y redacción de los conceptos y análisis contenidas en las pruebas de evaluación. 

- Dominio de la argumentación on-line com a mecanismo de confrontación y creación de conocimiento, demostrada a través de la participación en el Aula.

 

Soluciones de las PEC:


- Las soluciones de las PEC se facilitaran conjuntamente a la publicación de la nota obtenida en la PEC.  

- La idea es presentar como solución una propuesta con respuestas completas y alguna propuesta de resolución de algun estudiante.

Amunt

El feedback con la tutora será a traves de mensajes en el Foro o por correo electrónico privado a su dirección de correo de la UOC. 

Amunt