Software para el análisis de datos Código:  M0.153    :  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los materiales de los que dispone la asignatura   Materiales y herramientas de apoyo   Informaciones sobre la evaluación a la UOC   Consulta del modelo de evaluación  
ATENCIÓN: Esta información recoge los apartados del plan docente de la asignatura durante el último semestre con docencia. Al iniciar el periodo de matrícula, podrás consultar el calendario y modelo de evaluación para el siguiente semestre en Secretaría/ Matrícula / Horarios pruebas de evaluación final.

La asignatura de Software para el Análisis de Datos se centra en el aprendizaje y manejo del paquete estadístico R.

- Paquete estadístico R: El paquete estadístico R es uno de los más flexibles y potentes para el tratamiento y análisis de los datos, desde los más elementales a los más avanzados. Este software está desarrollado y mantenido por la comunidad científica internacional. Es, además, un programa gratuito, libre y se descarga de forma fácil y segura.

- R-Commander: Es una Interfaz Gráfica de Usuario (GUI). 

- RStudio: Entorno de desarrollo (IDE) de R.

Amunt

La asignatura introduce al alumno al manejo y uso a nivel principiante/medio del paquete R.

Para ello se introducen tareas sencillas para el manejo de datos estadísticos, la simulación de variables aleatorias en los casos univariantes y multivariantes, el manejo de bases de datos, la representación gráfica y la programación de tareas estadísticas con el lenguaje de programación incluido en R.

Esta asignatura está incluida en el plan de estudios del Máster en Bioinformática y Bioestadística, por lo que los ejemplos y ejercicios se intentará que se enmarquen en el campo de las ciencias de la vida y la salud.

Amunt

Al final de l'assignatura, el alumno será capaz de manejar datos univariantes y multivariantes así como el almacenamiento de datos, recuperación y estructuras de datos y las representaciones gráficas de estos.

Además, estará capacitado para simular variables aleatorias, programar diferentes rutinas estadísticas y repasar algunas operaciones algebraicas de uso habitual.

Amunt

No son necesarios conocimientos previos específicos. Sólo los generales del curso: comprensión lectora en inglés y conocimientos básicos de Álgebra Lineal. 

Amunt

* Restricciones de acceso: No hay restricciones de acceso

* Recomendaciones de acceso: Idealmentese debería cursar el primer semestre del Máster.

Amunt

Esta asignatura pretende dar a conocer R a nivel intermedio. Com a resultado de este aprendizaje, se espera que el estudiantes adquiera las siguientes capacidades: 

  1.  Aprender a usar R como Software Estadístico Avanzado y Libre.
  2.  Aprendre a usar las principales interfícies y IDEs de R (i.g., R Commander, R Studio, etc.)
  3.  Aprender a usar R como lenguaje de programación.
  4.  Aprender a usar las librerias de R asociados a los contenidos Bio.

En el contexto general del Máster en Bioinformática i Bioestadística, se concreta con las siguientes competencias:

Competencias básicas generales:

  • Todas las competencias básicas del Máster.
  • Todas las competencias generales del Máster. 

Competencias transversales:

  • CT1- Capacidad de iniciativa, automotivación  y trabajo de forma independiente.
  • CT3- Capacidad para proponer soluciones innovadoras y ayuda a la toma de decisiones.
  • CT5- Capacidad para la comprensión, el análisi y la síntesi de conceptos.

 
Competencias especificas:

  • CE2- Adquirir las habilidades técnicas apropiadas para la bioinformáticas, como son la programación, la creación y la gestión de BD.
  • CE3- Conocer los principios básicos de la inferencia estadística y entender su papel fundamental.
  • CE4- Conocer los principales métodos de regresión que sean adecuados a las diferentes tipologías de datos.  
  • CE6- Adquirir la capacidad de manejar, gestionar, interpretar y analizar grandes volumenes de datos usando programario estadístico adecuado como el lenguaje estadístico R.
  • CE8- Conocer las herramientas del programa estadísico adecuados para los diferentes problemas de modelización y análisis de datos.
  • CE13- Conocer los aspectos éticos y legales relacionados con el desarrollo de productos en el ámbito de la Bioestadística.

Amunt

De forma genérica, los contenidos que trabajamos son los siguientes:

  • Instalación y configuración de R, RStudio y R-Commander.
  • Uso de R como herramienta para el análisis de datos en bioinformática y bioestadística.
  • Uso de R como lenguaje de programación en  bioinformàtica y bioestadística.
  • Principales paquetes (librerías) de R en bioinformática y bioestadística.

Contenidos detallados del curso:

0. Presentación de la asignatura.

1.1. Descarga, instalación y entorno de trabajo en R.
1.2. Entorno R-Commander.
1.3. Entorno de R-Studio.
 

1. El Lenguaje R.

1.1. Conceptos básicos con R.
1.2. Tipos de variables con R.
1.3. Funciones con R.
1.4. Vectores y operadores lógicos.
1.5. Data input & output.
1.6. Ejercicios relacionados con el tema y laboratorios.

2. Estadística Descriptiva y Gráficos con R.

2.1. Estadística Descriptiva con R y R-Commander.
2.2. Crear gráficos con R.
2.3. Tipos de gráficos con R.
2.4. Funciones gráficas.
2.5. Ejercicios relacionados con el tema y Laboratorios.

3. Programación con R

3.1. Manejo de ficheros más complejos. 
3.2. Creación de funciones con R.
3.3. Programación eficiente.
3.4. Funciones propias de R.
3.5. Ejercicios relacionados con el tema y Laboratorios. 

4. Simulación con R

  4.1. Simulación de Montecarlo.
  4.2. Generación de Números aleatorios y pseudoaleatorios.
  4.3. Muestras y simulación de distribuciones conocidas.
  4.4. Ejercicios relacionados con el tema y Laboratorios.

5. Modelización con R-Commander Regresión Lineal y Múltiple

5.1. Modelos.
5.2. Inferencia.
5.3. Diagnosis.
5.4. Intervalos de Confianza.
5.5. Ejercicios relacionados con el tema y Laboratorios.

6. Investigación Reproducible

          6.1. Estructurar y organizar los datos en investigaciones.
          6.2. Markdown y R Markdown.
          6.3. Knitr y RStudio.
          6.4. Ejercicios relacionados con el tema y Laboratorios.

Amunt

Statistical Software Web
Statistical Software PDF

Amunt

Materiales básicos:

A First Course in Statistical Programming with R (e-book).


Materiales complementarios:

Crawley, M (2009). The R Book.

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010): Biostatistical Design and Analysis Using R: A Practical Guide.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

Amunt

Esta asignatura sólo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt