Software para el análisis de datos Código:  M0.153    :  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura. Os servirá para planificar la matrícula (consultad si la asignatura se ofrece este semestre en el espacio del Campus Más UOC / La Universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. (El plan docente puede estar sujeto a cambios).

La asignatura de Software para el Análisis de Datos se centra en el aprendizaje y manejo del paquete estadístico R y R-Commander. 

- Paquete estadístico R: El paquete estadístico R uno de los más flexibles y potentes para el tratamiento y análisis de los datos, desde los más elementales a los más avanzados. Este software está desarrollado y mantenido por la comunidad científica internacional. Es, además, un programa gratuito, libre y se descarga de forma fácil y segura.

- R-Commander: R-Comander es una Interfaz Gráfica de Usuario (GUI) del programa R. 

- RStudio: R-Studio es el entorno de desarrollo (IDE) de R.

Amunt

La asignatura introduce al alumno al manejo y uso a nivel principiante y medio del lenguaje de programación R. 

Para ello se introducen tareas sencillas para el manejo de datos estadísticos, la simulación de variables aleatorias en los casos univariantes y multivariantes, la representación gráfica y la programación de tareas estadísticas con R.

Esta asignatura está incluida en el plan de estudios del Máster en Bioinformática y Bioestadística, por lo que los ejemplos y ejercicios se intentará que se enmarquen en el campo de las ciencias de la vida y la salud.

Amunt

Al final de la asignatura, el alumno será capaz de manejar datos univariantes y multivariantes así como el almacenamiento de datos, recuperación y estructuras de datos y las representaciones gráficas de éstos. También a programar funciones de dificultad media con R. 

Además, estará capacitado para simular variables aleatorias, programar diferentes rutinas estadísticas y repasar algunas operaciones algebraicas de uso habitual.

Amunt

No son necesarios conocimientos previos específicos, sólo los generales del curso: comprensión lectora en inglés y conocimientos básicos de Álgebra Lineal y Estadística.

Se deberá tener una base de estadística descriptiva e inferencia y, también, un buen manejo de las herramientas informáticas y conocimiento básico de algún lenguaje de programación. 

Amunt

* Restricciones de acceso: No hay restricciones de acceso

* Recomendaciones de acceso: Idealmente esta asignatura se debería cursar el primer semestre del Máster.

Amunt

Esta asignatura pretende dar a conocer R a nivel intermedio. Como resultado de este aprendizaje, se espera que el estudiantes adquieran las siguientes capacidades: 

  1.  Aprender a usar R como Software Estadístico libre.
  2.  Aprendrer a usar las principales interfícies y IDEs de R (i.g., R Commander, R Studio, etc.)
  3.  Aprender a usar R como lenguaje de programación.
  4.  Aprender a usar las librerias de R asociadas a los contenidos Bio.

En el contexto general del Máster en Bioinformática i Bioestadística, se concreta con las siguientes competencias:

Competencias básicas generales:

  • Todas las competencias básicas del Máster.
  • Todas las competencias generales del Máster. 

Competencias transversales:

  • CT1- Capacidad de iniciativa, automotivación  y trabajo de forma independiente.
  • CT3- Capacidad para proponer soluciones innovadoras y ayuda a la toma de decisiones.
  • CT5- Capacidad para la comprensión, el análisi y la síntesi de conceptos.

 
Competencias especificas:

  • CE2- Adquirir las habilidades técnicas apropiadas para la bioinformáticas, como son la programación, la creación y la gestión de BD.
  • CE3- Conocer los principios básicos de la inferencia estadística y entender su papel fundamental.
  • CE4- Conocer los principales métodos de regresión que sean adecuados a las diferentes tipologías de datos.  
  • CE6- Adquirir la capacidad de manejar, gestionar, interpretar y analizar grandes volumenes de datos usando programario estadístico adecuado como el lenguaje estadístico R.
  • CE8- Conocer las herramientas del programa estadísico adecuados para los diferentes problemas de modelización y análisis de datos.
  • CE13- Conocer los aspectos éticos y legales relacionados con el desarrollo de productos en el ámbito de la Bioestadística.

Amunt

De forma genérica, los contenidos que trabajamos son los siguientes:

  • Instalación y configuración de R, RStudio y R-Commander.
  • Uso de R como herramienta para el análisis de datos en bioinformática y bioestadística.
  • Uso de R como lenguaje de programación en  bioinformática y bioestadística.
  • Principales paquetes (librerías) de R en bioinformática y bioestadística.

Contenidos detallados del curso:

M0. Presentación de la asignatura.

1.  Presentación de la asignatura y aprendizaje de los recursos y entorno del aula virtual.

M1. Introducción al lenguaje de programación R.

1.1. Instalación y entorno de trabajo de R, RStudio y RCommander. 
1.2. Importación y exportación de archivos en R.
1.3. Gestión de paquetes en R.
1.4. Tipos de datos, operadores y estructuras de datos en R.
1.6. Ejercicios relacionados con el tema y/o laboratorios.

M2. Estadística Descriptiva y Gráficos con R.

2.1. Introducción a la estadística descriptiva con R y R-Commander.
2.2. Creación de gráficos con R.
2.3. Tipos de gráficos con R simples y avanzados.
2.4. Funciones gráficas de R.
2.5. Ejercicios relacionados con el tema y/o laboratorios.

M3. Programación en R.

3.1. Expresiones condicionales en R.
3.2. Bucles en R.
3.3. Funciones en R.
3.4. Ejercicios relacionados con el tema y/o laboratorios.

M4. Simulación con R.

4.1. Probabilidad y juego.
4.2. Distribuciones de probabilidad.
4.3. Generación de números pseudoaleatorios y aleatorios en R

4.4. Simulación y combinatoria con R y RCommander.
4.5. Ejercicios relacionados con el tema y/o laboratorios.

M5. Modelos de análisis de datos y machine learning con R

5.1. Modelos de regresión lineal y múltiple en R.
5.2. Análisis de la varianza en R.
5.3. Técnicas de clustering en R.
5.4. Ejercicios relacionados con el tema y/o laboratorios.

M6. Investigación Reproducible

6.1. Estructurar y organizar los datos en los articulos y los laboratorios.
6.2. Markdowm y Shiny: aplicaciones web con RStudio.
6.3. Gráficos dinámicos.
6.4. Ejercicios relacionados con el tema y/o laboratorios.  

Amunt

0. Uso de los laboratorios en software para el análisis de datos PDF
1. Introducción al lenguaje R PDF
3. Programación en R PDF
5. Modelos de análisis de datos y machine learning con R PDF
4. Simulación con R y R Commander PDF
6. Aplicaciones con R y RStudio PDF
2. Estadística descriptiva y gráficos con R y R Commander PDF

Amunt

Materiales básicos:

W. J. Braun, D. J. Murdoch. A First Course in Statistical Programming with R (e-book).

J. Abedin. Data Manipulation with R.

Crawley, M (2009). The R Book.

Materiales complementarios:

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010). Biostatistical Design and Analysis Using R: A Practical Guide.

H. Wickham, G. Grolemund (2017). R for data science.

Estos recursos de aprendizaje están disponibles en la biblioteca de la UOC.  En el Tablón del aula y en los documentos correspondientes a los laboratorios (LAB) se referenciaran otros recursos de interés.

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente –incluidas las pruebas finales– o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

Amunt

Esta asignatura solo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt